流水线的中段对所有格式都是通用的。只有首尾两个阶段——解析和重建——会随文件是 PDF、Word、幻灯片还是扫描件而不同。
检测文件类型,把每个文本块连同其位置和样式提取成结构化映射。
在翻译开始前,把你的场景和术语表词条与每个文本块进行匹配。
前沿大语言模型在上下文中逐块翻译,并保持行内格式标记完好。
把译文放回原始版式,忠实地重新组装文件。
并排比对原文和译文,然后导出成品文档。
结构优先。TransQ 记录每个文本块的位置和样式,只替换文字,再围绕它们重建原件。译文回来时,看起来就和你最初的文档一样。
在专业领域,翻译质量成败全在术语。选择一个场景或上传你自己的术语表,TransQ 会把这些术语译法注入模型,事后再校验——让同一个术语从头到尾都译得一致。
每次翻译都附带并排预览:左边原文、右边译文,呈现在文档真实的版式里。完整审阅后,只有当你准备好下载成品文件时才付费。
经过 TransQ 的内容大多是敏感的。这条流水线在设计上确保文件加密、访问受控,而且你的内容绝不用于训练模型。