パイプラインの中間部分は、すべての形式で共通です。最初と最後のステージ——解析と再構築——だけが、PDF か Word かスライドかスキャンかによって変わります。
ファイル種別を検出し、各テキストブロックを位置とスタイルとともに構造化マップに抽出します。
翻訳が始まる前に、シーンと用語集の用語を各ブロックと照合します。
最先端 LLM が文脈の中で各ブロックを翻訳し、インライン書式のマーカーを保ちます。
訳文を元のレイアウトに戻し、ファイルを忠実に組み直します。
原文と訳文を並べて比較し、完成した文書を書き出します。
まず構造から。TransQ は各ブロックの位置とスタイルを記録し、言葉だけを差し替えて、その周りに原本を再構築します。訳文は、最初の文書とそっくりの見た目で戻ってきます。
専門分野では、翻訳の品質は用語で決まります。シーンを選ぶか独自の用語集をアップロードすると、TransQ はその訳語をモデルに注入し、後で検証します——同じ用語が最初から最後まで同じように訳されるように。
どの翻訳にも対訳プレビューが付きます:左に原文、右に訳文を、文書の実際のレイアウトで。全文を確認し、完成ファイルをダウンロードする準備ができたときだけ支払います。
TransQ を通るものの多くは機微な情報です。このパイプラインは、ファイルが暗号化され、アクセスが制御され、コンテンツがモデルの学習に使われないように設計されています。