流水線的中段對所有格式都是通用的。只有首尾兩個階段——解析和重建——會隨檔案是 PDF、Word、投影片還是掃描件而不同。
偵測檔案類型,把每個文字區塊連同其位置和樣式提取成結構化映射。
在翻譯開始前,把你的情境和術語表詞條與每個文字區塊進行匹配。
前沿大型語言模型在上下文中逐塊翻譯,並保持行內格式標記完好。
把譯文放回原始版面,忠實地重新組裝檔案。
並排比對原文和譯文,然後匯出成品文件。
結構優先。TransQ 記錄每個文字區塊的位置和樣式,只替換文字,再圍繞它們重建原件。譯文回來時,看起來就和你最初的文件一樣。
在專業領域,翻譯品質成敗全在術語。選擇一個情境或上傳你自己的術語表,TransQ 會把這些術語譯法注入模型,事後再校驗——讓同一個術語從頭到尾都譯得一致。
每次翻譯都附帶並排預覽:左邊原文、右邊譯文,呈現在文件真實的版面裡。完整審閱後,只有當你準備好下載成品檔案時才付費。
經過 TransQ 的內容大多是敏感的。這條流水線在設計上確保檔案加密、存取受控,而且你的內容絕不用於訓練模型。