Google Cloud推出文档翻译功能
Google Cloud最近宣布了Translation API Advanced的新功能——Document Translation的正式发布。该功能允许在翻译过程中保留文档的格式。
主要功能与优势
- 保留文档格式:传统的文档翻译需要将文本与布局属性分离,导致文档结构丢失或需要重新创建。而Document Translation可以在翻译过程中保留文档的格式。
- 实时同步处理:支持对单个文件进行实时、同步处理,尤其适用于小型文件的快速翻译。
- 批量翻译:允许用户在一次请求中翻译多个文件到多种语言。
- 广泛的语言支持:支持超过100种语言,并支持Docx、PPTx、XLSx和PDF等格式。
- PDF格式增强:新增对从右到左语言的支持,保留PDF的字体大小、字体颜色、字体样式和超链接。
- 欧盟数据存储:引入了可配置的端点,以在欧盟存储机器翻译处理数据。
翻译方法
为了提高翻译准确性,Document Translation支持四种翻译方法:
- Google的最先进翻译模型:使用Google的最新翻译技术。
- 术语表导入:用户可以导入特定术语和短语的术语表,定义首选翻译。
- 预训练模型:选择预训练的翻译模型。
- 自定义模型:使用AutoML构建自定义翻译模型。
竞争环境
Google并非唯一提供文档翻译API的云服务提供商。Microsoft Translator和AWS的Amazon Translate也提供了类似的功能。
质疑与讨论
Rafael Quevedo对新的API的准确性提出了质疑,认为翻译质量可能受到设计团队的多样性影响,特别是在处理旧式电视短语或俚语时。
定价
Cloud Translation的收费基于处理文本的数量,起价为每百万字符20美元。高级API调用如detectLanguage、translateText、batchTranslateText、translateDocument和batchTranslateDocument会额外收费。例如,TranslateDocument每页处理费用为0.08美元。
最佳实践
Google的客户工程师Tristan Li和Wayne Davis在最佳实践文章中强调了使用Translation API翻译网站时的四个最佳实践。
**粗体** _斜体_ [链接](http://example.com) `代码` - 列表 > 引用
。你还可以使用@
来通知其他用户。