谷歌文档翻译现已全面开放

Google Cloud推出文档翻译功能

Google Cloud最近宣布了Translation API Advanced的新功能——Document Translation的正式发布。该功能允许在翻译过程中保留文档的格式。

主要功能与优势

  1. 保留文档格式:传统的文档翻译需要将文本与布局属性分离,导致文档结构丢失或需要重新创建。而Document Translation可以在翻译过程中保留文档的格式。
  2. 实时同步处理:支持对单个文件进行实时、同步处理,尤其适用于小型文件的快速翻译。
  3. 批量翻译:允许用户在一次请求中翻译多个文件到多种语言。
  4. 广泛的语言支持:支持超过100种语言,并支持Docx、PPTx、XLSx和PDF等格式。
  5. PDF格式增强:新增对从右到左语言的支持,保留PDF的字体大小、字体颜色、字体样式和超链接。
  6. 欧盟数据存储:引入了可配置的端点,以在欧盟存储机器翻译处理数据。

翻译方法

为了提高翻译准确性,Document Translation支持四种翻译方法:

  1. Google的最先进翻译模型:使用Google的最新翻译技术。
  2. 术语表导入:用户可以导入特定术语和短语的术语表,定义首选翻译。
  3. 预训练模型:选择预训练的翻译模型。
  4. 自定义模型:使用AutoML构建自定义翻译模型。

竞争环境

Google并非唯一提供文档翻译API的云服务提供商。Microsoft Translator和AWS的Amazon Translate也提供了类似的功能。

质疑与讨论

Rafael Quevedo对新的API的准确性提出了质疑,认为翻译质量可能受到设计团队的多样性影响,特别是在处理旧式电视短语或俚语时。

定价

Cloud Translation的收费基于处理文本的数量,起价为每百万字符20美元。高级API调用如detectLanguage、translateText、batchTranslateText、translateDocument和batchTranslateDocument会额外收费。例如,TranslateDocument每页处理费用为0.08美元。

最佳实践

Google的客户工程师Tristan Li和Wayne Davis在最佳实践文章中强调了使用Translation API翻译网站时的四个最佳实践。

阅读 39
0 条评论