Wear OS 获得全新、更高效的文本转语音引擎 - SegmentFault 思否

Wear OS 获得全新、更高效的文本转语音引擎

发布于 2024-03-18

Google推出新的Wear OS文本转语音引擎

Google近日宣布为其智能手表和其他可穿戴设备操作系统Wear OS推出了一款新的文本转语音（Text-to-Speech, TTS）引擎。该引擎支持超过50种语言，并且由于使用了更小的机器学习（ML）模型，其速度比前代产品更快。

主要特点与优势

低内存设备优化：新引擎特别针对低内存设备设计，适用于可穿戴设备上最常见的服务，如无障碍服务、运动应用、导航提示和朗读应用。
多语言支持：该引擎能够将文本转换为自然语音，支持超过50种语言，得益于Google的机器学习技术。
更高效的模型：新引擎使用了更小、更高效的韵律ML模型，从而在Wear OS设备上实现更快的语音合成。

开发者注意事项

API兼容性：新引擎并未引入新的API来合成语音，开发者可以继续使用现有的speak方法以及其他此前可用的方法。
初始化时间：新引擎在应用初始化时大约需要10秒的准备时间。因此，开发者应在应用启动后尽快初始化引擎，通过调用TextToSpeech(applicationContext, callback)并在回调中合成所需文本。
语言选择：新引擎可能会合成与用户首选语言不同的语音。例如，在发送紧急呼叫时，引擎可能会优先使用用户实际所在地区的语言，而不是用户选择的界面语言。

系统要求

新文本转语音引擎适用于运行Wear OS 4（去年7月发布）或更高版本的设备。

其他相关服务

除了文本转语音合成，Wear OS还通过SpeechRecognizer API提供了语音识别服务。然而，该服务不适合连续识别，因为它依赖于远程服务。

Wear OS Gets New, More Efficient Text-to-Speech Engine

https://www.infoq.com/news/2024/03/wear-os-new-text-to-speech/

阅读 34

0 条评论

评论支持部分 Markdown 语法：**粗体** _斜体_ [链接](http://example.com) `代码` - 列表 > 引用。你还可以使用 @ 来通知其他用户。