Wear OS 获得全新、更高效的文本转语音引擎

Google推出新的Wear OS文本转语音引擎

Google近日宣布为其智能手表和其他可穿戴设备操作系统Wear OS推出了一款新的文本转语音(Text-to-Speech, TTS)引擎。该引擎支持超过50种语言,并且由于使用了更小的机器学习(ML)模型,其速度比前代产品更快。

主要特点与优势

  1. 低内存设备优化:新引擎特别针对低内存设备设计,适用于可穿戴设备上最常见的服务,如无障碍服务、运动应用、导航提示和朗读应用。
  2. 多语言支持:该引擎能够将文本转换为自然语音,支持超过50种语言,得益于Google的机器学习技术。
  3. 更高效的模型:新引擎使用了更小、更高效的韵律ML模型,从而在Wear OS设备上实现更快的语音合成。

开发者注意事项

  1. API兼容性:新引擎并未引入新的API来合成语音,开发者可以继续使用现有的speak方法以及其他此前可用的方法。
  2. 初始化时间:新引擎在应用初始化时大约需要10秒的准备时间。因此,开发者应在应用启动后尽快初始化引擎,通过调用TextToSpeech(applicationContext, callback)并在回调中合成所需文本。
  3. 语言选择:新引擎可能会合成与用户首选语言不同的语音。例如,在发送紧急呼叫时,引擎可能会优先使用用户实际所在地区的语言,而不是用户选择的界面语言。

系统要求

新文本转语音引擎适用于运行Wear OS 4(去年7月发布)或更高版本的设备。

其他相关服务

除了文本转语音合成,Wear OS还通过SpeechRecognizer API提供了语音识别服务。然而,该服务不适合连续识别,因为它依赖于远程服务。

阅读 22
0 条评论