Gitee AI 上线,不但支持 Qwen2.5-72B-Instruct 这样的文本模型,还支持 whisper-large 、ChatTTS 等一众语音模型,最主要每天还有 100 次免费调用额度,我日常使用是足够了,不知道是不是以后一直都有这个活动。
马上动手把 Gitee AI 整合到自己开发的Local Agents中。下面就看看用 Gitee AI 的效果如何
加入模型支持
由于兼容 OpenAI ,我三下五除二就搞定了,其中最花时间的是居然是修改 Gitee AI 的 svg 图标??,由于是新产品,网上没有现成的,只有自己动手了(时间花在临时学 svg ,这个 AI 真干不好)。
文本模型
来看看效果,首先看看 Qwen2.5-72B-Instruct ,现在 Gitee AI 正在做活动,每天都有 100 次免费调用机会,我试了一下,和我的刚刚购买的付费 KEY 的效果是一致的。
来看看 Qwen2.5-72B-Instruct 的代码能力如何,要求他设计个视频查看的界面,看上去还不错,我 5 秒钟可写不出来。
语音识别
看看语音识别功能,由于兼容 OpenAI ,我也一会儿就整合了进来,用前几天的例子,看看尹卡卡说了啥
如上图:我用 Gitee AI 的 whisper-large 做了语音识别,并用 Qwen2.5-72B-Instruct 进行翻译工作,相当的顺利,由于用的还是免费额度,这是相当的爽了。
可惜美中不足是目前 whisper-large 尚不支持 response\_format 参数,无法生成 verbose\_json 格式(每句话携带 start 、end 的时间戳),这样就没办法制作精准字幕了,强烈希望 Gitee AI 能支持这一功能。
语音合成
再来把尹卡卡的讲话再转为播客,反正每天的免费额度不用白不用,ChatTTS 、Fish Speech 、CosyVoice 、speecht5_tts 每个模型都试试。
每个模型都测试了一下
- ChatTTS 语音生动
- Fish Speech 、CosyVoice 语音品质高,Fish Speech 的语调变化更丰富一些
- speecht5_tts 我就不评论了,免费的时候大家可以用一下
当然听感这个东西很主观,大家有兴趣可以自己评估一下。
总结
Gitee AI 相比同类竞品来说文档齐全,简洁易用,我整个整合过程没有超过一小时,美中不足有 2 点,
- 有部分模型的特色参数支持的还不完善,这个上面我已经提到了。
- 模型库里面没有多模态的模型(也可能是我没看见)。
**粗体** _斜体_ [链接](http://example.com) `代码` - 列表 > 引用
。你还可以使用@
来通知其他用户。