星际争霸:母巢之战韩语翻译

2024 年末工作放缓时,作者将精力转向爱好星际争霸:母巢之战(BW)。BW 是 98 年的经典竞技 RTS 游戏,至今仍有活跃社区。在那几周,作者利用大语言模型和免费软件解决了 BW 社区数十年的问题。

文化背景

BW 本质上是韩国游戏,专业玩家、团队、赛事及大部分观众和社区都在韩国,非韩国成员称自己为“外国人”。BW 像国际象棋一样是策略游戏,研究游戏与玩游戏同样重要,现代很多讨论在专业玩家的视频和直播中。就像国际象棋的开局术语是社区发展的语言,BW 也有类似的“12 自然开局”等术语,这导致了“外国人知识问题”。

外国人知识问题

外国社区成员很少懂韩语,获取韩语 BW 内容困难,只能依靠翻译字幕或机器翻译,但机器翻译不适合专业术语,导致翻译质量差,使外国社区几十年来落后于韩国社区。

新翻译过程

作者利用新的机器翻译过程取得显著效果,翻译更合理清晰,信号噪声比大幅降低,如将一段韩语视频教程翻译为更易理解的内容,一天内翻译约 7 个视频。

技术栈

翻译过程分为制作和消费字幕两部分。制作字幕时,先用 yt-dlp 下载视频音频轨道,再用 Whisper 转录字幕,最初本地运行 Whisper 受限,后利用 Google Colab 免费 GPU 运行。利用 TeamLiquid 成员创建的“BW 俚语字典”结合 LLM 进行翻译。消费字幕时,通过 TamperMonkey 编写用户脚本添加按钮下载翻译字幕并在 YouTube 播放器下显示,利用 Pastebin 分享字幕,Google Sheets + Apps Script 构建数据库和 web 服务器。

改进

项目仍有改进空间,如支持多种语言的用户脚本,优化 BWKT 客户端显示字幕的逻辑等。

测试

作者邀请其他 BW 爱好者测试翻译字幕,在观看 13 分钟视频过程中,大家忘记测试目的,说明字幕通过测试。

最终思考

项目性能、规模等不是关键,自定义业务逻辑短且易维护,web 服务器简单,是最粗糙但作者喜欢的项目。

阅读 9
0 条评论