主要观点:作者在创作自己的 NYT 拼图“Connections”后,接着制作迷你填字游戏,重点介绍了美国填字游戏的规则、构建填字游戏的过程(包括填充网格、优化回溯算法、创建德语词表等)、写填字游戏线索(包括解析不同格式的谜题、分析线索数据集等)以及尝试让语言模型生成线索,最后将所有元素整合创建了一个完全由计算机生成的填字游戏。
关键信息:
- 美国填字游戏规则:每个方块都要在横纵单词中,黑色方块需对称,纽约时报填字游戏有特定规则。
- 构建填字游戏:先找“主”条目,填充空格困难,可借助在线工具或软件,利用计分词表和回溯算法填充网格,优化算法可提高效率。
- 创建德语词表:找到完整德语词列表,过滤掉含数字等词,根据词的常见程度评分。
- 写填字游戏线索:解析不同格式谜题,分析线索数据集(如填充词使用情况、线索随时间变化、线索难度分析等),尝试让语言模型生成线索但效果不佳。
- 整合创建填字游戏:将所有元素整合,创建了一个完全由计算机生成的填字游戏并提供游玩或打印链接。
重要细节:
- 计分词表中不同词有不同分数,如“APEXPREDATOR”分数为 100,“AES”为 11。
- 回溯算法通过逐个填充单词,遇到死胡同时回溯,作者用 Python 实现但速度慢。
- 构建德语词表时使用 aspell 字典,过滤和转换后去除长词。
- 分析线索数据集时发现一些有趣现象,如常用词“ERA”的线索变化,新单词的出现等。
- 用语言模型生成线索时,模型大多忽略指令,“Tennis legend Arthur”频繁出现。
- 最后创建的计算机生成填字游戏可游玩或打印。
**粗体** _斜体_ [链接](http://example.com) `代码` - 列表 > 引用
。你还可以使用@
来通知其他用户。