《AI之矛》（1）【数独Agent】

Github仓库地址

学习是为了寻找解决问题的答案，若脱离了问题只为知晓而进行的打call，那么随时间流逝所沉淀下来的，估计就只有“重在参与”的虚幻存在感了，自学的人就更应善于发现可供解决的问题。为了入门AI，定个小目标，解决数独问题。

一、问题描述

图片描述

一个9*9的方格中，部分方格已预先填入数字，目的是按照如下规则将空白方格填上1-9中的一个：

每个方格中填且仅填一个数字，数字取值范围1-9
以每行九个方格为单元来看，1-9每个数字都要出现，且仅出现一次
以每列九个方格为单元来看，1-9每个数字都要出现，且仅出现一次
以3*3九个方格为单元来看，1-9每个数字都要出现，且仅出现一次

描述问题是解决问题的第一步（将问题转化为程序所能理解的数据模型，才能做进一步有效地思考）

1.1 问题记录方式

从左到右从上到下，以一个字符串的方式记下所有方格中的内容，有数字记数字，空白记作点（.），如：..3.2.6..9..3.5..1..18.64....81.29..7.......8..67.82....26.95..8..2.3..9..5.1.3..
以字典的方式记录，将每行标记为ABCDEFGHI，每列标记为123456789，字典的key值为标记的单元格描述，如：A1,G4等；字典的value值为方格中的记录：有数字记数字，空白记作点（.）

{
  'A1': '.'
  'A2': '.',
  'A3': '3',
  'A4': '.',
  'A5': '2',
  ...
  'I9': '.'
}

字符串方式，记录简洁占用空间小，但处理起来比较麻烦；字典方式，方便查找处理，但记录空间较大。

所以，我们以字符串方式记录存储，以字典方式进行运算求解。那么在运算求解前需要对记录方式的转换。

1.2 字典方式记录

1.2.1 所有`key`值数组

rows = 'ABCDEFGHI'
cols = '123456789'

def cross(a, b):
    return [s+t for s in a for t in b]

boxes = cross(rows, cols)

1.2.2 规则单元

row_units = [cross(r, cols) for r in rows]
column_units = [cross(rows, c) for c in cols]
square_units = [cross(rs, cs) for rs in ('ABC','DEF','GHI') for cs in ('123','456','789')]
unitlist = row_units + column_units + square_units

1.2.3 指定单元格所属规则单元

units = dict((s, [u for u in unitlist if s in u]) for s in boxes)
peers = dict((s, set(sum(units[s],[]))-set([s])) for s in boxes)

1.3 记录方式转换

def grid_values(grid):
    return dict(zip(boxes, grid))

zip() 将可迭代的对象作为参数，把对象中对应的元素打包成一个个元组，然后返回由这些元组组成的列表

二、策略1：过滤淘汰

首先明确一个概念：

规则单元：一个方格所属的水平行、垂直列以及3*3方阵的所有方格
规则同胞：一个方格的规则单元中除了自己的其他方格

如果没有任何限制，每个方格可填入的数字可以是123456789中的任何一个，而根据数独游戏规则，预先填入数字的方格会限制，该方格的规则单元中，其他待填数方格的数字取值范围。所以显而易见的解决策略，便是根据限制规则，缩小取值范围。

开始进行过滤淘汰之前，我们需要的初始数独方格字典中，代表空方格的（.）用可取值的数字范围替换，初始范围为123456789

def grid_values(grid):
    valueLst = []
    digits = '123456789'
    for item in grid:
        if item == '.':
            valueLst.append(digits)
        elif item in digits:
            valueLst.append(item)
    return dict(zip(boxes, valueLst))

如此获得的初始数独方格字典为：

{
    'A1': '123456789',
    'A2': '123456789',
    'A3': '3',
    'A4': '123456789'
    'A5': '2',
    ...
    'I9': '123456789'
}

过滤淘汰策略：找到已确定的数独方格，再依次遍历这些方格的规则同胞方格，从待确定方格的取值范围中，把已确定的数字去掉，以缩小取值范围。

def eliminate(values):
    solvedBoxes = [box for box in values.keys() if len(values[box]) == 1]
    for box in solvedBoxes:
        value = values[box]
        for peer in peers[box]:
            values[peer] = values[peer].replace(value, '')
    return values

过滤淘汰策略，是在规则单元上进行取值范围缩小的。这只覆盖了数独游戏规则的一部分，而数独规则还包括：
每个最小规则单元中九个方格中的数字123456789仅出现一次。特别说明一下，最小规则单元：
单行的九个方格，单列的九个方格，或3*3的九个方格，也可以说一个规则单元包含了三个最小规则单元。

三、策略2：唯一可选

根据最小规则单元，进一步缩小规则同胞中待填数的取值范围，便引出了第二条规则：唯一可选策略

图片描述

如果最小规则单元中，只有一个方格出现了某个数字，那么这个方格就该填这个数字

def only_choice(values):
    for unit in unitlist:
        for digit in '123456789':
            places = [box for box in unit if digit in values[box]]
            if len(places) == 1:
                values[places[0]] = digit
    return values

交替使用过滤淘汰策略和唯一可选策略便可将数独问题中，所有待填数方格的取值范围缩减至最小，但由于这两种策略循环使用的终止条件，是不再有新确定的填数方格出现，所以这并不充分能解决所有数独问题。

def reduce_puzzle(values):
    stalled = False
    while not stalled:
        solved_values_before = len([box for box in values.keys() if len(values[box]) == 1])
        values = eliminate(values)
        values = only_choice(values)
        solved_values_after = len([box for box in values.keys() if len(values[box]) == 1])
        stalled = solved_values_before == solved_values_after
        if len([box for box in values.keys() if len(values[box]) == 0]):
            return False
    return values

四、策略3：约束搜索

对于方格预设数字比较多的数独问题，或许可以直接通过上述缩减取值范围的方法解决。但当所给预设数字方格比较少时，在完成取值范围缩小后，必然还会有一些取值不确定的方格存在。如此问题的求解，就需要从多个可选值的方格中，分别假定其中一个进行搜索。

而此处针对进一步的搜索，有两个问题需要考虑：

如何选取搜索起点方格？
确定哪种搜索策略：深度优先搜索，广度优先搜索？

关于第一个问题，无论选择哪个方格起始搜索，对于能否解决问题来说并不存在差异。而从求解过程的性能和效率来考虑，就有了差别。而在思考第二个问题之前，还需要明确一点：数独问题的解是否唯一？显然如果预设的方格过多且彼此矛盾，问题必然无解，而预设的方格过少，势必也会存在多个满足规则的解。所以为了优先求得一个确定解，我们采取深度优先搜索，而若是求可能的所有解，多线程进行广度优先搜索，可以获得较好的时间复杂度，但却需要暂存许多中间信息。

def search(values):
    values = reduce_puzzle(values)
    if values is False:
        return False
    if all(len(values[s]) == 1 for s in boxes):
        return values
    n,s = min((len(values[s]), s) for s in boxes if len(values[s]) > 1)
    for value in values[s]:
        new_values = values.copy()
        new_values[s] = value
        attemp = search(new_values)
        if attemp:
            return attemp

如此数独问题得解，但能解决速度问题的程序就能成为AI么？

《AI之矛》（1）【数独Agent】

一、问题描述

1.1 问题记录方式

1.2 字典方式记录

1.2.1 所有`key`值数组

1.2.2 规则单元

1.2.3 指定单元格所属规则单元

1.3 记录方式转换

二、策略1：过滤淘汰

三、策略2：唯一可选

四、策略3：约束搜索

sept08

引用和评论

区块链笔记（4）用JS写个简单的区块链原型

Anaconda安装教程以及Anaconda和pip配置国内镜像

科学计算编程涉及到的技术栈简介

使用 chardet 判断文件编码需要注意的坑——过大的文件会导致高耗时

Python3 格式化时间（qbit）

本地使用PaddleOCR进行图片识别获得文字（返回JSON）

manus 的替代品有哪些？使用LLM大模型技术做手机/网页/浏览器自动化操作技术汇总

《AI之矛》（1）【数独Agent】

一、问题描述

1.1 问题记录方式

1.2 字典方式记录

1.2.1 所有key值数组

1.2.2 规则单元

1.2.3 指定单元格所属规则单元

1.3 记录方式转换

二、策略1：过滤淘汰

三、策略2：唯一可选

四、策略3：约束搜索

sept08

引用和评论

区块链笔记（4）用JS写个简单的区块链原型

Anaconda安装教程以及Anaconda和pip配置国内镜像

科学计算编程涉及到的技术栈简介

使用 chardet 判断文件编码需要注意的坑——过大的文件会导致高耗时

Python3 格式化时间（qbit）

本地使用PaddleOCR进行图片识别获得文字（返回JSON）

manus 的替代品有哪些？使用LLM大模型技术做手机/网页/浏览器自动化操作技术汇总

1.2.1 所有`key`值数组