今天我们看一道 leetcode hard 难度题目:地下城游戏

恶魔们抓住了公主并将她关在了地下城 dungeon 的 右下角 。地下城是由 m x n 个房间组成的二维网格。我们英勇的骑士最初被安置在 左上角 的房间里,他必须穿过地下城并通过对抗恶魔来拯救公主。

骑士的初始健康点数为一个正整数。如果他的健康点数在某一时刻降至 0 或以下,他会立即死亡。

有些房间由恶魔守卫,因此骑士在进入这些房间时会失去健康点数(若房间里的值为负整数,则表示骑士将损失健康点数);其他房间要么是空的(房间里的值为 0),要么包含增加骑士健康点数的魔法球(若房间里的值为正整数,则表示骑士将增加健康点数)。

为了尽快解救公主,骑士决定每次只 向右 或 向下 移动一步。

返回确保骑士能够拯救到公主所需的最低初始健康点数。

注意:任何房间都可能对骑士的健康点数造成威胁,也可能增加骑士的健康点数,包括骑士进入的左上角房间以及公主被监禁的右下角房间。

<img width=400 src="https://user-images.githubusercontent.com/7970947/263517730-f0614372-02c5-4ddf-8ffe-5410ffa3a68b.png">

输入:dungeon = [[-2,-3,3],[-5,-10,1],[10,30,-5]]

输出:7

解释:如果骑士遵循最佳路径:右 -> 右 -> 下 -> 下 ,则骑士的初始健康点数至少为 7 。

思考

挺像游戏的一道题,首先只能向下或向右移动,所以每个格子可以由上面或左边的格子移动而来,很自然想到可以用动态规划解决。

再想一想,该题必须遍历整个地下城而无法取巧,因为最低健康点数无法由局部数据算出,这是因为如果不把整个地下城走完,肯定不知道是否有更优路线。

动态规划

二维迷宫用两个变量 i j 定位,其中 dp[i][j] 描述第 ij 列所需的最低 HP。

但最低所需 HP 无法推断出是否能继续前进,我们还得知道当前 HP 才行,比如:

// 从左到右走
3 -> -5 -> 6 -> -9

在数字 6 的位置所需最低 HP 是 3,但我们必须知道在 6 时勇者剩余 HP 才能判断 -9 会不会直接导致勇者挂了,因此我们将 dp[i][j] 结果定义为一个数组,第一项表示当前 HP,第二项表示初始所需最低 HP。

代码实现如下:

function calculateMinimumHP(dungeon: number[][]): number {
  // dp[i][j] 表示 i,j 位置 [当前HP, 所需最低HP]
  const dp = Array.from(dungeon.map(item => () => [0, 0]))
  // dp[i][j] = 所需最低HP最低(dp[i-1][j], dp[i][j-1])
  dp[0][0] = [
    dungeon[0][0] > 0 ? 1 + dungeon[0][0] : 1,
    dungeon[0][0] > 0 ? 1 : 1 - dungeon[0][0]
  ]
  for (let i = 0; i < dungeon.length; i++) {
    for (let j = 0; j < dungeon[0].length; j++) {
      if (i === 0 && j === 0) {
        continue
      }

      const paths = []
      if (i > 0) {
        paths.push([i - 1, j])
      }
      if (j > 0) {
        paths.push([i, j - 1])
      }

      const pathResults = paths.map(path => {
        let leftMaxHealth = dp[path[0]][path[1]][0] + dungeon[i][j]
        // 剩余HP大于 0 则无需刷新最低HP,否则尝试刷新取最大值
        let lowestNeedHealth = dp[path[0]][path[1]][1]
        if (leftMaxHealth <= 0) {
          // 最低要求HP补上差价
          lowestNeedHealth += 1 - leftMaxHealth
          // 最低需要HP已补上,所以剩余HP也变成了 1
          leftMaxHealth = 1
        }
        return [leftMaxHealth, lowestNeedHealth]
      })

      // 找到 pathResults 中 lowestNeedHealth 最小项
      let minLowestNeedHealth = Infinity
      let minIndex = 0
      pathResults.forEach((pathResult, index) => {
        if (pathResult[1] < minLowestNeedHealth) {
          minLowestNeedHealth = pathResult[1]
          minIndex = index
        }
      })

      dp[i][j] = [pathResults[minIndex][0], pathResults[minIndex][1]]
    }
  }

  return dp[dungeon.length - 1][dungeon[0].length - 1][1]
};

首先计算初始位置 dp[0][0],因为只看这一个点,因此如果有恶魔,最少初始 HP 为能击败恶魔后自己剩 1 HP 就行了,如果房间是空的,至少自己 HP 得是 1(否则勇者进迷宫之前就挂了),如果有魔法球,那么初始 HP 为 1(一样防止进迷宫前挂了)。

初始 HP 稍有不同,如果房间是空的或者有恶魔,那打完恶魔之后最多剩 1 HP 最经济,所以此时 HP 初始值就是 1,如果有魔法球,那么一方面为了防止进入迷宫前自己就挂了,得有个初始 1 的 HP,魔法球又必须得吃,所以 HP 是 1 + 魔法球。

接着就是状态转移方程了,由于 dp[i][j] 可以由 dp[i-1][j]dp[i][j-1] 移动得到(注意 i 或 j 为 0 时的场景),因此我们判断一下从哪条路过来的最低初始 HP 最低就行了。

如果进入当前房间后,房间是空的,有魔法球,或者当前 HP 可以打败恶魔,则不影响最低初始 HP,如果当前 HP 不足以击败恶魔,则我们把缺的 HP 给勇者在初始时补上,此时极限一些还剩 1 HP,得到一个最经济的结果。

然后我们提交代码发现,无法 AC!下面是一个典型挂掉的例子:

1   -3    3
0   -2    0
-3  -3   -3

我们把 DP 中间过程输出,发现右下角的 5 大于最优答案 3.

[
  [ 2, 1 ], [ 1, 3 ], [ 4, 3 ]
  [ 2, 1 ], [ 1, 2 ], [ 1, 2 ]
  [ 1, 3 ], [ 1, 5 ], [ 1, 5 ]
]

观察发现,勇者先往右走到头,再往下走到头答案就是 3,问题出在 i=1,j=2 处,也就是中间行最右列的 [1, 2]。但从这一点来看,勇者从左边过来比从上面过来需要的初始 HP 少,因为左边是 [1, 2] 上面是 [4, 3],但这导致了答案不是最优解,因为此时剩余 HP 不够,右下角是一个攻击为 3 的恶魔,而如果此时我们选择了初始 HP 高一些的 [4, 3],换来了更高的当前 HP,在不用补初始 HP 的情况就能把右下角恶魔干掉,整体是更划算的。

如果此时我们在玩游戏,读读档也就能找到最优解了,但悲剧的是我们在写一套算法,我们发现当前 DP 项居然还可能由后面的值(攻击力为 3 的恶魔)决定! 用专业的话来说就是有后效性导致无法使用 DP。

我们在判断每一步最优解时,其实有两个同等重要的因素影响判断,一个是初始最少所需 HP,它的重要度不言而喻,我们最终就希望这个答案尽可能小;但还有当前 HP 呢,当前 HP 高意味着后面的路会更好走,但我们如果不往后看,就不知道后面是否有恶魔,自然也不知道要不要留着高当前 HP 的路线,所以根本就无法根据前一项下结论。

因为考虑的因素太多了,我们得换成游戏制作者的视角,假设作为游戏设计者,而不是玩家,你会真的从头玩一遍吗?如果真的要设计这种条件很极限的地下城,设计者肯定从结果倒推啊,结果我们勇者就只剩 1 HP 了,至于路上会遇到什么恶魔或者魔法球,反过来倒推就一切尽在掌握了。所以我们得采用从右下角开始走的逆向思维。

逆向思维

为什么从结果倒推,DP 判断条件就没有后效性了呢?

先回忆一下从左上角出发的情况,为什么除了最低初始 HP 外还要记录当前 HP?原因是当前 HP 决定了当前房间的怪物勇者能否打得过,如果打不过,我们得扩大最低初始 HP 让勇者能在仅剩 1 HP 的情况险胜当前房间的恶魔。但这个当前 HP 值不仅要用来辅助计算最低初始 HP,它还有一个越大越好的性质,因为后面房间可能还有恶魔,得留一些 HP 预防风险,而 "最低初始 HP" 尽可能低与 "当前 HP" 尽可能高,这两个因素无法同时考虑。

那为什么从右下角,以终为始的考虑就可以少判断一个条件了呢?首先最低初始 HP 我们肯定要判断的,因为答案要的就是这个,那当前 HP 呢?当前 HP 重要吗?不重要,因为你已经拯救到公主了,而且是以最低 HP 1 点的状态救到了公主,按故事路线逆着走,遇到恶魔房间,恶魔攻击是多少我就给你加多少初始 HP,遇到魔法球恢复了我就给你扣对应初始 HP,总之能让你正好战胜恶魔,魔法球补给你的 HP 我也扣掉,就可以了。核心区别是,此时当前 HP 已经不会影响最低初始 HP 了,因为初始 HP 就是从头推的,我们反着走地下城,每次实际上都是在判断这个点作为起点时的状态,所以与之前的路径无关。

代码很简单,如下:

function calculateMinimumHP(dungeon: number[][]): number {
  // dp[i][j] 表示 i,j 位置最少HP
  const dp = Array.from(dungeon.map(item => () => [0, 0]))
  // 右下角起始 HP 1,遇到怪物加血,遇到魔法球扣血,实际上就是 -dungeon 计算
  const si = dungeon.length - 1
  const sj = dungeon[0].length - 1
  dp[si][sj] = dungeon[si][sj] > 0 ? 1 : 1 - dungeon[si][sj]
  for (let i = si; i >= 0; i--) {
    for (let j = sj; j >= 0; j--) {
      if (i === si && j === sj) {
        continue
      }

      const paths = []
      if (i < si) {
        paths.push([i + 1, j])
      }
      if (j < sj) {
        paths.push([i, j + 1])
      }

      const pathResults = paths.map(path => dp[path[0]][path[1]] - dungeon[i][j])
      // 选出最小 HP 作为 dp[i][j],但不能小于 1
      dp[i][j] = Math.max(Math.min(...pathResults), 1)
    }
  }

  return dp[0][0]
};

逆向思维为什么就能减少当前 HP(或者说路径和,或者说所有之前节点的影响)判断呢?我猜你大概率还是没彻底明白。因为这个思考非常关键,可以说是这道题 99% 的困难所在,还是画个图解释一下:

<img width=800 src="https://user-images.githubusercontent.com/7970947/263527687-3dfa32b0-cedf-4032-8434-6ccb98cd156f.png">

上图是勇者正常探险的思路,下面是逆向(或公主救勇者)的思路。

<img width=800 src="https://user-images.githubusercontent.com/7970947/263527731-492bd2f5-411e-44c7-a68e-2197d37b582b.png">

总结

该题很容易想到使用动态规划解决,但因为目标是求最低的初始健康点需求,所以按照勇者路径走的话,后续未探索的路径会影响到目标,所以我们需要从公主角度反向寻找勇者,才可以保证动态规划的每个判断点都只考虑一个影响因素。

讨论地址是:精读《算法 - 地下城游戏》· Issue #498 · dt-fe/weekly

如果你想参与讨论,请 点击这里,每周都有新的主题,周末或周一发布。前端精读 - 帮你筛选靠谱的内容。

版权声明:自由转载-非商用-非衍生-保持署名(创意共享 3.0 许可证

黄子毅
7k 声望9.6k 粉丝