【PHP】用正则去获取html中的正文body内容，为什么取出来为空?【已解决】

问题如题，先上html文件，需要取里面的body内容，直接上代码：

<!DOCTYPE html>
<html>
<head>
  <meta charset="UTF-8">
  <title>你好你好</title>
  <link rel="stylesheet" href="css/normalize.css">
  <link rel="stylesheet" href="css/style.css" media="screen" type="text/css" />
</head>
<body>
  <div style="text-align:center;clear:both;">
    <script src="/follow.js" type="text/javascript"></script>
  </div>
  <div class='heart3d'>
    <div class='rib1'></div>
    <div class='rib2'></div>
    <div class='rib3'></div>
    <div class='rib4'></div>
  </div>
</body>
</html>

接着是php代码：

<?php
/**
 * 在html文件中找出正文
 * Created by PhpStorm.
 * User: Administrator
 * Date: 2016/11/15
 * Time: 21:43
 */

$filename = '8/index.html';
$res = get_body_from_html($filename);
var_dump($res);


/**
 * 在html文件中找出正文
 * @param $filename  string 路径url
 * @return array|bool
 */
function get_body_from_html($filename)
{
    if (!file_exists($filename)) {
        return false;
    }

    $file = file_get_contents($filename);
    $res = array();
    preg_match('/<body>(.*)<\/body>/', $file, $res);
    return $res;
}

运行之后发现：

array(0) { }

如果里面的方法改为：

function get_body_from_html($filename)
{
    if (!file_exists($filename)) {
        return false;
    }

//    $file = file_get_contents($filename);
    $file = '<html><head><title>你好</title>></head><body><div>我不好我不好</div></body></html>';
    $res = array();
    preg_match('/<body>(.*)<\/body>/', $file, $res);
    return $res;
}

运行之后就可以正确输出：

array(2) {
  [0]=>
  string(42) "<body><div>我不好我不好</div></body>"
  [1]=>
  string(29) "<div>我不好我不好</div>"
}

所以要请教一下为何写的正则抓不到内容呢？

阅读 7.7k

【PHP】用正则去获取html中的正文body内容，为什么取出来为空?【已解决】

你尚未登录，登录后可以

我想要可靠地升级网站，有没有标准的流程？或者需要注意的地方？

问一个鼠标滚动事件，这种是怎么实现的？

form对象根据表单dom元素的name属性获取元素对象是基于什么标准的？兼容性如何？

threejs用octree实现房间内第三人称漫游并且添加了碰撞，人物在碰撞到墙壁的时候不停的弹回，应该怎么修改才能不会疯狂的弹回？

TP6指定时间段内填写指定内容？

Vue为什么说textarea标签不支持插值表达式的？

cURL error 77: error setting certificate file: /etc/ssl/certs/ca-certificates.crt 如何处理?