BeautifulSoup如何解析HTML的问题

#-*- coding:utf-8 -*-
from bs4 import BeautifulSoup
html_doc = """
<!DOCTYPE html>
<html lang="en" xmlns="http://www.w3.org/1999/xhtml">
<head>
    <meta charset="utf-8" />
    <title>New Document</title>
</head>
<body>
    <div class="tab-pane active" id="all-school-box">
        <div class="col-md-12 table-list">
            <table class="table table-bordered">
                <tr>
                    <td class="col-md-1"><strong>学校名</strong></td>
                    <td class="col-md-3">北京大学</td>
                    <td class="col-md-1"><strong>联系人</strong></td>
                    <td class="col-md-3">路人甲</td>
                    <td class="col-md-1"><strong>联系电话</strong></td>
                    <td>13800138000</td>
                </tr>
                <tr>
                    <td><strong>城市</strong></td>
                    <td>北京</td>
                    <td><strong>状态</strong></td>
                    <td>正常</td>
                    <td><strong>加入时间</strong></td>
                    <td>0000-00-00</td>
                </tr>
                <tr>
                    <td><strong>学生<br>（总数 / 正常）</strong></td>
                    <td>5961 / 4761</td>
                    <td><strong>学生B部<br>（总数 / 正常）</strong></td>
                    <td>5961 / 4761</td>
                    <td><strong>学生C部<br>（总数 / 正常）</strong></td>
                    <td>0 / 0</td>
                </tr>
            </table>
        </div>
    </div>
</div>
</body>
</html>
"""
soup = BeautifulSoup(html_doc, 'lxml')

print(soup.prettify())

思路
这种是可以转换为json？
还是直接正则过滤出数字？

我需要5961 / 4761 分开输出
转换为str格式
5961
4761

阅读 3.4k

BeautifulSoup如何解析HTML的问题

你尚未登录，登录后可以

Qt中布局是否只有5种呢？

这段代码为什么不能获取到数据？

请问一下，如何理解reduce函数呢？

如何使用Python+Selenium爬取Goodreads上万条书评而不崩溃？

如何使用 python 代码实现迅雷磁力链接资源的下载？

在PyCharm开发不同python项目，如果每个项目使用自己的venv环境，是不是每次切换项目都需要修改python interpreter？

请问，FastAPI如何获取到前端上传的二进制文件并且返回？