beautifulsoup 怎样抓取 select 标签里面的 option 的文本？

我要抓取的页面的内容是在如下标签内的

<script language=javascript>parent.theZNPKT_CJJS1.innerHTML='<select id=T_CJJS1 name=T_CJJS1 style="HEIGHT: 20px;WIDTH:115"><option value=0000258>[0000789]Andrew</option></select>';</script>

我写的代码：

import urllib2
from bs4 import BeautifulSoup
url = 'xxx'
html = urllib2.urlopen(url)

soup = BeautifulSoup(html, from_encoding = 'gbk')
option = soup.findAll('option')
f = open("out.txt", "w")
print >> f, option
f.close()
print option

抓取出来的结果全都是 <option value="0000049">[0000049]ANNA</option> 这样的，我想提取 [0000049]ANNA 这个内容怎样做呀？

很多东西都不懂，经过搜索换了一种方法提取出来了。用的是正则的方法：

import urllib2
import re
url = 'xxx'
html = urllib2.urlopen(url).read()

patt = re.compile(r'<option.+?>(.+?)</option>')
option = patt.findall(html)
f = open("out.txt", "w")
for value in option:
    print value
    f.writelines(value + '\n')
f.close()

阅读 18.9k

beautifulsoup 怎样抓取 select 标签里面的 option 的文本？

你尚未登录，登录后可以

字节的 trae AI IDE 不支持类似 vscode 的 ssh remote 远程开发怎么办？

DataCap 中验证码无法显示，后台出现 NullPointerException 错误?

如何实现一个深拷贝函数？

发现深拷贝和浅拷贝效果一致：请问一下有什么区别呢？

Python 成员变量在多个子类实例间共享，如何避免？

为什么 Qwen2.5-Omni-7B 官方教程都报错 Cannot import available module of Qwen2_5OmniModel in modelscope ？

Spark-TTS-0.5B 的 requirements.txt 在哪里？