requests-html 怎么获取对应的innerText

requests-html 怎么获取一个标签的innerText

def stage_catch():
    session = HTMLSession()
    r = session.get('http://www.dmzx.com/manhua/358/')
    div = r.html.find('.subsrbelist')
    list_a = div[0].find('ul')[0].find('a')     # 找到对应目录列表
    for a in list_a:

        print(a)
        print(a.attrs)
        print(a.text)

        # pages = re.sub("\D", "", total_pages)
        # print(pages)
    pass
if __name__ == '__main__':
    stage_catch()

这个是我对应的节点

<a href="http://www.dmzx.com/manhua/358/2000089062.html" title="第360话" target="_blank">
    <span class="red">第360话</span> 
        (18页)
</a>

<Element 'a' href='http://www.dmzx.com/manhua/358/2000089062.html' title='第360话' target='_blank'>
{'href': 'http://www.dmzx.com/manhua/358/2000089062.html', 'title': '第360话', 'target': '_blank'}
全职猎人 (第360话) (18页)

这是我的三次输出。我使用a.text 输出的时候不是

我想调用类似 a.innerText直接获取到innerText 也就是"(18页)"，但是没有这个方法。

我暂时转成字符串然后处理对应的字符串了。。。。

我想知道对于这些python库我有什么办法测试他有什么对应的js中的方法。

我试了下dir(a) 获取到了方法，和text有关的都试了一次页发现不行。。。。

阅读 4.4k

r=session.get('http://www.dmzx.com/manhua/358/') a_ls=r.html.find('div.subsrbelist.center > ul > li > a') data=[] for a in a_ls: chapter=' '.join(a.text.split(' ')[:-1]) pages=a.text.split(' ')[-1] link=a.attrs['href'] data.append({'chapter':chapter, 'pages':pages, 'link':link}) print(data)

requests-html 怎么获取对应的innerText

你尚未登录，登录后可以

Qt中布局是否只有5种呢？

这段代码为什么不能获取到数据？

字节的 trae AI IDE 不支持类似 vscode 的 ssh remote 远程开发怎么办？

请问一下，如何理解reduce函数呢？

如何使用Python+Selenium爬取Goodreads上万条书评而不崩溃？

如何使用 python 代码实现迅雷磁力链接资源的下载？

在PyCharm开发不同python项目，如果每个项目使用自己的venv环境，是不是每次切换项目都需要修改python interpreter？