情况
将网页整个HTML爬取下来后, 源码中span标签的内容和页面上显示的不一致
标签内容: 30%
# response = requests.get(matrixport_url_new, headers=headers,
# )
# text = response.text
# print(response.text)
根据网页内容定位到的Inspector中对应的元素的id如下
查看网页源代码中,结果不是30%,而是0%
查看Network中的Type
复制id名字到Network中搜索,没有任何匹配的url
使用fillder捕获到的url是.svg结尾的
请问这种情况下,数据是来自js还是ajax还是其他
问题更新
我的情况
我的情况和下图中斗鱼直播的关注数一样,下图是我访问斗鱼后的截图
比较特殊的是源代码中span标签包含的内容是空的
请问这种类型的需要怎么获取需要的数据,requests和selenium,bs4自己用了常规方法获取,都失败了
做了防爬处理吧,可能是通过字体包将数字做了映射转换,方便的话可以将页面发出来看看