源代码格式相同的页面为什么爬虫抓取的数据数目不同？

1 在翻页爬取不同页面的数据时，发现每页的源代码是相同的，但是用同一个抓取方法抓取的数据为什么个数不同，有的是全部的40条，有的只有29条。不知道是反爬虫的原因还是怎么回事，求指教。

2 代码如下：

import time
import re
import requests
import random
from bs4 import BeautifulSoup

url1 = 'http://yanbao.stock.hexun.com/listnews1_1.shtml'
url2 = 'http://yanbao.stock.hexun.com/listnews1_2.shtml'
url3 = 'http://yanbao.stock.hexun.com/listnews1_3.shtml'
info = requests.get(url1).content
soup = BeautifulSoup(info,'lxml')

stock = [i.string.split('：')[0] for i in soup.find_all('a',class_ = 'fxx_wb')]

print(len(stock))

抓取的元素是红色部分，即股票的代码

3 结果：在url1和url2中都能抓40条（全部数目），在url3只有29，其余的有些是40，也有很大一部分小于40，自己观察了一下好像代码格式都是相同的，但是为什么出现这种情况，请问原因，和如何处理？谢谢

阅读 4.5k

import requests from pyquery import PyQuery as Q urls = [ 'http://yanbao.stock.hexun.com/listnews1_1.shtml', 'http://yanbao.stock.hexun.com/listnews1_2.shtml', 'http://yanbao.stock.hexun.com/listnews1_3.shtml' ] for url in urls: r = requests.get(url) q = Q(r.text) lst = [q(_).text().split('：')[0] for _ in q('table.tab_cont a.fxx_wb')] print lst

源代码格式相同的页面为什么爬虫抓取的数据数目不同？

你尚未登录，登录后可以

字节的 trae AI IDE 不支持类似 vscode 的 ssh remote 远程开发怎么办？

DataCap 中验证码无法显示，后台出现 NullPointerException 错误?

发现深拷贝和浅拷贝效果一致：请问一下有什么区别呢？

如何实现一个深拷贝函数？

Python 成员变量在多个子类实例间共享，如何避免？

为什么 Qwen2.5-Omni-7B 官方教程都报错 Cannot import available module of Qwen2_5OmniModel in modelscope ？

Spark-TTS-0.5B 的 requirements.txt 在哪里？