from selenium import webdriver
from selenium.webdriver.chrome.service import Service
from webdriver_manager.chrome import ChromeDriverManager
from selenium.webdriver.common.by import By
import time
# 设置 ChromeDriver
options = webdriver.ChromeOptions()
options.add_argument('--headless') # 如果不想看到浏览器界面,启用headless模式
driver = webdriver.Chrome(service=Service(ChromeDriverManager().install()), options=options)
# 打开目标网站
url = 'https://www.us168168.com/#/houseRentingDetails?id=1860134671530127362'
driver.get(url)
# 等待动态内容加载
time.sleep(15) # 可以根据具体的页面加载时间调整
# 查找需要的元素
content = driver.find_element(By.TAG_NAME, "body").text # 获取页面的文本内容
print(content)
# 关闭浏览器
driver.quit()
前提安装这些模块
1.selenium: 用于控制浏览器。
2.webdriver_manager: 用于自动下载和管理 ChromeDriver。
目前我重新写的代码
运行结果
会打开一个浏览器窗口,然后正常加载页面,到获取数据那一步就空了,是不是目标网站做了防爬虫机制