新手上路，请多包涵

我正在尝试从网站复制 href 值，html 代码如下所示：

 <p class="sc-eYdvao kvdWiq">
 <a href="https://www.iproperty.com.my/property/setia-eco-park/sale-
 1653165/">Shah Alam Setia Eco Park, Setia Eco Park
 </a>
</p>

我试过了 driver.find_elements_by_css_selector(".sc-eYdvao.kvdWiq").get_attribute("href") 但它返回了 'list' object has no attribute 'get_attribute' 。使用 driver.find_element_by_css_selector(".sc-eYdvao.kvdWiq").get_attribute("href") 返回 None 。但我不能使用 xpath，因为该网站有 20 多个 href，我需要将其全部复制。使用 xpath 只会复制一个。

如果有帮助，所有 20+ href 都归类在同一类下，即 sc-eYdvao kvdWiq 。

最终我想复制所有 20+ href 并将它们导出到 csv 文件。

感谢任何可能的帮助。

原文由 Eric Choi 发布，翻译遵循 CC BY-SA 4.0 许可协议

python selenium xpath css-selectors webdriverwait

阅读 2.1k

2 个回答

得票最新

社区维基

发布于
2023-01-03

✓ 已被采纳

如果元素不止一个，您需要 driver.find_elements。这将返回一个列表。对于 css 选择器，您要确保选择的是那些具有子 href 的类

elems = driver.find_elements_by_css_selector(".sc-eYdvao.kvdWiq [href]")
links = [elem.get_attribute('href') for elem in elems]

您可能还需要一个等待条件，以等待 css 选择器定位的所有元素都存在。

 elems = WebDriverWait(driver,10).until(EC.presence_of_all_elements_located((By.CSS_SELECTOR, ".sc-eYdvao.kvdWiq [href]")))

原文由 QHarr 发布，翻译遵循 CC BY-SA 4.0 许可协议

社区维基

发布于
2023-01-03

根据给定的 HTML：

 <p class="sc-eYdvao kvdWiq">
    <a href="https://www.iproperty.com.my/property/setia-eco-park/sale-1653165/">Shah Alam Setia Eco Park, Setia Eco Park</a>
</p>

由于 href 属性在 <a> 标签内，理想情况下您需要更深入地移动到 <a> 节点。因此，要提取 href 属性的值，您可以使用以下任一定位器策略：

使用 css_selector ：

   print(driver.find_element_by_css_selector("p.sc-eYdvao.kvdWiq > a").get_attribute('href'))

使用 xpath ：

   print(driver.find_element_by_xpath("//p[@class='sc-eYdvao kvdWiq']/a").get_attribute('href'))

如果要提取 href 属性的所有值，则需要使用 find_elements* 代替：

使用 css_selector ：

   print([my_elem.get_attribute("href") for my_elem in driver.find_elements_by_css_selector("p.sc-eYdvao.kvdWiq > a")])

使用 xpath ：

   print([my_elem.get_attribute("href") for my_elem in driver.find_elements_by_xpath("//p[@class='sc-eYdvao kvdWiq']/a")])

动态元素

但是，如果您观察类属性的值，即 sc-eYdvao 和 kvdWiq 理想情况下，这些是动态值。因此，要提取 href 属性，您必须为 visibility_of_element_located() 引入 WebDriverWait 并且您可以使用以下任一 _定位器策略_：

使用 CSS_SELECTOR ：

   print(WebDriverWait(driver, 10).until(EC.visibility_of_element_located((By.CSS_SELECTOR, "p.sc-eYdvao.kvdWiq > a"))).get_attribute('href'))

使用 XPATH ：

   print(WebDriverWait(driver, 10).until(EC.visibility_of_element_located((By.XPATH, "//p[@class='sc-eYdvao kvdWiq']/a"))).get_attribute('href'))

如果要提取 href 属性的所有值，您可以使用 visibility_of_all_elements_located() 代替：

使用 CSS_SELECTOR ：

   print([my_elem.get_attribute("innerHTML") for my_elem in WebDriverWait(driver, 20).until(EC.visibility_of_all_elements_located((By.CSS_SELECTOR, "p.sc-eYdvao.kvdWiq > a")))])

使用 XPATH ：

   print([my_elem.get_attribute("innerHTML") for my_elem in WebDriverWait(driver, 20).until(EC.visibility_of_all_elements_located((By.XPATH, "//p[@class='sc-eYdvao kvdWiq']/a")))])

注意：您必须添加以下导入：

 from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.common.by import By
from selenium.webdriver.support import expected_conditions as EC

原文由 undetected Selenium 发布，翻译遵循 CC BY-SA 4.0 许可协议

撰写回答

你尚未登录，登录后可以

和开发者交流问题的细节
关注并接收问题和回答的更新提醒
参与内容的编辑和改进，让解决方法与时俱进

推荐问题

Python Selenium - 获取 href 值

动态元素

你尚未登录，登录后可以

字节的 trae AI IDE 不支持类似 vscode 的 ssh remote 远程开发怎么办？

DataCap 中验证码无法显示，后台出现 NullPointerException 错误?

发现深拷贝和浅拷贝效果一致：请问一下有什么区别呢？

如何实现一个深拷贝函数？

Python 成员变量在多个子类实例间共享，如何避免？

分解质因素的算法很难，理解不了。请问有哪位大佬可以进行解释一下呢？

为什么 Qwen2.5-Omni-7B 官方教程都报错 Cannot import available module of Qwen2_5OmniModel in modelscope ？

Stack Overflow 翻译

Python Selenium - 获取 href 值

动态元素

你尚未登录，登录后可以

字节的 trae AI IDE 不支持类似 vscode 的 ssh remote 远程开发怎么办？

DataCap 中验证码无法显示，后台出现 NullPointerException 错误?

发现深拷贝和浅拷贝效果一致：请问一下有什么区别呢？

如何实现一个深拷贝函数？

Python 成员变量在多个子类实例间共享，如何避免？

分解质因素的算法很难，理解不了。 请问有哪位大佬可以进行解释一下呢？

为什么 Qwen2.5-Omni-7B 官方教程都报错 Cannot import available module of Qwen2_5OmniModel in modelscope ？

Stack Overflow 翻译

分解质因素的算法很难，理解不了。请问有哪位大佬可以进行解释一下呢？