python 爬虫遇到的xpath 的问题

[u'\u4f18\u4fe1\u4e70\u8f66APP\u7ec4\u56fe3\u81f34', u'\u4f18\u4fe1\u4e70\u8f66APP\u7ec4\u56fe1\u81f32', u'\u4f18\u4fe1\u4e70\u8f66APP\u5927\u56fe5', u'\u4f18\u4fe1\u4e70\u8f66APP\u5927\u56fe3\u81f34', u'\u4f18\u4fe1\u4e70\u8f66H5\u5c0f\u56fe5\u81f36', '\n\t\t\t\t\t\t\t\t\t\r\n\r\n\r\n\r\n\t', '\r\n\t', '\r\n\t', '\r\n\t', '\r\n\t\r\n\t\t', '\r\n\t\t\r\n\t\r\n\t\r\n\t\t\r\n\t\t\t\r\n\t\t\r\n\t\t\r\n\t\r\n\t\r\n\t\t\r\n\t\t\t\r\n\t\t\t\t\r\n\t\t\t\t\r\n\t\t\t\t\r\n\t\t\t\t\r\n\t\t\t\t\t', '\r\n\t\t\t\t\r\n\t\t\t\t\t\r\n\t\t\t\t\r\n\t\r\n\t\t\r\n\t\t\t\r\n\t\t\t\t\r\n\t\t\t\t\r\n\t\t\t\t\r\n\t\t\t\t\r\n\t\t\t\t\t', '\r\n\t\t\t\t\r\n\t\t\t\t\t\r\n\t\t\t\t\r\n\t\r\n\t\r\n\t\t\r\n\t\t', '\r\n\t\r\n\t', '\r\n\n\t\t\t\t\t\t\t\t']

爬虫抓到的数据后面很多（“\t\n”）这种的列表怎么把后面的这些脏东西去掉呢？而且每个抓的字段长度不一样呢！

python 网页爬虫

阅读 3.8k

3 个回答

得票最新

krun

6.9k1726

发布于
2018-02-14

✓ 已被采纳

Cat_1

5629

发布于
2018-02-14

把response得东西贴一下才行呀……

lynskylate

38114

发布于
2018-02-14

如果只是从列表中去掉的话

arr = map(lambda x:x.strip(),arr)
arr = [e for e in arr if e]

当然得根据具体的需求，如果只是题主提供的那种字符串列表，这种方式就够了

撰写回答

你尚未登录，登录后可以

和开发者交流问题的细节
关注并接收问题和回答的更新提醒
参与内容的编辑和改进，让解决方法与时俱进

推荐问题

相似问题

找不到问题？创建新问题

python 爬虫遇到的xpath 的问题

你尚未登录，登录后可以

字节的 trae AI IDE 不支持类似 vscode 的 ssh remote 远程开发怎么办？

DataCap 中验证码无法显示，后台出现 NullPointerException 错误?

如何实现一个深拷贝函数？

发现深拷贝和浅拷贝效果一致：请问一下有什么区别呢？

Python 成员变量在多个子类实例间共享，如何避免？

为什么 Qwen2.5-Omni-7B 官方教程都报错 Cannot import available module of Qwen2_5OmniModel in modelscope ？

Spark-TTS-0.5B 的 requirements.txt 在哪里？