关于用xpath抓取tag的问题

Question

关于用xpath抓取tag的问题

Bill_Zhao

722

发布于
2014-05-21

更新于
2014-05-22

我正在学习使用Knime。一个功能丰富但是不常被人知道的软件。
这个软件集合了htmlparser和xpath的功能，所以我想通过这个软件来做网页的数据挖掘。

在尝试抓取里面的文字时遇到了不明白的问题。
如果我写//h:p 按理说应该抓取到网页中所有的...中的内容
但
返回给我的结果只有第一个自然段（第一组...）

请问怎样才能抓出所有的 tag？？？
使用的网站链接：http://www.cmt.com.cn/detail/504557.html

非常感谢愿意帮助解答的朋友！！
——————————————————————————————————————————
我尝试过了
//h:div/h:p
//h:/h:p
//h:p[@]
//p
等等的各种组合都没能达到抓取全部内容的效果
包括从上一级写起//h:div[@class="newstextco"] -->这个干脆没有返回值

xpath xhtml xml html

阅读 4.9k

撰写回答

你尚未登录，登录后可以

和开发者交流问题的细节
关注并接收问题和回答的更新提醒
参与内容的编辑和改进，让解决方法与时俱进

推荐问题

101 新手上路

子站问答

访问

相似问题

找不到问题？创建新问题

关于用xpath抓取<p>tag的问题

你尚未登录，登录后可以

golang 解析rss并返回json？

问一个鼠标滚动事件，这种是怎么实现的？

form对象根据表单dom元素的name属性获取元素对象是基于什么标准的？兼容性如何？

threejs用octree实现房间内第三人称漫游并且添加了碰撞，人物在碰撞到墙壁的时候不停的弹回，应该怎么修改才能不会疯狂的弹回？

Vue为什么说textarea标签不支持插值表达式的？

为什么下面的代码内部的 div 其 100% 高度可以跳过上层元素?

单页应用网站缓存不是由于index.html文件被缓存导致的吗？

101 新手上路