segmentfaultsegmentfault
注册登录
产品
社群
使用“Bing”搜本站使用“Google”搜本站使用“百度”搜本站✓站内搜索
注册登录
问答博客资讯标签用户活动

logo极客观点logo项目管理logoHarmonyOS
开发者社区

javascript
前端
python
node.js
react
vue.js
php
laravel
go
人工智能
mysql
linux
ios
java
android
css
typescript
spring
程序员

logoONES 研发管理logo思否企业问答logo安谋科技 XPU
问答博客资讯标签用户活动

logo极客观点logo项目管理logoHarmonyOS
开发者社区

javascript
前端
python
node.js
react
vue.js
php
laravel
go
人工智能
mysql
linux
ios
java
android
css
typescript
spring
程序员

logoONES 研发管理logo思否企业问答logo安谋科技 XPU

网页爬虫疑问

头像
伊燃4237
    10211925
    发布于
    2016-01-14

    最近发现一个问题,部分网站的源代码和页面代码是不一样的。

    就是我在页面上能看到一些东西但是在源代码上看不到。

    这个该如何处理?

    网页爬虫
    阅读 3.1k
    2 个回答
    得票最新
    头像
    yujieyu7
      854118
      发布于
      2016-01-14
      ✓ 已被采纳

      对于这种js执行才产生内容的网页你需要这个 phantomjs

      查看全部 2 个回答
      头像
      已注销
        73
        发布于
        2016-09-23

        可以参考下这个开发者文档,里面有详细的介绍。http://doc.shenjianshou.cn/

        推荐问题
        • 如何从根目录拉取docs.spring.io的所有文档?
          如题,这是Spring的文档列表。我想从根目录拉取资料,但是点击“Parent Directory”,返回的却是网页,如下图:感觉这也不是ftp协议。所以到底该如何才能从根目录获取完整的目录和文件呢?

          1 回答1.9k 阅读

        相似问题
        • jQuery网页爬虫

          2 回答6.7k 阅读✓ 已解决

        • Python写网页爬虫的问题?

          2 回答4k 阅读

        • 网页爬虫的js 加密的问题

          2.4k 阅读

        • python爬虫爬取网页遇到Javascript is required

          2 回答13.1k 阅读✓ 已解决

        • python 爬虫

          1 回答1.9k 阅读

        找不到问题?创建新问题
        宣传栏
        思否旗下产品
        SegmentFault
        思否企业服务
        思否公开课
        思否企业问答
        ONES 旗下产品
        ONES
        Tower
        为知笔记
        企业问答
        ONES.com
        项目管理百科
        资源
        每周精选
        用户排行榜
        帮助中心
        建议反馈
        声望
        勋章
        合作
        关于我们
        广告投放
        联系我们
        合作伙伴
        关注
        产品技术日志
        社区运营日志
        市场运营日志
        社区访谈
        条款
        服务协议
        隐私政策
        下载 App

        Copyright © 2011-2025 SegmentFault. 当前呈现版本 25.06.09

        浙ICP备15005796号-2浙公网安备33010602002000号ICP 经营许可 浙B2-20201554

        杭州堆栈科技有限公司版权所有

        思否 - 凝聚集体智慧,推动技术进步