小白，刚刚学习爬虫，打算把豆瓣Top250的电影爬取下来，但没有结果，不知道程序错哪了？

Question

小白，刚刚学习爬虫，打算把豆瓣Top250的电影爬取下来，但没有结果，不知道程序错哪了？

发布于
2018-03-03

更新于
2018-03-03

'''
程序目的:
1.提取豆瓣Top250电影，按照序号，名称，豆瓣评分给出
'''

import requests
import re

#抓取网页
def getHTMLText(url):
    try:
        r = requests.get(url)
        r.raise_for_status()
        r.encoding = r.apparent_encoding
        return r.text
    except:
        return ""

#分析网页，提取所需信息
def parseHTML(info,html):
    info = []
    try:
        tlt = re.findall(r'\"title\"\>[\u4e00-\u9fa5]+',html)
        rlt = re.findall(r'\"v:average\"\>[0-9]\.[0-9]',html)  
        
        for i in range(len(tlt)):      #电影个数
            title = tlt[i].split('>')[1]   #用>隔开
            rank = rlt[i].split('>')[1]   #用>隔开
            info.append([title,rank])
    except:
        print("")

def printInfo(info):
    tplt = "{:5}\t{:10}\t{:10}"
    print(tplt.format("序号","电影名称","豆瓣评分"))
    count = 0
    for g in info:
        count = count + 1
        print(tplt.format(count,g[0],g[1]))
        
def main():
    start_url = "https://movie.douban.com/top250?start"
    depth = 9   #总共10页
    infomation = [] #用来存储相关信息

    for i in range(depth):
        try:
            url = start_url+str(25*i)
            html = getHTMLText(url)
            parseHTML(infomation,html)
        except:
            continue
    printInfo(infomation)
main()

python

阅读 3k

1 个回答

得票最新

听完这一年

439312

发布于
2018-03-03

getHTMLText方法里r = requsts.get(url)写少了个e，应该是r = requests.get(url)

撰写回答

你尚未登录，登录后可以

和开发者交流问题的细节
关注并接收问题和回答的更新提醒
参与内容的编辑和改进，让解决方法与时俱进

推荐问题

相似问题

找不到问题？创建新问题

小白，刚刚学习爬虫，打算把豆瓣Top250的电影爬取下来，但没有结果，不知道程序错哪了？

你尚未登录，登录后可以

字节的 trae AI IDE 不支持类似 vscode 的 ssh remote 远程开发怎么办？

DataCap 中验证码无法显示，后台出现 NullPointerException 错误?

发现深拷贝和浅拷贝效果一致：请问一下有什么区别呢？

如何实现一个深拷贝函数？

Python 成员变量在多个子类实例间共享，如何避免？

分解质因素的算法很难，理解不了。请问有哪位大佬可以进行解释一下呢？

为什么 Qwen2.5-Omni-7B 官方教程都报错 Cannot import available module of Qwen2_5OmniModel in modelscope ？

小白，刚刚学习爬虫，打算把豆瓣Top250的电影爬取下来，但没有结果，不知道程序错哪了？

你尚未登录，登录后可以

字节的 trae AI IDE 不支持类似 vscode 的 ssh remote 远程开发怎么办？

DataCap 中验证码无法显示，后台出现 NullPointerException 错误?

发现深拷贝和浅拷贝效果一致：请问一下有什么区别呢？

如何实现一个深拷贝函数？

Python 成员变量在多个子类实例间共享，如何避免？

分解质因素的算法很难，理解不了。 请问有哪位大佬可以进行解释一下呢？

为什么 Qwen2.5-Omni-7B 官方教程都报错 Cannot import available module of Qwen2_5OmniModel in modelscope ？

分解质因素的算法很难，理解不了。请问有哪位大佬可以进行解释一下呢？