【Python爬虫项目实战】Python爬虫批量下载网易云飙升榜音乐保存本地
前言
今天给大家介绍的是Python爬取音频数据并保存本地,在这里给需要的小伙伴们帮助,并且给出一点小心得。
开发工具
Python版本: 3.6.4
相关模块:
requests模块
re模块
os模块
环境搭建
安装Python并添加到环境变量,pip安装需要的相关模块即可。
爬虫基本思路分析
1.页面数据
浏览器中打开我们要爬取的页面
按F12进入开发者工具,查看我们想要的数据在哪里
这里我们需要页面数据就可以了
2.代码实现
1.发送请求
response = requests.get(url=url, headers=headers)
2.获取数据
print(response.text)
3.解析数据
info_list = re.findall( 'lio<a href="/song \?id=(.*?)"">(.*?)</a></li>',html_data)
for music, title in result:
music_url = f'http://music.163.com/song/media/outer/url?id={music}.mp3'
music_content = requests.get(url=music_url, headers=headers).content
4.保存数据
with open(filename + title + '.mp3', mode='wb') as f:
f.write(music_content)
print(title)
效果展示
最后
本篇介绍了主要使用 PyQt5
模块来请求数据,使用起来也是非常简单感兴趣的可以自己尝试一下。本篇源码已上传至公众号。
黑客Roman,公众号:Python工程狮。
👍🏻:觉得有收获请点个赞鼓励一下!
🌟:收藏文章,方便回看哦!
💬:评论交流,互相进步!
推荐阅读
【Python开发实战案例】Python开发实现疫情信息快速查看工具(附源码)
PyQt5是Qt框架的Python语言实现,由Riverbank Computing开发,是最强大的GUI库之一。PyQt提供了一个设计良好的窗口控件集合,每一个PyQt控件都对应一个Qt控件,因此PyQt的API接口与Qt的API接口很接近,但PyQt不再...
黑客Roman阅读 331
【验证码逆向专栏】某验二代滑块验证码逆向分析
本文章中所有内容仅供学习交流,抓包内容、敏感网址、数据接口均已做脱敏处理,严禁用于商业用途和非法用途,否则由此产生的一切后果均与作者无关,若有侵权,请联系我立即删除!
K哥爬虫阅读 504
【源码&库】在调用 createApp 时,Vue 为我们做了那些工作?
大家好,这里是田八的【源码&库】系列,Vue3的源码阅读计划,Vue3的源码阅读计划不出意外每周一更,欢迎大家关注。首发在掘金,如果想一起交流的话,可以点击这里一起共同交流成长系列章节:【源码&库】跟着 Vue3...
田八阅读 375
解决 xpath遇到特殊符号匹配不全信息的问题
最终输出(支只复制了最后一段):lLevel":"exhigh","pl":320000},"djid":0,"fee":0,"album":{"id":158052587,"name":"Sakana~( ˵>ㅿㅿ\n']正常来说 这个xpath语句 是匹配到一个完整的json形式数据 但是遇到了...
瑞0908阅读 374
【源码&库】Vue3 中的 nextTick 魔法背后的原理
所以我们想要拿到更新的后的DOM就上nextTick,想要在DOM更新之后再执行某些操作还上nextTick,不知道页面什么时候挂载完成依然上nextTick。
田八阅读 273
Flask 0.1 源码解读
执行 app.run() 便启动了 Flask 服务,这个服务为什么能够监听 http 请求并做出响应?让我们进入 run 函数内部一探究竟。
怀月阅读 189
源码阅读:go-zero的core/conf包
这个代码库主要用于加载和解析配置文件,支持 JSON、TOML 和 YAML 格式。主要功能包括从文件或字节数据中加载配置、填充默认值以及处理配置数据的键大小写。代码的主要结构和函数如下:
wric
**粗体** _斜体_ [链接](http://example.com) `代码` - 列表 > 引用
。你还可以使用@
来通知其他用户。