请教为什么我爬的是空白文件

为什么我的爬取文件是空白的

我是想爬取大众点评的门店名及地址等信息

import requests
from bs4 import BeautifulSoup
import sys
import random
import time

base_url = 'https://www.dianping.com/sear...'
deep = 5

def get_html(url):

try:
    r = requests.get(url,timeout = 30)
    r.raise_for_status
    r.encoding = 'utf-8'
    return r.text
except:
    return 'Something Wrong'

def get_content(url):

lists_ = []
html = get_html(url)
soup = BeautifulSoup(html,'lxml')
info = soup.find_all('li',{'class':' '})
for i in info:
    list_ = {}
    try:
        list_['store_name'] = i.find('a',{'h4':' '}).text.strip()
        list_['url'] = i.find('a',{'target':' _blank'})['href']
        list_['addr'] = i.find('span',{'class':' addr'}).text.strip()
        lists_.append(list_)
    except:
        print('Something Wrong')
return lists_

def outfill(dict):

with open('JBS_Store.txt','a+',encoding='utf-8') as f:
    for list_ in dict:
        f.write('门店名：{}\t 门店地址：{}\t 门店URL：{}\n'.fomate(list_['store_name'],list_['addr'],list_['url']))
    print('爬取完成')

def main(baer_url,deep):

url_list=[]
for i in range(0,deep):
    url_list.append(baer_url+'/p'+str(i))
print('打印完成')

for url in url_list:
    content = get_content(url)
    outfill(content)
print('所有信息存储完成')

if name == '__main__':

main(base_url, deep)

阅读 3.2k

import requests from bs4 import BeautifulSoup base_url = 'https://www.dianping.com/search/keyword/3/0_%E9%9D%99%E5%8D%9A%E5%A3%AB/p{offset}' headers = { 'Accept': 'text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,image/apng,*/*;q=0.8', 'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/70.0.3538.77 Safari/537.3', 'Host': 'www.dianping.com', 'Cookie': '修改这里的Cookie' } deep = 5 def http_request(url): r = requests.get(url=url, headers=headers) r.encoding = 'utf8' return r.text def html_parse(html): soup = BeautifulSoup(html, 'lxml') info = soup.find('div', {'id': 'shop-all-list'}).find_all('li') return [{ 'store_name': i.find('div', { 'class': 'tit' }).find('h4').text.strip(), 'store_url': i.find('div', { 'class': 'tit' }).find('a').get('href'), 'store_address': i.find('div', { 'class': 'tag-addr' }).find('span', { 'class': 'addr' }).text.strip() } for i in info] def out(data): with open('JBS_Store.txt', 'a+', encoding='utf-8') as f: for i in data: f.write('门店名：{}\t 门店地址：{}\t 门店URL：{}\n'.format( i['store_name'], i['store_address'], i['store_url'])) def main(deep): for i in range(1, deep + 1): url = base_url.format(offset=i) html = http_request(url=url) data = html_parse(html=html) out(data=data) print('爬取完成') if __name__ == '__main__': main(deep=deep)

请教为什么我爬的是空白文件

为什么我的爬取文件是空白的

我是想爬取大众点评的门店名及地址等信息

你尚未登录，登录后可以

字节的 trae AI IDE 不支持类似 vscode 的 ssh remote 远程开发怎么办？

DataCap 中验证码无法显示，后台出现 NullPointerException 错误?

发现深拷贝和浅拷贝效果一致：请问一下有什么区别呢？

如何实现一个深拷贝函数？

Python 成员变量在多个子类实例间共享，如何避免？

分解质因素的算法很难，理解不了。请问有哪位大佬可以进行解释一下呢？

为什么 Qwen2.5-Omni-7B 官方教程都报错 Cannot import available module of Qwen2_5OmniModel in modelscope ？

请教为什么我爬的是空白文件

为什么我的爬取文件是空白的

我是想爬取大众点评的门店名及地址等信息

你尚未登录，登录后可以

字节的 trae AI IDE 不支持类似 vscode 的 ssh remote 远程开发怎么办？

DataCap 中验证码无法显示，后台出现 NullPointerException 错误?

发现深拷贝和浅拷贝效果一致：请问一下有什么区别呢？

如何实现一个深拷贝函数？

Python 成员变量在多个子类实例间共享，如何避免？

分解质因素的算法很难，理解不了。 请问有哪位大佬可以进行解释一下呢？

为什么 Qwen2.5-Omni-7B 官方教程都报错 Cannot import available module of Qwen2_5OmniModel in modelscope ？

分解质因素的算法很难，理解不了。请问有哪位大佬可以进行解释一下呢？