python 非常简单爬虫问题

Question

python 非常简单爬虫问题

发布于
2018-07-08

新手上路，请多包涵

'''
parse 模拟 post
分析百度翻译
1：打开网页源代码
2：输入girl，输入一个letter有一个request
3：请求地址：http://fanyi.baidu.com/sug
4：发现formdata kw:girl
5:return 格式是 json==> need package json
'''


from urllib import parse,request
#manage json moudel

import json

'''
1:data 构造，然后urlopen打开
2：返回json style result
3：encode 'girl'
'''
baseurl = 'http://fanyi.baidu.com/sug'

# 存放form ==> dict style


data ={
    'ke':'girl'
}


#enode

data =parse.urlencode(data).encode('utf-8')#type -bytes
##encode string in 'utf-8'style== change style to bytes ,not change content


#request headed (include data_lenth)

headers={
    # post need content-lenth
    'Content-Lengh':len(data)

}

# we have request header ,try request
req=request.Request(url=baseurl,data=data,headers=headers)

rsp=request.urlopen(req)
json_data= rsp.read().decode('utf-8')

print(type(json_data))#str

#change style str to dict

json_data=json.loads(json_data)

print(type(json_data))#dict
print(json_data)

图片描述

python 网页爬虫前端

阅读 2.8k

1 个回答

得票最新

喔噢实验室

7115

发布于
2018-07-08

import requests
import json

url = 'http://fanyi.baidu.com/sug'
data = {'kw':'girl'}
res = requests.post(url, data=data)
content = json.loads(res.content.decode())
print(content)

图片描述

撰写回答

你尚未登录，登录后可以

和开发者交流问题的细节
关注并接收问题和回答的更新提醒
参与内容的编辑和改进，让解决方法与时俱进

推荐问题

相似问题

找不到问题？创建新问题

python 非常简单爬虫问题

你尚未登录，登录后可以

js 如何将Key属性相同的放在同一个数组？

字节的 trae AI IDE 不支持类似 vscode 的 ssh remote 远程开发怎么办？

DataCap 中验证码无法显示，后台出现 NullPointerException 错误?

请问开发React Native，一般是推荐哪个主流的UI库呢？

如何防止接口的 key 泄露?

在购买页面，这里有： for 1 month, for 3 months，这里说的意思是什么呢？

如何实现一个深拷贝函数？