python 非常简单爬虫问题

新手上路,请多包涵
'''
parse 模拟 post
分析百度翻译
1:打开网页源代码
2:输入girl,输入一个letter有一个request
3:请求地址:http://fanyi.baidu.com/sug
4:发现formdata kw:girl
5:return 格式是 json==> need package json
'''


from urllib import parse,request
#manage json moudel

import json

'''
1:data 构造,然后urlopen打开
2:返回json style result
3:encode 'girl'
'''
baseurl = 'http://fanyi.baidu.com/sug'

# 存放form ==> dict style


data ={
    'ke':'girl'
}


#enode

data =parse.urlencode(data).encode('utf-8')#type -bytes
##encode string in 'utf-8'style== change style to bytes ,not change content


#request headed (include data_lenth)

headers={
    # post need content-lenth
    'Content-Lengh':len(data)

}

# we have request header ,try request
req=request.Request(url=baseurl,data=data,headers=headers)

rsp=request.urlopen(req)
json_data= rsp.read().decode('utf-8')

print(type(json_data))#str

#change style str to dict

json_data=json.loads(json_data)

print(type(json_data))#dict
print(json_data)


图片描述

阅读 2.7k
1 个回答
import requests
import json

url = 'http://fanyi.baidu.com/sug'
data = {'kw':'girl'}
res = requests.post(url, data=data)
content = json.loads(res.content.decode())
print(content)

图片描述

撰写回答
你尚未登录,登录后可以
  • 和开发者交流问题的细节
  • 关注并接收问题和回答的更新提醒
  • 参与内容的编辑和改进,让解决方法与时俱进
推荐问题