抓取下的unicode编码转urlcode

    articles=response.css("#content > article:nth-child(5) p")
    sgg="";
    for item in articles:
        sgg = sgg+item.extract()
    data=urllib.urlencode({ 'title':title ,"describle":describle,"article":sgg} );

我想把sgg+item.extract() 转换为字符串.转换为urlcode.发送出去.

不过我碰到问题是这个

articles=response.css("#content > article:nth-child(5) p")

    for item in articles:  print (  type(item.extract()) )

输出
<type 'unicode'>

所以如果

data = {

'title': title,
'describle': describle,
'article': article

}

print urllib.urlencode(data);

就报错了

阅读 3.6k
1 个回答

不知道你说的高效是啥,贴上可读性好一点的代码

articles = response.css("#content > article:nth-child(5) p")

article = ''.join([_.extract() for _ in articles])
data = {
    'title': title,
    'describle': describle,
    'article': article
}

print urllib.urlencode(data);

你再结比一下这段代码

import urllib

data = {
    'title': '标题',
    'describle': 'abc',
    'article': u'中文'.encode('utf-8')
}

print urllib.urlencode(data);
撰写回答
你尚未登录,登录后可以
  • 和开发者交流问题的细节
  • 关注并接收问题和回答的更新提醒
  • 参与内容的编辑和改进,让解决方法与时俱进
推荐问题