python新手求帮助

-- coding: utf-8 --

import scrapy
import codecs
import re

class SinaSpider(scrapy.Spider):

name = "sina"
fileout = codecs.open('sina.txt', 'a', 'utf-8')
allowed_domains = ["sina.cn"]
start_urls = (
    'http://sports.sina.cn/?vt=4&pos=108&vs=3',
)

def parse(self, response):
     type_list = response.xpath('//div[@class="carditems"]//a/@href').extract()
     global url,i
     for i in type_list:
        url=i
        print url
        yield scrapy.Request(i, callback=self.parse_item)
def parse_item(self,response):
    t= response.xpath('//section[@class="art_main_card j_article_main"]//h1//text()').extract()[0]
    strinfo = re.compile('\s')
    title=strinfo.sub('',t)
    leixing1=response.xpath('//nav[@class="sinaHead"]//li//text()').extract()[0]
    strinfo = re.compile('\s')
    type1=strinfo.sub('',leixing1)
    leixing2=response.xpath('//nav[@class="sinaHead"]//li//text()').extract()[1]
    strinfo = re.compile('\s')
    type2=strinfo.sub('',leixing2)
    type= type1 + '' + type2
    type2_list = response.xpath('//div[@class="comment-count"]//a//@href').extract()
    for b in type2_list:
         print b
         yield scrapy.Request(b,callback=self.parse2_item)
    self.fileout.write(
         title + '\001' + type + '\001' + comment
    )
    self.fileout.write('\n')
def parse2_item(self,response):
    global comment
    comment=response.xpath('//p[@class="center_tips"]//p//text()').extract()[0]

"E:\Program Files (x86)\python27\python.exe" E:/study/CX/python/rexx/sina.py sina

Process finished with exit code 0
这个问题怎么解决

这个爬虫想实现的爬去数据是将URL，也就是在parse中的i输出到文件中，并且将每个URL需要爬去的内容爬去出来。我现在爬去到的只是一个相同的URL，希望大神们帮忙解决

阅读 3.5k

python新手求帮助

-- coding: utf-8 --

你尚未登录，登录后可以

Qt中布局是否只有5种呢？

这段代码为什么不能获取到数据？

请问一下，如何理解reduce函数呢？

如何使用Python+Selenium爬取Goodreads上万条书评而不崩溃？

如何使用 python 代码实现迅雷磁力链接资源的下载？

在PyCharm开发不同python项目，如果每个项目使用自己的venv环境，是不是每次切换项目都需要修改python interpreter？

请问，FastAPI如何获取到前端上传的二进制文件并且返回？