保存item中的信息到本地文件
1.自定义以json格式保存到本地文件
piplines.py
再到settings.py中添加使用
2.scrapy自带方式以json格式保存到本地文件
piplines.py
再到settings.py中添加使用
保存item中的信息到MySQL(同步)
设计表结构
注意:日期是str类型,要转化成date类型
piplines.py
补充:settings.py
保存item中的信息到MySQL(异步twisted)
settings.py
MYSQL_HOST = '127.0.0.1'
MYSQL_DBNAME = 'spider'
MYSQL_USER = 'root'
MYSQL_PASSWORD = '123456'
piplines.py
去重写法
def do_insert(self, cursor, item):
my_sql = """
insert into youwu(url, url_object_id, title, big_image_url) VALUES (%s, %s, %s, %s) on duplicate key update title=values(title), big_image_url=value(big_image_url)
"""
cursor.execute(my_sql, (item['url'], item['url_object_id'], item['title'], item['big_image_url']))
**粗体** _斜体_ [链接](http://example.com) `代码` - 列表 > 引用
。你还可以使用@
来通知其他用户。