Scrapy – 定义一个项目
描述
项目是用来收集从网站上报废的数据的容器。你必须通过定义你的项目来开始你的spider。要定义项目,请编辑目录 first_scrapy (自定义目录)下的 items.py 文件。 items.py 看起来像下面这样
import scrapy
class First_scrapyItem(scrapy.Item):
# define the fields for your item here like:
# name = scrapy.Field()
MyItem 类继承自 Item ,包含Scrapy已经为我们建立的一些预定义的对象。例如,如果你想从网站上提取名称、URL和描述,你需要为这三个属性分别定义字段。
因此,让我们添加那些我们想要收集的项目-
from scrapy.item import Item, Field
class First_scrapyItem(scrapy.Item):
name = scrapy.Field()
url = scrapy.Field()
desc = scrapy.Field()