Scrapy CSVFeedSpider,本章介绍了CSVFeedSpider
类常用属性delimiter
,headers
,函数parse_row()
,以及CSVFeedSpider
的具体实例。
CSVFeedSpider 类
class scrapy.contrib.spiders.CSVFeedSpider
CSVFeedSpider
除了其按行遍历而不是节点之外,其他和XMLFeedSpider
十分类似,每次迭代时会调用函数parse_row()
- delimiter
在CSV文件中用于区分字段的分隔符,类型为string,默认值为逗号(‘,’)。 -
headers
一个列表,包含CSV文件中需要提取的字段名称。 -
parse_row(response, row)
该方法用于接收一个response
对象以及一个header
字段为键的字典。您也可以覆盖adapt_response
及process_results
方法来进行预处理和后处理。
CSVFeedSpider 示例
mydata.csv
内容显示如下:
运行程序,输出结果如下: