手把手教你进行Scrapy中item类的实例化操作

 

1、手把手教首先在爬虫主体文件中将Item模块导入进来,进行如下图所示。类例化

2、操作第一步的手把手教意思是说将items.py中的ArticleItem类导入到爬虫主体文件中去,将两个文件串联起来,进行其中items.py的类例化部分内容如下图所示。

3、操作将这个ArticleItem类导入之后,手把手教接下来我们就可以对这个类进行初始化,进行并对其进行相应值的类例化填充。首先去parse_detail函数下对其进行实例化,操作实例化的手把手教方法也十分简单,如下图所示。进行

4、类例化接下来,我们将填充对应的云服务器提供商值。实际上我们在之前通过Xpath或者CSS选择器已经获取到了目标数据,如下图所示,现在要做的就是依次填充目标字段的值。

5、我们可以像字典一样来给目标字段传值,例如item[“title”]= title,其他的目标字段的填充也是形如该格式,填充完成之后如下图所示。

其中,目标字段可以参考items.py中定义的item,这样可以加快填充的速度。

6、到这里,源码库我们已经将需要填充的字段全部填充完成了,之后我们需要调用yield,这点十分重要。再调用yield之后,实例化后的item就会自动传递到pipeline当中去。可以看到下图中的pipelines.py中默认给出的代码,说明pipeline其实是可以接收item的。

7、到这里,关于实例化item的步骤就已经完成了,是不是比较简单呢?我们后面把pipeline配置起来,一步一步的将Scrapy串起来。服务器租用

应用开发
上一篇:2、定期提交和投标域名注册。例如,益华网络点击“立即预订”后,平台会抢先为客户注册域名。当然,一个域名可能会被多个客户预订,所以出价最高的人中标。
下一篇:在众多公司中,如果我们必须选择一家可信的公司,那当然是信得过的。