這兩天看Scrapy,看到item這個東西,覺得有點抽象,查了一下,有點明白了。
Item 是保存爬取到的數據的容器;其使用方法和python字典類似, 並且提供了額外保護機制來避免拼寫錯誤導致的未定義字段錯誤。
爬取的主要目標就是從非結構性的數據源提取結構性數據,例如網頁。 Scrapy提供 Item 類來滿足這樣的需求。
Item 對象是種簡單的容器,保存了爬取到得數據。 其提供了 類似於詞典(dictionary-like) 的API以及用於聲明可用字段的簡單語法。
來源於:
http://scrapy-chs.readthedocs.org/zh_CN/latest/intro/tutorial.html#item
http://blog.csdn.net/iloveyin/article/details/41309609