![]() | 1 knightdf 2017-05-10 19:17:06 +08:00 pipeline 处理 item 应该是无序的,只是 pipeline 有权重高低顺序之分 |
![]() | 2 dsg001 2017-05-10 19:38:05 +08:00 使用 orderdict 排序吧 |
![]() | 3 zsz 2017-05-10 19:53:22 +08:00 pipelines 处理数据本身就是根据数据获取的顺序处理(流式),如果抓取的数据比较少,可以缓存到 cache 中,最后排序入库,不然还是直接入库,用 infoid 建立一个索引字段 |
![]() | 4 freestyle 2017-05-11 09:59:46 +08:00 sorted(item.items(), key=lambda i:i["infoid"]) |
![]() | 5 freestyle 2017-05-11 10:01:08 +08:00 4#回复错了 data = item.items() sorted(data, key=lambda i:i["infoid"]) |