![]() | 1 gjk1992 OP 当你选择一个商品的时候,如何查询出数据库中其他的同样商品的信息 ,通过单纯关键字肯定不行 .我浏览一个iphone5 32G 联通版 要给出已经采集到所有信息中的该商品 当然必须也是联通 也是 电信的就不能出现 |
![]() | 2 subpo PRO ![]() 这… |
![]() | 3 gjk1992 OP 我现在所想的是 重现建立自己网站的分类,然后设置产品信息大全,采集入库手动分类 |
![]() | 4 mlzboy 2013-01-04 02:41:26 +08:00 via Android 聚类 |
![]() | 5 takato 2013-01-04 10:32:47 +08:00 比价很大程度上需要人工去校正数据的。。 所以etao一开始的价格分类也较混乱。 |
![]() | 6 takato 2013-01-04 10:33:50 +08:00 ![]() 还记得之前电商大战etao临时出来过一个页面么,那个页面就是自动抓的结果。。你会发现各种神奇的不同SPU商品因为名字类似被聚合到一起的情况。。 |
![]() | 聚类根本解决不了商品聚合问题 @takato 说的是对的,机器抓取和基本得算法模型会导致不同SPU的被聚合,而且由于各个电商或者商家因为SEO得原因,把标题弄得乱七八糟,而商品本身属性(SKU)各个电商又不统一,很难做聚合比较,现在通用的方法就是先聚合,然后人肉分类 有专门的数据采集分类公司在做这样得事情,大公司直接买个更划算 |
![]() | 15 moplay 2013-01-05 10:46:32 +08:00 有etao在,比价还是省省吧,别浪费时间 |
![]() | 17 gjk1992 OP 每人了 |
![]() | 18 laoyuan 2013-01-18 11:21:31 +08:00 可以统一下词汇么,我称之为 归并。这个词来自图书馆界。 |