如何根据商品名称对商品进行分类 - V2EX
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
funcookies
V2EX    问与答

如何根据商品名称对商品进行分类

  •  
  •   funcookies 2020-08-23 17:10:55 +08:00 1741 次点击
    这是一个创建于 1876 天前的主题,其中的信息可能已经有所发展或是发生改变。
    分类标准是现成的,不过标准给的只有类别名,和一些关键词。
    例如: 移动通讯设备分类,关键词有手机。无机盐分类,关键词有氯化钠等。


    有一些数据可以使用,不过有以下问题
    1.分类质量不稳定,比如木炭,有的数据中分类是正确的,有的数据中就错误的归到煤炭。
    2.商品种类局限性,有些东西数据量很小或者根本没有。
    3.商品名称不规范,比如同样一款手机,有的数据是 Note8,有的数据就是 note 8.

    目前能想到的就是对数据进行统计,同一种的东西哪个分类的数据多,就判定为那个分类。不过商品名称不规范,估计会有很多坑,而且遇到新东西就没法分类。

    希望听听大家有什么好的思路或者建议。
    4 条回复    2020-08-23 19:51:37 +08:00
    imn1
        1
    imn1  
       2020-08-23 18:47:14 +08:00
    这个其实挺适合深度学习的
    murmur
        2
    murmur  
       2020-08-23 18:57:33 +08:00
    我想问一下楼主的需求是什么,你从京东来看,那么多要录入的信息,又是介绍又是型号,起名就是个大学问,选分类相比之下几乎就没工作量
    imn1
        3
    imn1  
       2020-08-23 19:25:37 +08:00
    @murmur
    我觉得楼主是平台方,不是进驻商家,需求就是纠正商家失误或滥用的分类选择

    我以前遇到过类似的,(非电商)平台要求进驻商家预报几个大类,及下面若干小类,只要商家在这些类别有销售许可,平台不会太理会商家怎么分类。但遇到超出范围,需要另外申请,或者出现故意把范围外商品报在范围内,会处罚。因为工商会抽检,出现问题会影响平台利益
    funcookies
        4
    funcookies  
    OP
       2020-08-23 19:51:37 +08:00 via iPhone
    @imn1 emm 。这个感觉需要比较长时间,目前只有一点 python 基础。
    @murmur 信息的录入是对我来说不可控,收到的数据可能是任何东西,有些分类是对的,有些是故意误导的。需要对所有东西进行正确归类,找出哪些数据的提交者在作怪。
    @imn1 和这个需求差不多,分类最后核心用途就是比对这个商家销售不符合经营范围或者他根本没有的商品。
    关于     帮助文档     自助推广系统     博客     API     FAQ     Solana     2717 人在线   最高记录 6679       Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 25ms UTC 12:19 PVG 20:19 LAX 05:19 JFK 08:19
    Do have faith in what you're doing.
    ubao snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86