推荐算法求指导 - V2EX
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
tt67wq
V2EX    问与答

推荐算法求指导

  •  
  •   tt67wq 2018-09-10 11:34:10 +08:00 2604 次点击
    这是一个创建于 2589 天前的主题,其中的信息可能已经有所发展或是发生改变。

    公司在业务上一致像头条和拼多多看齐,

    现在我所在的产品线准备全面借(chao)鉴(xi)头条的应用

    boss 让我写个推荐算法,跟抖音一样能根据用户行为进行推荐(MB 的一个中年老男人玩什么的抖音???)

    TMD 我一个写写 CRUD 的沙雕怎么会那个?冒泡排序已经是我算法造诣的巅峰了

    有没有头条的爹能贡献点文档,或者有没有相关的博客能看看

    13 条回复    2018-09-11 11:01:45 +08:00
    murmur
        1
    murmur  
       2018-09-10 11:37:19 +08:00
    你得先归类啊
    然后就是最弱智的推荐了
    他只要看几次一个分类往后就无脑给他推这个分类就可以了
    别看论文吹的好
    国内的推荐都是这个吊样 尤其是某些音乐网站 你点一个收藏胜过你听 10 首歌
    所以难点就落到你怎么给你的内容分类了
    JeffKing
        2
    JeffKing  
       2018-09-10 11:44:31 +08:00 via iPhone
    简单点的是给每个数据人工标注,然后根据用户日常行为统计不同 label 的权重,再进行推送。 进一步的话,用无监督学习比如聚类啥的对数据进行归类,后续步骤相同,好处是不需要专家特征,并且能够挖掘出隐藏特征,推送更玄学一些。 另外还能根据业务需求定义特殊权重规则,举个栗子:据传闻加拿大某最大视频网站是根据用户浏览完某视频后关闭整个网站,给该视频赋予最大权重。手动狗头。
    zhusimaji
        3
    zhusimaji  
       2018-09-10 11:50:19 +08:00 via iPhone
    Baseline 算法可以参考 user based cf 深入的就要结合用户画像和推荐的物品关联组合一起推荐
    coderluan
        4
    coderluan  
       2018-09-10 11:52:08 +08:00
    专业基础还行的话,找本机器学习的书(《机器学习实战》?),看两章你就有思路了,先随便找个属性做下监督学习就行了。
    zhzer
        5
    zhzer  
       2018-09-10 11:55:11 +08:00 via Android
    最好还是让发布用户自己打 flag,然后作品热度推荐+浏览用户偏好推荐
    lg201
        6
    lg201  
       2018-09-10 13:01:33 +08:00 via Android
    LZ 请了解一下 k 最临近分类算法
    bucuoo
        7
    bucuoo  
       2018-09-10 14:00:04 +08:00
    1.通过"商品属性"对"商品"进行归类;
    2.通用户行为去划分用户群体;
    3.用力推。
    了解下基础的 K-means + Slope one
    Vespa
        8
    Vespa  
       2018-09-10 14:25:50 +08:00
    可以去看《推荐系统实践》这本书,入门还行。

    如果冷启动问题你们可以解决的话。。前期可以直接上最简单的 user-CF 或者 item-CF。。
    shoumu
        9
    shoumu  
       2018-09-10 14:35:20 +08:00
    https://36kr.com/p/5114077.html

    可以看看,但是估计比这个复杂得多
    MoonWander
        10
    MoonWander  
       2018-09-10 14:48:35 +08:00
    协同过滤是 baseline,这个能弄上线了效果就不会差多少了,之后的效果提升基本就是几个点几个点这样往上提升了
    thedog
        11
    thedog  
       2018-09-10 16:40:34 +08:00 via Android
    cf knn 搜这个关键词,作为 baseline
    Geraltt
        12
    Geraltt  
       2018-09-10 18:17:33 +08:00 via iPhone
    @JeffKing 某 pxxhub 手动滑稽。
    zzj0311
        13
    zzj0311  
       2018-09-11 11:01:45 +08:00 via Android
    算法都有现成的啊,调调库随便融合一下就足够交差了
    关于     帮助文档     自助推广系统     博客     API     FAQ     Solana     2739 人在线   最高记录 6679       Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 32ms UTC 12:14 PVG 20:14 LAX 05:14 JFK 08:14
    Do have faith in what you're doing.
    ubao snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86