从日进斗金到折戟沉沙:一个神秘家族的覆灭 - V2EX
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
Recommended Services
Amazon Web Services
LeanCloud
New Relic
ClearDB
yvonneday
V2EX    云计算

从日进斗金到折戟沉沙:一个神秘家族的覆灭

  •  
  •   yvonneday 2016-11-14 16:06:48 +08:00 5753 次点击
    这是一个创建于 3259 天前的主题,其中的信息可能已经有所发展或是发生改变。

    在近年来大火的互联网领域,有一个非常神秘的组织。曾几何时,他们一度无孔不入、爪牙遍地、仅仅一年就能吸金数百亿;然而最近一系列黑科技的推出,却让他们的境遇急转直下、处处受挫。

    究竟是什么样的黑科技,让红极一时的他们风光不再?笔者通过秘密途径多方打探,终于掌握到了这个神秘组织最后一次高层会议的内幕。

    一年吸金 900 亿的神秘家族

    一个月黑风高的夜晚,某栋别墅灯光昏暗的地下室里,五个人正在秘密商议着什么。

    为首的是一个坐在阴影中的光头胖子,也是这个神秘组织 Spam 家族的首领,大家都称他为 S 总。围坐在 S 总周围的四兄弟,则是家族里最得力的四大金刚,分别是广小告、黄小文、黄小图、黄小片。

    广小告:“没想到最近风声这么紧,老谣、大暴、小恐竟然都先后进去了。”

    黄小文接下话茬:“是啊,要说最近这形势也变得太快了,今年上半年咱们还数钱数到手抽筋呢。”说到这里,他忍不住又看了一眼墙上那张醒目的剪报,剪报上的标题赫然写着:“过去一年互联网垃圾造成经济损失超 900 亿元!”

    黄小图不无怀念地读起了这则报道:“根据中国互联网协会发布的《中国网民权益保护调查报告( 2016 )》,从 2015 年下半年到 2016 年上半年,短短一年时间内,我国网民因垃圾信息、诈骗信息、个人信息泄露等遭受的经济损失高达 915 亿元。”

    黄小片打断说,“停停停,别说这些没用的,兄弟们该做点啥了。 S 总,您说我们下一步应该怎么行动,才能搬回一局呢?”

    S 总沉默良久,缓缓答道:“现在道上的生意越来越难做,听说好多公司都请了第三方的安保服务来防范我们。不过老夫已有盘算,就凭他们现在的水平,还奈何不了咱们。只要按我的计划,三天之后就能让兄弟们回复从前的风光!”

    无处不在的 Spam 四大金刚

    看到这里,想必不少聪明的读者都已经明白了,这个神秘的 Spam 家族其实就是互联网内容垃圾。自从 1978 年第一封垃圾邮件诞生之后,这个家族就开始迅速繁衍并以惊人的速度扩张,如今已发展出垃圾广告、色情图片、色情视频、网络谣言、暴恐信息等众多分支,其中广小告、黄小文、黄小图、黄小片是该家族的四大主力,而前面提到的老谣、大暴、小恐,则是谣言、暴恐等信息。

    广小告、黄小文、黄小图、黄小片之所以能够成为 Spam 家族呼风唤雨的四大金刚,原因就在于其势力庞大、几乎无处不在。从新闻资讯到图片社区、社交应用,从影音娱乐到视频直播、网络游戏甚至是电商平台,到处都留下了他们兴风作浪的身影。他们 7×24 小时不停歇地发布各种垃圾信息,不仅让互联网产品的内容运营深陷没完没了的监测苦海,也让许多不堪其扰的用户怨声载道、苦不堪言。

    今年以来,为了应对层出不穷的互联网内容垃圾,彻底把这四大金刚拒之门外,已经有不少明智的互联网企业纷纷开始寻找帮手,借助先进的智能反垃圾服务取得了阶段性进展。 后面的事情大家都知道了,随着越来越多企业反垃圾意识的增强,四大金刚最近可谓丢盔卸甲、损兵折将,于是便有了文章开头的那一幕。

    七十二变,难过智能文本监测

    按照 S 总的计划,秘密会议后的第一天,广小告就来到了几个垂直社区,打算大举反攻。 作为 Spam 家族的元老,广小告一出手选择了春雨医生、网贷之家这两大社区。他得意洋洋地打着如意算盘,俗话说,中国人都怕两件事:“有什么别有病,没什么别没钱。”因此在这样的社区散布垃圾广告,往往都是一出手一个准。

    没想到刚一露面,广小告就遭遇了沉重打击。原来,为了防范广小告的骚扰,春雨医生和网贷之家都不约而同地请来了同一家救兵网易易盾。凭借网易 19 年来积累的海量样本特征库,以及在人工智能、大数据等领域的尖端技术、网易易盾不仅能够实现广告过滤、智能鉴黄、暴恐识别、谣言排查等功能,而且还可以检测识别文本、语音、图片、视频等多种互联网垃圾信息。广小告发布的大批垃圾广告文本,刚刚一冒头就被网易易盾轻松秒删了。 气急败坏的广小告咬牙放出了大招:我变我变我变变变!看你怎么识别?

    只见广小告接连扔出了发票的一系列形近字:(发||拨)(票|栗|粟|溧|镖|膘|骠|鳔||||||||||),以及花(拼)票等音近字。不过他没有想到的是,不同于传统的关键词技术和规则引擎,网易易盾的智能文本过滤采用了语义分析等深度学习技术,并结合大数据分析,可以轻松应对各种垃圾信息的变种,其识别文本垃圾的准确率可以达到 99.8%,广小告和他的变体们使尽浑身解数,仍然难逃全军覆没的结局。

    智能鉴黄, 0.12 秒即刻分清

    吸取了广小告轻敌的教训之后,第二天, Spam 家族又派出了手段更为高明的黄小图,势要扳回一城。

    为了保险起见,黄小图选择了自己以往建功立业的社交应用斗图神器和足记,还释放了大规模杀伤性武器海量小黄图。黄小图胜券在握地想,以自己老司机开车的速度,网站的人工鉴黄师小明怎么可能忙得过来?

    然而让黄小图始料不及的是,自己的海量小黄图才刚刚发出,就全被秒删。鉴黄师小明什么时候变得这么厉害了?!

    震惊中的黄小图万万没想到,他遇上的不是老对手小明,而是网易易盾这个劲敌。网易易盾的智能鉴黄云服务可实现精准审核过滤,不但单张图片最快响应时间仅为 0.12 秒,而且准确率高达 99.8%以上。除此以外,网易易盾( http://dun.163.com/)还支持人像识别、动漫识别、图片旋转剪裁识别等多种功能,其图片智能鉴黄审核效率远远高于人工识别,可有效降低 80%以上的人工成本,为互联网企业节省大量垃圾信息审核的开支。自从有了这个分分钟解放鉴黄师的利器,就连网站的鉴黄师小明最近都无事可做,干脆转岗做了销售。

    侥幸逃脱的黄小图在得知真相后,顿时哭晕在厕所。

    最后决战:视频直播平台

    第三天,恼羞成怒的 S 总倾巢出动,派出了黄小文、黄小图、黄小片团伙作战。

    “悄悄地进村,打枪的不要。”三兄弟故意趁着凌晨时分,来到了 Bobo 直播等视频直播网站。因为影音娱乐、视频平台的垃圾信息往往具有突发性、密集性等特点,所以视频反垃圾一直都是业界公认的难点,这也成为了 Spam 家族最为得意的决战地点。

    刚一落脚,黄小片便主攻发布色情视频,黄小文和黄小图则作为辅助,攻占用户头像、昵称等阵地,就连弹幕也不放过。

    然而一阵忙碌之后,等待三兄弟的还是被秒删的命运。原来活该这三兄弟倒霉,他们遇到的是网易易盾专门为视频直播行业打造的反垃圾解决方案。

    针对视频涉黄的识别,网易易盾( http://dun.163.com/)研发了先进的特征提取算法,并运用了先进的图像鉴黄路线和视频语义鉴黄路线相结合的方式,前者可以实现将视频中一帧帧的图像去做图像的鉴黄分析;后者则更加厉害,可以将视频中的场景、人物动作等等进行建模,从场景语义理解的角度识别视频中的人物在做什么,从而做到智能鉴黄识别。至于黄小文和黄小图,则输在了网易易盾强大的文本、图像识别能力,其能实现对头像、昵称等用户公开信息进行检测识别、分类处理,从而深度解决视频直播平台的反垃圾需求。

    另外令三兄弟百思不得其解的是,他们特意选择了夜深人静的凌晨时分作案,居然还是全军覆没,难道网易易盾的工作人员 24 小时都不休息?原来,为了保障反垃圾突发情况的及时处理,网易易盾专业运营团队还提供了 7×24 小时巡检服务,以随时快速相应企业的需求。

    第四天,见势不妙的 S 总选择了携款潜逃,空荡荡的别墅里只留了一张纸条:“网易易盾有 19 年的反垃圾经验,支持单日亿级别数据量的反垃圾运算能力。惹不起,躲得起,各位还是先避避风头吧。”

    20 条回复    2016-11-15 13:49:53 +08:00
    ChiangDi
        1
    ChiangDi  
       2016-11-14 16:14:41 +08:00 via Android
    这个广告不错,可以试用吗,找找黄图
    we000
        2
    we000  
       2016-11-14 16:17:42 +08:00   3
    太长, 懒得看
    cooka
        3
    cooka  
       2016-11-14 16:22:35 +08:00
    这*装得不错, 多了很多细节在里面, @aliyun
    zz
        4
    zz  
       2016-11-14 16:28:03 +08:00
    @aliyun 是? 你们装 BI 装得又大又深啊
    lhx2008
        5
    lhx2008  
       2016-11-14 16:28:41 +08:00 via Android
    鉴黄挺有意思的
    jy02201949
        6
    jy02201949  
       2016-11-14 16:38:14 +08:00
    这广告的链接把整段文字都包含进去了,也是拼
    jy02201949
        7
    jy02201949  
       2016-11-14 16:41:35 +08:00
    试了一下文本识别率还不错
    ethankoo
        8
    ethankoo  
       2016-11-14 16:42:46 +08:00
    黄易打这个广告真的好么 2333
    SeaOverflow
        9
    SeaOverflow  
       2016-11-14 16:49:40 +08:00
    话说一直在说产品可以除广告,却不知自己也是属于“广小告”。这听起来很喜感,这个产品可以把自己的这个广告去除掉么?
    ichubei
        10
    ichubei  
       2016-11-14 16:49:48 +08:00 via Android
    百度贴吧黄语音广告很多
    w88975
        11
    w88975  
       2016-11-14 17:07:40 +08:00
    ![ ]( )

    网易老司机
    liuyq
        12
    liuyq  
       2016-11-14 17:20:58 +08:00
    怎么感觉这个内容看过啊,广告都抄?
    lrh3321
        13
    lrh3321  
       2016-11-14 18:04:18 +08:00
    @jy02201949 估计是因为错用了全角的括号
    est
        14
    est  
       2016-11-14 18:16:11 +08:00
    @w88975 蛤蛤蛤蛤。
    anuxs
        15
    anuxs  
       2016-11-14 21:54:48 +08:00 via iPhone
    有没有举报按钮?写的差。还是个广告。
    mingyun
        16
    mingyun  
       2016-11-14 23:19:01 +08:00
    记得阿里云也有个鉴黄接口
    twomoe
        17
    twomoe  
       2016-11-14 23:40:24 +08:00
    @anuxs 页面下方“报告这个主题”
    JamesMackerel
        18
    JamesMackerel  
       2016-11-15 07:49:04 +08:00 via Android
    看这个广告的时候感觉蜜汁尴尬。
    zqiyun
        19
    zqiyun  
       2016-11-15 08:00:43 +08:00
    中二病又范了
    KingHL
        20
    KingHL  
       2016-11-15 13:49:53 +08:00
    又臭又长
    关于     帮助文档     自助推广系统     博客     API     FAQ     Solana     2876 人在线   最高记录 6679       Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 47ms UTC 00:18 PVG 08:18 LAX 17:18 JFK 20:18
    Do have faith in what you're doing.
    ubao msn snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86