
怎么鉴别平胸妹子?我试图把平胸妹子标记为黄图,但是会误伤没穿上衣的汉子啊,怎么办呢?
1 ballshapesdsd 2018-01-09 12:16:26 +08:00 求训练数据 |
2 zhouyou457 2018-01-09 12:18:09 +08:00 via iPhone 先训练性别识别? |
3 am241 2018-01-09 12:18:33 +08:00 训练一个鉴别男女的网络? |
4 xwhxbg OP |
5 Cytion 2018-01-09 12:21:27 +08:00 via Android 我觉得吧……还有可能误伤到富有胸肌的汉子 |
6 gabon 2018-01-09 12:22:58 +08:00 via Android 人眼看到能轻易的分辨出来吗,如果太平人都不好分辨机器应该也不容易吧。 |
7 zhouyou457 2018-01-09 12:28:26 +08:00 via iPhone @xwhxbg 说实话,现在性别识别难度还是有的,正常人都会有识别错误的时候... |
8 suzic 2018-01-09 12:28:40 +08:00 via Android 试试把喉部的鉴定加上? |
9 xwhxbg OP @Cytion 这个。。。测试样本里没有,回头试试 @gabon 理论上可以从脸型啥的分辨性别,没露脸就没办法了 @zhouyou457 就是要发现人眼看不出来的规律~ @suzic 这个思路可以有,不过正面看可能不是很明显 |
10 Nirvanada 2018-01-09 12:34:24 +08:00 via Android 可以从 nipple size detection 的角度考虑下 男女大小还是差很多的 |
11 des 2018-01-09 12:36:08 +08:00 via Android 后排说一句,凭什么妹子不穿上衣就是黄图,汉子就不是了! 不穿衣服的都判定为黄图不行吗? |
12 qdwang 2018-01-09 12:39:54 +08:00 via iPhone 其实理论上有的情况是无法鉴别的,比如男的化妆成女的,裸上身,怎么叛别 |
13 qdwang 2018-01-09 12:40:37 +08:00 via iPhone 考虑从骨骼角度,法医分析方向 |
16 zhouyou457 2018-01-09 12:53:25 +08:00 via iPhone @xwhxbg 我在想,可不可以根据欧派大小来动态调整被 ban 几率...我估计太小的欧派也没多少人喜欢吧 :doge |
17 xwhxbg OP |
18 xwhxbg OP @zhouyou457 目前的结果是平胸妹子没穿上衣的话,SFW 评分大约有 0.57 左右,0 是 NSFW,1 是完全 SFW,严格的平台可能 SFW 低于 0.7 就不行了,不是那么严格的话其实 0.5 以下才会被判断为黄图 |
19 xwhxbg OP 大家可能有点误会了,深度学习想指定某个特质去判别是比较困难的,目前我的水平只能通过操作样本空间来实现分类 简单说,如果一个妹子的胸平到跟男生没差别,或者一个男孩子有个妹子的胸,深度学习都没法识别的 |
20 supercaizehua 2018-01-09 13:05:01 +08:00 via Android 我记得以前看过帖子说百度网盘和 YouTube 都是通过音频检测叫床声来做的 |
21 shintendo 2018-01-09 13:20:16 +08:00 |
22 takato 2018-01-09 13:21:45 +08:00 via iPhone 如果先不打标签会形成怎样的聚类效果呢? |
23 x86 2018-01-09 13:25:28 +08:00 哈哈,昨天在贴吧看到个图片签名,挂鱼三骚上次直播事故截图,平胸没给鉴黄图屏蔽掉 |
24 watzds 2018-01-09 13:28:33 +08:00 via Android 你要相信深度学习的能力!它会区分两者的。 |
25 zthxxx 2018-01-09 13:29:12 +08:00 @xwhxbg 那么这有个问题,可♂爱的男孩子穿女装 lo 裙戴假发美瞳,下着穿得好好的,露着上身胸肌,有明显喉结,这样算黄图吗? (手动滑稽 |
27 huijian222 2018-01-09 13:45:46 +08:00 在特征中加入脸部信息 不过那种人眼都看不见出来的就算了吧。。 |
28 xwhxbg OP |
29 deadseven 2018-01-09 14:04:03 +08:00 Talk too much,just show me your code. |
30 lucifer9 2018-01-09 14:06:26 +08:00 这个没明确标准的,别追求那么准确了 没准儿明天男人也不让露胸了 |
32 nandaye 2018-01-09 14:18:49 +08:00 via Android 如果是两个男的呢?不能光考虑女性啊 |
33 xwhxbg OP |
34 Jouleken 2018-01-09 14:31:56 +08:00 1. 乳头的面积在整个胸部的占比可以作为判断之一; 2. 乳头的面积和乳晕的面积占比也可以作为判断之一; 3. 有胸毛的可以排除是女性,有胸毛的女性几率极小; |
36 xomix 2018-01-09 14:38:23 +08:00 分不清,如果产品胡搅蛮缠,你就在大会上拿出: 平而且汉子脸的妹子 妹子脸的汉子 女装大佬 让产品识别,多找几张,产品识别失败就告诉他,人都很难识别,别说机器了。 |
37 bravecarrot 2018-01-09 14:40:10 +08:00 求训练数据+1 |
38 yksoft1 2018-01-09 15:05:49 +08:00 话说就怕把 12-13 左右的男孩子给鉴别成少女 |
39 Jimmy1573 2018-01-09 15:09:23 +08:00 从 nipple size 下手 ←_← |
40 learnshare 2018-01-09 15:09:25 +08:00 人能辨别的特征就能够让机器学习到 |
41 xwhxbg OP |
42 em84 2018-01-09 15:57:58 +08:00 没穿衣服的汉字就不是黄图了吗 |
43 supercaizehua 2018-01-09 16:08:17 +08:00 via Android @xwhxbg 标注数据集是一件很幸苦的事情,工作量大,吃力不讨好,为你点个赞 |
44 Lax 2018-01-09 16:13:04 +08:00 对深度学习了解不多。但是那些朋友说要针对某个 /某几个特征去做判定规则,感觉深度学习不是那种思路。 |
45 xwhxbg OP @em84 Nope @supercaizehua 确实,不过我这个还好,我做了个小 APP,左滑黄图,右滑不黄,有个 X 可以后悔,平时上班路上就可劲儿滑。。。 @Lax 可以把有这个特征的单独标记成一类,然后先跑鉴黄,再跑 softmax 分类,不一定是一个模型就全搞定了 |
46 CloudnuY 2018-01-09 16:43:14 +08:00 直接把所有 RT 加上小爱心,管他男的女的 |
47 shintendo 2018-01-09 16:57:30 +08:00 如何定义尺度呢,毕竟有大量的图片介于黄和不黄之间,取决于看的人的主观判定 |
48 takato 2018-01-09 17:02:09 +08:00 @Lax 是的,如果从术语上将,那些人说的是“符号主义”,在深度学习兴起之前是主流。 深度学习兴起之后,普遍认为“联结主义”更符合现实。 |
49 allenlee7c9 2018-01-09 17:10:35 +08:00 via Android @xwhxbg 上班路上在那可劲儿划拉一堆黄图不会被当作变态么 |
50 lyusantu 2018-01-09 17:19:13 +08:00 上有政策,下有对策 |
51 monnand 2018-01-09 17:24:15 +08:00 via Android 我也想提一个严肃的问题,gay, ts, shemale, ladyboy 这些系列就不在考虑范围吗? |
52 xwhxbg OP |
53 takato 2018-01-09 18:07:53 +08:00 |
54 allgy 2018-01-09 18:11:38 +08:00 识别喉结? |
55 param 2018-01-09 18:13:31 +08:00 via Android 为什么同样的照片,男性就算是“黄”,而不行就不能算是“黄”呢?难道只允许男性裸露上身,女性裸露上身就算是“黄”了? |
56 rswl 2018-01-09 18:17:13 +08:00 一般宁杀错 |
57 param 2018-01-09 18:19:42 +08:00 via Android 黄不黄的标准,看有没有性描述、挑逗等等,更加合理。单纯赤裸上身算什么黄图。 |
58 zingl 2018-01-09 20:34:04 +08:00 试图从技术层面解决一个不符合基本逻辑的问题:汉子裸胸 OK,妹子裸胸涉黄 |
59 WildCat 2018-01-09 20:50:32 +08:00 via iPhone 其实还有汉子的胸更大的情况吧 |
60 singer 2018-01-09 23:01:57 +08:00 via iPhone 胸宽。点宽。比例。你试试? |
61 Trim21 2018-01-09 23:07:28 +08:00 既然男女的标准不一样,就先判断性别... |
62 akira 2018-01-09 23:38:59 +08:00 一堆男的有 B 兆杯 |
63 alvinbone88 2018-01-09 23:52:17 +08:00 如果要识别性别的话,可以考虑计算手、脚的大小,腰围,臀围以及大腿,有可能还要加上面部识别 一般来说,男的手脚相对来说大一些,腰也会比女的要粗;男的大腿和臀部没有女的那么丰满 最后问一句,楼主的算法能识别 gay 片不? |
64 des 2018-01-10 00:12:46 +08:00 via Android @alvinbone88 怎么,你想借一部说话么? |
65 Faiz555 2018-01-10 00:17:49 +08:00 如果是胖子怎么办,不是平胸呢 |
66 alvinbone88 2018-01-10 00:25:11 +08:00 @des #64 不不不,纯粹是好奇 |
67 orvice 2018-01-10 00:30:46 +08:00 有时候路上都会和朋友讨论下刚刚走过去的是男还是女- - 机器更不知道了 233 |
68 shiyouming91 2018-01-10 04:52:25 +08:00 via iPhone 求训练数据顺便求 block |
69 shakespark 2018-01-10 08:48:15 +08:00 @alvinbone88 出门右转 500 米就到 pornhub |
70 shakespark 2018-01-10 08:48:46 +08:00 @shiyouming91 为啥要自求 block |
71 VicYu 2018-01-10 09:08:54 +08:00 乳头间距和肩宽,有一个比例,男女的值不一样 帮你找找当时的数据,14 年做的,有点困难 |
72 northisland 2018-01-10 09:22:56 +08:00 既然都做了这么事儿逼的项目了,标准当然设的严一点啊 做了这种项目,就比较类似临时工,关键时刻给内容审查、精神文明顶雷的。要有觉悟 |
73 northisland 2018-01-10 09:29:49 +08:00 |
74 wildlynx 2018-01-10 09:42:23 +08:00 不是“宁可错杀千个,不可放过一个”吗? |
75 mcone 2018-01-10 09:44:47 +08:00 楼主你到底之前做过这个方向吗?看了一遍你的回复,我觉得你不太像是遇到问题求助,而是试图通过大家来入门这项工作;如果我判断错的话,我觉得你可能需要重新理一下你的思路 我室友两年前做过这个,还发了一篇 ccfc 的垃圾会议,一个求数据的都被你屏蔽掉,我也是非常不理解,这一块真的没有像样的公开数据集,你的数据怎么来的,除非是自己抓的,不然难道没有自带 label ?至少作为甲方,乙方难道没有一个大致的需求进一步来细化某些问题(是否区分男女,图片是否露脸等)? 另外,看你多次提到 open-nsfw,我由于室友的关系也接触过这个,只想说啊……尽信书不如无书。如果这句话做不到的话,那就尽信书别求创新就行了,至少自己不会把自己推入一个看似努力但是没什么卵用的大坑 |
76 xwhxbg OP @alvinbone88 不能。。。ish,我的样本没有那么丰富 T T @shiyouming91 左转 metart,我数据在那爬的 @northisland 是啊,我都想设置 0.3NSFW 就屏蔽了。。。 @mcone 我没做过这个方向,而且以前是前端来着。。。赶鸭子上架了,开口求数据的几位同学我观察了一下,可能单纯就是求黄图的,我的数据是 metart 上抓的,然后手动分类,训练集 1500 黄图,1500 不黄的,没得甲方,产品爸爸提的需求,不关心我怎么实现。open-nsfw 主要提供参考,我是用的 TensorFlow,它用的 Caffe,不过它的 loss 函数和激发函数都很有价值。这方面的书我基本没看过,有啥推荐的么,目前在看 andrew ng 的课,比较基础。 |
77 xwhxbg OP 感觉大家对深度学习有点误会,类似于体征比如 cup 这样的数据从图上面是得不到的,除非你有人家体检的数据 总结了一下各个楼层的回答,目前看来比较可行的是通过无监督学习先去分类,然后看看哪些类是黄图。 其余的方法,比如测量 nipple 的大小是基本不可行的,图的像素分布并不能决定这个,除非能有体检的数据 另外我是真的很水啊,我以前是前端来着,深度学习是因为产品爸爸有需求,然后公司又不大,所以我就来做了 到今天我还在看人家的视频 tutorial 呢。。。 |
78 mcone 2018-01-10 10:14:01 +08:00 @xwhxbg 难怪,看你回复感觉就不是做这个的…… 没有甲方就去问产品爸爸吧,让他把需求进一步细化,你的疑问都丢给他过一遍再说。另外,你这正负样本加起来才 3k …………你让产品爸爸想办法在数据集后面加两个 0 吧,最起码加一个 0 然后用 svm 之类的简单分类器;不然要么放弃训练只拿别人模型做测试,结果随缘,要么让这个 PM 滚…… 另外,如果赶鸭子上架的话,如果不是时间特别宽裕个人建议别看 dl 的课程了,学完了你也会发现在应用中没啥大用(实际工业中几乎都是掉包侠,谁管你反向传播公式怎么推)。真想看的话,找一本统计机器学习的书从基础慢慢啃,DL 理论上主要就是数学基础+网络拓扑两部分 |
79 Raidal 2018-01-10 10:15:54 +08:00 训练识别脸也越来越难,现在很多小男生脸部特征越来越像女生,:)逃 |
80 auhah 2018-01-10 10:16:36 +08:00 学会拒绝产品的不合理需求 |
81 capo 2018-01-10 10:19:23 +08:00 深度学习的话想把模型往某个方向调整,可以试着自己主动在样本里加一些符合该方向的例子,如你放一些没穿上衣的汉子以及一些平胸妹子,调调参让模型自己拟合玩去就行了。当然如果放太多了也会影响模型的中心思想,因为可能过分违背了真实分布。 |
82 gleymonkey 2018-01-10 10:22:11 +08:00 双性人怎么办,大萌妹。 |
83 xwhxbg OP |
84 ELLIA 2018-01-10 10:36:21 +08:00 你这是涉嫌歧视平胸女性啊!暗讽他们是汉子!应该予以封号! |
85 dbsquirrel 2018-01-10 10:40:48 +08:00 via iPhone 才 3000 数据量太少了。。。 这做出来肯定分类结果不好 建议先多收集数据 |
86 aaronzjw 2018-01-10 10:53:23 +08:00 求数据,我感觉应该可以用 GAN 做个模型,吧平胸变成 BCDEF |
87 xomix 2018-01-10 11:32:36 +08:00 我在跟你加一个恐怖的分类怕你人工都不想识别。 胖子和比较胖的孕妇裸露上身。 想想我都觉得可怕。 |
88 EyreFree 2018-01-10 11:35:50 +08:00 求问怎样识别女装大佬... |
89 carmark 2018-01-10 11:38:57 +08:00 |
90 nullcoder 2018-01-10 11:40:08 +08:00 3000 的数据量。。。。 你确定你入门了吗? mcone 的回复很中肯了。 另外如果某一类可能误杀( false positive ),就应该增大这类数据在训练集的比重。 |
91 boileryao 2018-01-10 11:41:44 +08:00 via Android A Cup 的妹子 nipple 还是要比男孩子大不少的 (逃 |
92 tubanwu 2018-01-10 11:42:56 +08:00 via Android 除了胸男女体脂分布骨骼都不一样什么肩膀手臂腰臀都能识别啊 |
93 crab 2018-01-10 11:44:29 +08:00 平胸没乳头吗? |
94 bruce00 2018-01-10 13:20:13 +08:00 你们为什么要帮楼主 |
95 dassh 2018-01-10 13:42:51 +08:00 nipple 大小 /nipples 之间距离,这个比例值,肯定女的大于男的,所以如果露 2 点的话。问题就可以简化成简单的图形处理了,可以看看 opencv 大概步骤,大概就是先提取特定 nipple 颜色(粉、棕、黑?),再求 nipples 之前的距离,算比例。 |
96 xwhxbg OP @dbsquirrel 3000 都收集了很久了。。。现在公司都是短平快,没有鸡就要你生蛋的 @nullcoder I can't say that I do. @tubanwu 我上面说了,要是我有体检数据那就不用这样了呀 |
97 GenkunAbe 2018-01-10 22:58:00 +08:00 via Android 对于一些比较 hard 的 cases,我觉得可以考虑用 bootstrap 的思想,提高它们对于超参的影响权重。另外,据我所知这个需求已经有现成的接口可以调用了,为何要重复造轮子。 |