请教一个图片识别/归类的问题 - V2EX
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
请不要在回答技术问题时复制粘贴 I 生成的内容
kevinyoung
V2EX    程序员

请教一个图片识别/归类的问题

  •  
  •   kevinyoung 2015-11-24 22:41:57 +08:00 2908 次点击
    这是一个创建于 3609 天前的主题,其中的信息可能已经有所发展或是发生改变。
    师兄在做关于量子疤痕态的工作,原理不用管。

    方程有很多解,每个解可以画成一张张的图片来,图片看起来就是各种各样的 pattern ,师兄需要在成千上万张图片中找出一些特定的图片来。

    现在已经人工找出来了 2000 张了,师兄终于无法忍受这种搬砖的事情了准备写个程序做照图片这件事情。

    根据我有限的知识,我觉得这是个聚类分析的问题,不知道 python 的 scikit-learn 能不能来做这个事情?

    如果能的话大概是个什么做法?

    如果不能的话还请给个思路。这里先谢谢了!
    3 条回复    2015-11-25 00:03:34 +08:00
    mko0okmko0
        1
    mko0okmko0  
       2015-11-24 22:57:33 +08:00
    你有 OPENCV 的经验吗?
    如果有.我刚刚稍为查了一下"量子疤痕态"的图片.可能适合拐角侦测.
    当然直接丢 CUDNN 训练也不是不可能.
    没看过目标图片跟非目标图片.无法确定你的需求.
    要慢慢谈,FB:https://www.facebook.com/longsing.chen
    因为需要看到几张图.
    zx120120
        2
    zx120120  
       2015-11-24 23:36:41 +08:00
    不知道你的具体图片什么样子,不太好下判断。
    但是既然你们有直觉可以写程序,那应该就是可以的。

    这应该是个分类问题。
    你要做的就是,准备若干张(几百或者几千) 目标 pattern 的图片,还有若干张 非目标 pattern 图片。
    然后训一个 SVM 或者 Logistic Regression 或者其他随便什么分类器就好了。

    scikit-learn 当然是可以干这件事的,里面自带了 SVM 和 LR 分类器,非常好用的。
    大概的步骤就是, n 张图片读进来,拍扁成一条条的行向量。
    然后扔给 classifier 训练出来得到一个 model ,用那个 model 里的 predict 函数就可以了。

    但是刚刚回头我看了下我自己 BB 的过程,觉得十分不清晰。
    所以强烈建议楼主过一边 Coursera 上的 Machine Learning[https://www.coursera.org/learn/machine-learning/]
    差不多看到第三章 Logistic Regression 就应该会有个很清晰的概念了,然后看看文档应该就能用了。
    (之后,目测之后还有必要看一下 第八章的 PCA 。)
    northisland
        3
    northisland  
       2015-11-25 00:03:34 +08:00
    I. SIFT 等特征 + BOVW 或者 FISHER VECTOR [ + 稀疏表示 ] = 固定维度的特征向量(一般是几 k 维,图像整体的维数是几 m 维)

    II. 特征向量 + 分类器 = 分类结果(一般训练样本的数量和分类模型复杂度要基本相等,也就是说,你有几 k 张图片,想训练几 m 个参数的模型,完全就是开玩乐。所以必须把图片的几 m 维缩小成几 k 维向量)

    I 用 opencv 或者 VLFeat 做, II 可以用 sklearn 做

    然而这个过程是 2012 年前的玩法了~

    现在流行用深度学习 CNN 玩这一套了

    睡前一水,这篇讲纹理分类的文章很好 describing textures in the wild
    关于     帮助文档     自助推广系统     博客     API     FAQ     Solana     2423 人在线   最高记录 6679       Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 22ms UTC 01:10 PVG 09:10 LAX 18:10 JFK 21:10
    Do have faith in what you're doing.
    ubao snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86