其实这是帮同学问的
000000000001 和
100000000000 要有很大差异
000000100000 和
000001000000 差异很小
111011101111 和
110110011110 中等差异
完全一样差异为0
最好能度量差异性,二进制序列大概100位左右
我有两个想法:
第一个是每4位二进制按格雷码转换成10进制,然后逐位取差平方再平均。
第二个是借鉴Levenshtein Distance算法,看看能不能运用到这里。
因为不是我在做,所以也没编个程验证什么的。
感觉方法1在一些极端情况反映不了差异。
比如
000100000001 和
000000010000 这样应该差异大,可是因为转成格雷码十进制后,转换的数比较小,所以算差异时反而不大。
PS:各位大侠给个稍微简单一点的算法啊,同学编不了我就遭殃啦!
000000000001 和
100000000000 要有很大差异
000000100000 和
000001000000 差异很小
111011101111 和
110110011110 中等差异
完全一样差异为0
最好能度量差异性,二进制序列大概100位左右
我有两个想法:
第一个是每4位二进制按格雷码转换成10进制,然后逐位取差平方再平均。
第二个是借鉴Levenshtein Distance算法,看看能不能运用到这里。
因为不是我在做,所以也没编个程验证什么的。
感觉方法1在一些极端情况反映不了差异。
比如
000100000001 和
000000010000 这样应该差异大,可是因为转成格雷码十进制后,转换的数比较小,所以算差异时反而不大。
PS:各位大侠给个稍微简单一点的算法啊,同学编不了我就遭殃啦!
