JPEG 需要给所有可能的 Run/Size 进行 Huffman 编码吗 - V2EX
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
mikewang
V2EX    算法

JPEG 需要给所有可能的 Run/Size 进行 Huffman 编码吗

  •  
  •   mikewang 2022-04-07 15:03:10 +08:00 1353 次点击
    这是一个创建于 1336 天前的主题,其中的信息可能已经有所发展或是发生改变。

    前情概要(/t/835906):
    本科毕设,用 Java 从零开始写一个 JPEG 编码器,v 友们的回答使我受益匪浅。


    目前转换 YCC 、DCT 、量化已经完成用 ISO/IEC 10918-1:1993 中 K.3 推荐的 Huffman 表,可以完美运行。
    然而,用固定的 Huffman 表压缩效果不一定是最好的,所以我打算根据单个图片本身生成一个新的表。

    单个图片中,并不是所有 Run/Size 值都用得到,所以我只打算给用到的值分配 Huffman 编码。
    (虽是变长编码,由于 JPEG 限制码长不得超过 16bit ,分配过多会导致权重大的值码长增加)

    解码测试结果:

    1. macOS 预览(错误:它可能已损坏,或者可能使用了“预览”无法识别的文件格式。)
    2. libjpeg (错误:Bogus Huffman table definition )
    3. ffmpeg (成功,使用 ffplay 图片可以正常显示)

    疑问:

    1. 可不可以,对没有出现的值,不分配 Huffman 编码;
    2. 如果可以不分配编码,是不是 libjpeg 解码器的 bug ;
      (如果 libjpeg 没问题,就是我的 bug )

    和 libjpeg 比,我这个只是一个小玩具。但是本着敢于质疑的精神,提出了这个问题,希望有懂 JPEG 的大神解惑,非常感谢!

    第 1 条附言    2022-04-07 19:31:29 +08:00

    折腾了一下午,问题解决,在此记录一下:

    答案:
    可以不给没用到的值分配编码。我这么做是对的。
    所以libjpeg报错,是我另外的问题。


    既然libjpeg报错了,我就查了libjpeg源码,看看哪里判错了。
    “Bogus Huffman table definition”,是在jdhuff.c第381行,

    /* Figure C.2: generate the codes themselves */ /* We also validate that the counts represent a legal Huffman code tree. */ code = 0; si = huffsize[0]; p = 0; while (huffsize[p]) { while (((int) huffsize[p]) == si) { huffcode[p++] = code; code++; } /* code is now 1 more than the last code used for codelength si; but * it must still fit in si bits, since no code is allowed to be all ones. */ if (((INT32) code) >= (((INT32) 1) << si)) ERREXIT(cinfo, JERR_BAD_HUFF_TABLE); code <<= 1; si++; } 

    然后我把报错的代码注释掉:

    // if (((INT32) code) >= (((INT32) 1) << si)) // ERREXIT(cinfo, JERR_BAD_HUFF_TABLE); 

    竟然能解码了!没有任何问题。(事实证明,ffmpeg能够解码的原因,是因为ffmpeg没有做这个验证。)


    那 libjpeg 为什么要拦住我呢。
    再看了眼注释:no code is allowed to be all ones.
    原来JPEG里面用的Huffman编码,不能全为1。
    所以将全1的编码长度往后推一个就行。

    问题解决。

    目前尚无回复
    关于     帮助文档     自助推广系统     博客     API     FAQ     Solana     932 人在线   最高记录 6679       Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 23ms UTC 20:14 PVG 04:14 LAX 12:14 JFK 15:14
    Do have faith in what you're doing.
    ubao msn snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86