再论 中文输入法 的选择 音码/ 形码 / 音形码 - V2EX
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
2NUT
V2EX    输入法

再论 中文输入法 的选择 音码/ 形码 / 音形码

  •  2
     
  •   2NUT 2023-09-15 14:21:23 +08:00 1563 次点击
    这是一个创建于 756 天前的主题,其中的信息可能已经有所发展或是发生改变。
    零几年,在手机上学会的 笔画输入法,9 宫格,5 个笔画,会写字,就会打字,门槛甚至比拼音输入法还低(考虑方言区很多人拼音并不标准)。所谓 大道至简,虽然效率不算高,但完全可以说解决了初期汉字输入的问题。很奇怪,也没人往电脑上推广,只是因为电脑键盘按键多么?

    九几年其实有机会学会五笔的,当时买了小霸王学习机,附带了五笔的教程,没看懂,遂放弃。

    回过来看,汉字编码输入无非是这个过程:

    形码: 表达需求--->意识(大脑)---&g;内语语音---(听写识字)--->字形---(拆字)--->字根序列--->形码---(键盘布局映射)--->按键(时序或并击)-->选字(确认或翻页)-->上屏显示

    音码: 表达需求--->意识(大脑)--->内语语音---(拼读编码)--->音形---(拼音)--->字母序列--->音码---(键盘布局映射)--->按键(时序或并击)-->选字(确认或翻页)-->上屏显示

    编码最终熟练后都会直接省略 内语语音 --> 音/形 编码的中间过程,形成直接映射,殊途同归。

    但是在初期学习和熟悉阶段,毫无疑问,难度上:

    1 ) 听写识字(听 -> 写,音->形状) > 拼读, 基于一般人会拼读,会写字的前提,形码复杂度要上两个层级;尤其是现在人会写的字更少了。

    2 ) 编码规则 拆字 >>>> 拼音,拆字是需要另外学习和无法规律化的规则,难度很高,而拼音是小学生都会,即使不会,难度也很低(元素更少,更加规律)。

    3 ) 编码到键盘映射,形码 >>> 音码,字母在键盘哪个位置是规范化好的,一个按键对应一个字母,而字根在哪个位置又是一套复杂的映射,一个按键对应多个字根。难度不在一个层级上。

    那形码这么难有什么好处呢?

    1 ) 重码少(因为字根多呀,字根组合就多,能唯一定位某个汉字),编码输入后,不会有很多候选字,从而减少选字的几率。但意味着记忆负担。

    2 ) 击键少(还是字根多,所以码长短,某个汉字拆分到的字根个数少),大字根多了就会影响编码覆盖率,所以一般都是小字根,需要记忆字根拆解规则。

    3 ) 节奏稳定 (取决于键盘映射 和 编码),全码的码长固定,打字有节奏感。

    对应拼音输入法的缺点:

    1 ) 重码多(音形输入法的天生缺陷,汉字本身同音字就多(声音编码文字不是好方案,声音的模糊性决定了码元一定少)+ 码元少,除非通过概率模型(联想预测)否则无法通过音码方案自己解决)

    2 ) 击键多(拼音的音元相比形码少很多,类似大字根,但是辅音等还是拆解为字母输入,导致码长较长...)

    3 ) 节奏不定 (拼音的长度不定,因为本身复用的拼音规则和键盘字母位置,没有优化设计)

    对应出现了双拼,解决了全拼输入法的编码码长过长的问题(本身)。

    对于一个通用输入法,可以提炼出以下评价维度:
    {字根数量、字根的细化度(大字根、小字根)、编码规则(音/形/音+形)、码长、键盘寻址时间}

    可以得出一个初步结论:
    1 ) 音+形 码方案需要同时处理 两路数据流,不是一个好的编码方案,不值得学习(如 二笔输入法 小鹤音形等输入法 )。

    2 ) 形码 方案,优势是码长长,所以重码低,但劣势是字根多(要记),编码规则多(要练),映射规则难(要练),需要较长的时间才能学会,难度较大。

    3 ) 音码 方案,天生码元少(声母+韵母),所以重码高(及时考虑汉字本身的同音字影响),而且因为韵母为多字母,码长还长,属于双输了;但是优势字根(字母)、编码(拼音)、映射(英文键盘)上过学的都会,已经学过了,不用重新学。

    4 ) 音码 方案改进版,即双拼,解决了输入码长问题,双拼从统计的码长看基本在 2-3 之间,和五笔不相上下;劣势是没有解决重码问题,因为码元没有增加。但是属于精力投入与效益比最好的汉字方案了。
    xubair
        1
    xubair  
       2023-11-12 23:16:22 +08:00
    个人感觉从双拼到小鹤音形的难度要比从全拼到双拼低很多,小鹤音形感觉更像是加强版本的双拼,毕竟它的字根和小字大部分都是用的声母的键位,挺好记的
    pmkm
        2
    pmkm  
       2024-05-06 22:18:26 +08:00
    中文输入属于果然计算机科学
    关于     帮助文档     自助推广系统     博客     API     FAQ     Solana     6070 人在线   最高记录 6679       Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 30ms UTC 03:02 PVG 11:02 LAX 20:02 JFK 23:02
    Do have faith in what you're doing.
    ubao snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86