Zoharwolf

这里是一个宅腐基程序员的随笔集合,偶尔可能会有自制游戏的相关讯息

说说蛋疼的五笔

 
 
写这篇文章没什么特别的意思,就是想随便说说自己对五笔的感想。作为一个已经有10多年党龄的五笔党,面对着飞速发展的拼音输入法和那原地踏步的五笔输入法,也一直在犹豫与尝试。但是最终还是依旧选择了和五笔在一起,个中原因,也就是习惯而已。就好像现在photoshop已经出到了cs6,但是仍然有许多photoshop高手依旧用着cs2一样。 
 
〇、先简单地说一下五笔的基本知识: 
1、五笔的原理其实很简单,就是把汉字拆分成各种各样的偏旁部首或者笔画(被称为字根),然后分散到25个英文字母里,而字母Z则是充当通配符,当用户不知道某个字根是在哪个键上时,就可以用Z来代替。 
2、之所以叫“五笔”,其实是因为把这些字根根据它们的第一笔归成了五类,分别是横竖撇捺折,根据字母键盘位置分散在各字母中。 
3、五笔打字其实就是拆字拼字的过程,举个简单而经典的例子,“李”这个字就可以简单地拆成“木”和“子”,木在S上,子在B上,所以想打“李”,就打SB,嗯……SB(喂 
4、五笔最少可以用一个字母打出字来,被称为一级简码。根据上面说的,可以自然地想象到,一级简码共有25个,都是很常用的字,比如:地、的、我、人、要等。 
5、有一级简码,还会有二级简码。二级简码有多少,貌似没人统计过,总之很多……比较常用的有:用、年、车、能、成、早……我想不出别的了= =||| 
有些字虽然用两个字母也能打出来,但是它们不是二级简码,因为根本就没简……比如前边说的SB李。 
6、三级简码……虽然有这一叫法,但是大家都清楚,打三个字母已经不简了,所以一般没人这么说。 
五笔最多只能输入4个字母,就是说,无论多么复杂和字或者词组,最多只需要使用四个字母就能够打出来了。 
7、词组……没错,五笔也是可以输入词组的,这就是早年它可以战翻全拼输入法的奥义。当年感觉最壮观的就莫过于只需要打kwwl就可以出来“中华人民共和国”七个字,而全拼却要打zhonghuarenmingonghegou这么多字母。 
词组的打法也非常简单,如果是两个字,只需要取这两个字的前两个码就可以。比如“萌芽”,“萌”是aje,“芽”是aaht,只需要取他们的前2个码打ajaa,就会打出“萌芽”了。 
还有三字、四字、多字的打法,感兴趣的话可以看一下,不感兴趣可以直接跳到8(会有人感兴趣吗 
三个字的话,就是前两个字的第1码和第三字的前2码。比如“莫斯科”,“莫”是ajd,“斯”是adwr,“科”是tufh。取aatu,就可以打出这个词了。 
四个字的话,取每个字第1码。比如“早安地球”,“早”jh,“安”pv,“地”f,“球”gfi,取jpfg就可以打出来。 
四字以上,取前三个字和最后一个字的第1码。比如“中华人民共和国”,“中”k,“华”wxf,“人”w,“国”l,取kwwl就可以打出来。顺便吐槽一句,这个7字词里的中、人、民、和、国5个字全是一级简码,足可看出五笔发明人王啥啥先生那拳拳的那啥之心( 
8、中国汉字成千上万,难道只需要4个字母就能把他们全表现出来?从数学上来看,似乎可以:25x25x25x25=390625 ,但是实际却并非如此。因为如果你下载一个五笔输入法,然后随便输入四个字母,将有很大的概率,什么字也打不出来。有大量的空白字,意味着也有大量的重码字。比如只是拆字根的话,会发现“也”是bn,“孔”也是bn,所以后面还要补上识别码来区分重码字。……不过加了识别码之后,仍然有许多重码字就是了= =比如器和嚣,去和云和支…… 
 
一、坑爹的字根口诀: 
这东西真是史上最烂最蛋疼最无用最误导新手最容易让人望而却步的发明。什么“王旁青头兼五一”,我到现在也只能背下来三句。我可以很负责任地告诉大家,虽然几乎每本教五笔的书上都把这个口诀作为初学者入门必修的东西印出来,但是,它没有任何用处。连一秒种也不要花在它上面,那将是你最大的徒劳。 
这东西的发明非常反人类,因为它和人真正实际打字时的思维是完全相反的。比如我想打“李”这个字,那么我必须要知道“木”和“子”这两个字根在什么字母上。没错,我们需要知道的是“某个字根在什么字母上”,而不是“某个字母上有什么字根”。这个口诀完全是反其道而行,让人拼命地去记“某个字母上有什么字根”。 
如果你不是一个喜欢背东西的人的话,估计连这所谓的五笔初学者第一步都过不去。我建议做个调查,看看那些曾经想学五笔但是没学成的人,是由于什么原因放弃学的,我相信十有八九都是因为背不下来这个2B口诀而失去耐心的。就算把这口诀背下来,也会发现在实际应用中没有半点用处,完全是在浪费时间。背它我还不如拿一张打印的键盘字根表,打上一星期就可以脱稿了。 
 
二、被强拆的偏旁部首: 
有些偏旁部首被莫名其妙地强拆掉了。本来应该只用一个字母就打出来,偏要用两个字母打出来。最典型的就是礻和衤了。礻要用py打,衤要用pu打。给学习、打字上都造成了相当的不便。而最大的不便就是打词组的时候了,前面提到,五笔的打2字词组时需要各取它们的前2码,这就意味着我想打“衬衫”“被褥”“襁褓”“衬裤”等所有类似这样的词时,都只能打pupu。pupu将出来一大堆的这种双衤的词。极其蛋疼。除了衤和礻以外,像牜、犭这样的,也是如此……非常蛋疼。 
不过极点五笔发明了一个解决办法,这种需要2码打出来的偏旁,打词组时可以用第1友代替。发明倒不错,可惜毕竟不是官方的解决办法,无法通用。 
 
三、无法了解的顺序: 
最典型的就是“乘”和“乖”这两个字了,直到现在也经常打混。原因就是它们的字根类似,但是输入顺序却不一样。“乘”要依次输入 丿t,丬u,匕x,木s。 而“乖”却要打丿t,十f,丬u,匕x。 
注意到没,乘的“木”要在打了那个小“北”字之后才打的,而乖的“十”要在打那个小”北“字之前打。不知道为什么要安排成这种诡异的顺序,实在是给人打字造成了各种不便。让人我在字根顺序上产生困扰的还有”戒“,”曹”等字……直到现在也经常打错。 
 
四、哪些是字根,哪些不是字根: 
字根的划分真是最大的谜。一般来想,肯定偏旁们是单独的字根了,比如冫氵亻扌刂之类的。但是上面也提到过,衤礻牜犭这些却被拆成了两个字根。除了偏旁上,其他部分更是有许多意想不到的划分,给打字造成了许多不便。 
比如“肆”这个字的左半边,给的感觉好像是两个字根似的,尤其如果你知道“厶”是在c上,那么就更会这样想了。但是实际上,打这个却根本用不上c这个字母。“镸”是一个单独的字根,在d上。 
这或许并没有什么太奇怪的,你反而觉得这样更加方便,但是除了这个例子,还有个不方便的例子。 
猜猜“尧”这个需要打几个字母能打出来?你可能觉得,需要2个码就足够了,戈(去掉点)、兀。或者对五笔有些了解的,会想到是戈(去掉点)、一、儿这3个码。但是其实这个字需要的是4个码,看起来这么清晰简单的字,其实有着复杂的拆字:七、丿、一、儿。戈(去掉点)被拆成了七和丿。 
 
五、需要放飞想象的字根: 
这个让人挺无语的。就是有些字根,在字根表里是查不到的,然后你就永远无法打出这个字,直到有人告诉你这个字怎么拆。你才会发现,卧槽,这个东西也一个字根,而且是在字根表上找不到的字根。最典型的就是”舞“这个字了,第1、2、3笔的撇横横组成的那个字根在r上,这倒是没有问题。问题是接下来的部分要怎么打?让人意外的是下面的四竖也是个字根,在L上。但是却在字根表上查不到。这个的原理是……h是一竖,j是两竖(刂),k是三竖(川),这些都可以在字根表上查到。所以L就理所应当的是四竖……尽管在字根表上查不到。想打出这个“舞”字,除非别人告诉你,不然就需要你拥有非常不得了的想象力…… 
 
六、有些字是永远的痛苦: 
无法拆的,无法想象怎么拆的字……只能靠死记硬背了。比如凹是mmgd,拆字法是:冂M 冂M 一G 识别码D……我一直没弄明白,明明是两个横,为毛只需要一个横就可以了。凸是hgmg,丨H 一G 冂M 一G,貌似直接是按笔画来的……右半部分比较有争议的那地方正好因为笔画过多而被略掉了。卍卐这两个字……也是按笔画来的,但是这两个字的笔画顺序本身就已经很纠结了。〇这个字,其实就是囗,在L上,但是却要输入四个L才能打出来,不知道什么原理。乙这个字,却要打NNL,前两个N符合五笔规则,但是最后一个L是干什么的,一直是个谜。 
 
七、极其狭隘的发展空间: 
自83年诞生以来,五笔究竟进步了多少?拼音已经从当年那个笨重缓慢的全拼、智能ABC等进化了现今的搜狗输入法,低门坎与无尽的发展空间,让拼音输入法成了真正的主流,越巨大的词库和颇人性化的算法带来的是极其便利的用户体验。而相比之下,五笔倒是只能在用户操作上尽量做到简便。微软的极品五笔,输入之后还要蛋疼地点一下回车才能消除输入框,现在许多五笔输入法已经把这一脑残的设计去掉了。造词功能,可以让用户添加自己习惯的词语进去。……除此之外呢,没了。扩充五笔词库如何?而事实证明,越大的词库对五笔用户来说是越大的灾难,越大的词库意味着越多的重码。给正常打字都会带来非常多的不便。这样一看,几乎可以说是毫无进步呢。 
最初选择五笔,也是由于作为辽宁人,平翘舌经常分不清,再加上拼音打字法打个字要输一大串,而万一就是zh和z打错,导致整个都白打了,很让人懊恼。我想大概四川一带l n不分的也有同样的困扰吧。但是现在的拼音输入法连这个也克服了……五笔一下子感觉就相当缺乏竞争力了。 
值得一提的是,上面我提到的这些,都是指86版五笔,也就是最初版也是使用最广泛的五笔。后来五笔又出了个98版,看百科好像还有个新世纪版。这些新版本应该是改进了原来86版的许多问题吧,但是最大的问题是,不会有任何一个五笔用户愿意抛弃自己原来用得非常熟练的86版,而又从零开始去学一个新版的五笔输入法。新的字根表,新的拆字法,这种大破大立的方式,无一例外地遭到了五笔用户的抵制。所以直到现在,2012年,86版五笔仍然是使用最广泛的一种,相比之下,用98和新世纪的少之又少。 
 
 
其实早在上个世纪,想替代拼音的中文输入法有许多种,许多80后或者90后初期的同学小时候可能学过的一种 认知码,我记得我还学过一个 自然码。看看这些失败的输入法的百科介绍,会发现许多啼笑皆非的东西。 
 

评论

© Zoharwolf / Powered by LOFTER