五笔打字初学问题
汉字是一种意形结合的象形文字,形体复杂,笔画繁多。它最基本的成分是笔画,由基本笔画构成汉字的偏旁部首,再由基本笔画及偏旁部首组成所有的有形有意的汉字。于是,可以将一些字的基本单位按照一定的规律组合成不同的汉字形体,构成相对独立的结构。
1. 汉字的五种笔画
所有的汉字都是由笔画构成的,在书写汉字时,不间断地一次连续写成的一个线条叫做汉字的笔画。笔画的基本形式是点和线,点和线在汉字里的位置不同,有一些笔画变体。把笔画的基本形式和变形加在一起,就有许多不同的形体。而“五笔字型”只考虑笔画的运笔方向,而不计其轻重长短,将汉字的笔画分为五类:横、竖、撇、捺、折。根据这五种笔画在汉字中所占频率的高低,依次用1、2、3、4、5作为这5种笔画的代号。
在汉字的具体形态结构中,其基本笔画“一、丨、丿、丶、乙”常因笔画和结构上的不同而产生某些变化,一些基本笔画的大小、长短有时也会不一致,于是就产生出了各式各样的笔画变异。横、竖、撇、捺四种笔画中,都有相应的短笔画。提笔和撇外形相似,但笔画走向不同,提笔因其笔画走向为从左到右,因此提笔属于横。这种变化仍然保留了基本笔画的变形特征。这种变化的例子还有一些,如:竖左钩属于竖,而竖右钩属于折。
一切带拐弯的笔划,不管有多少折笔,都归为折类。
汉字的五种基本笔画“一、丨、丿、丶、乙”不是编码的基本单位,只是起着辅助作用,而字根才是汉字编码的基本单位。
由基本笔画变形的笔画,与基本笔画是同一类笔画。这是因为:
(1)由“现”是“王”字旁可知,提笔“ ”实际是横的变形。
(2)由“村”是“木”字旁可知,点笔“丶”实际是捺的变形。
(3)由旧体的“木”字其竖笔带左钩可知,竖笔向左带钩“ ”应属于竖。
(4)其余一切带转折、拐弯的笔画,都归“折”一类。
2. 汉字构成的三个层次
一个完整的汉字,既不是一系列不同笔画的简单排列,也不是各种笔画的任意堆积,而是由若干笔画复合连接交叉所形成的相对不变的结构。通常说“木子李”、“立早章”是说“李”字由“木”字和“子”组成,“章”字是由“立”和“早”字组成的,“木”、“子”、“立”、“早”都是基本的字根。
造字法,构成汉字的笔画结构,常叫作字根,如:日、月、金、木、水、火等。
一般说来,字根是有形有意的,是构成汉字的基本单位。字根像搭积木那样,经过拼形结合,就组成了为数众多的汉字,如:明、林、森、吕、晶、能等。
由此可见,汉字从结构上讲,可分为三个层次,即笔画、字根、汉字。
要特别提注意的是,字根是一个文字学中的概念。当对汉字进行编码设计时,就不能用字根这个概念了。一方面,谁也说不清字根有多种,哪些是字根,哪些不是字根;另一方面,用字根的概念不能解释全部汉字的构成,总有许多汉字“说不清楚”,所以就无法设计出一贯到底的编码规则。
3. 汉字的三种字型
汉字是一种平面形文字。同样几个字根,摆放位置不同,就可能成为不同的字。如:用“口”和“八”两个字根,既可组成“叭”,也可组成“只”。再如:“口”和“木”两个字根,既可组成“杏”,也可组成“呆”。
由此,字根的位置关系,也是汉字的一种重要特征信息。这个“字型”信息,就是用计算机输入汉字时,告诉计算机所输入的字根的排列组合方式,有利于计算机识别。
根据汉字字根之间的位置关系,可以把成千上万的方块汉字分为三种字型:左右型、上下型、杂合型,并依序命以代号1、2、3,如表2-2所示。
4. 字根结构的四种关系
一切汉字都是由基本字根组成的,基本字根在组成汉字时,按照它们之间的位置关系可以分成四类基本结构。分析汉字的结构是为正确确定不同汉字的字型。
(1)单
单是指基本字根本身就单独构成一个汉字。
如:“由、雨、竹 斤、车”等。
这类汉字不再分为某种字型,在五笔字型中称为键名字根或成字字根汉字,有专门的取码规则。
(2)散
散是指构成汉字的基本字根之间可以保持一定的距离。
如:“讲、肥、明、张、吴”等。
当对汉字提取左右、上下、杂合型字型信息时,正是以字根之间这种“散”的关系为前提的。因此,这类汉字的字型可分为左右型或上下型。
(3)连
连是指一个基本字根连一单笔画。
如“丿”下连“目”成为“自”,“丿”下连“十”成为“千”,“月”下连“一”成为“且”等。这类字虽然不多,但容易看成是上下型关系,它们的字型应该属于杂合型。
另一种情况是指“带点结构”。如:勺、术、太、主等。这种一个基本字根之前或之后的孤立点,一律视作与基本字根相连,这样的字一律视作“连”的结构。
连的关系只存在于单笔画与字根之间,而不存在于字根与字根之间。
(4)交
交是指几个基本字根交叉套迭之后构成的汉字,如:“申”是由“日、┃”,“里”是由“日、土”,“夷”是由“一、弓、人”交叉构成的等等。这类汉字的字型应属于杂合型。
在字根组字中,还有一种情况是混合型,即几个字根之间既有连的关系,又有交的关系。如“币”,是“ノ”下边连了一个“巾”,而“巾”又是由“冂”与“丨”相交形成的,自然这类汉字的字型也属于杂合型。
根据上面的分析,归纳如下:
①基本字根单独成字,在取码中对它有专门的规定,不需判断字型。
②属于“散”的汉字,可以分为左右、上下型。
③属于“连”与“交”的汉字,一律属于杂合型。
④不分左右、上下的汉字,一律属于杂合型。
汉字的编码是指汉字用一组代码来表示。例如:用数字来表示的电报码,用拼音字母来表示的拼音码。在五笔字型输入法中,汉字编码是指一个汉字由哪几个字根组成,即由所对应的哪几个键输入。这几个键就是这个汉字的编码,或者称为输入码。
为了便于记忆,把五笔字型的取码规则编成一首口诀。:
五笔字型均直观,依照笔顺把码编;
键名汉字打四下,基本字根请照搬;
一二三末取四码,顺序拆分大优先;
不足四码要注意,交叉识别补后边。
这首口诀可以概括为五笔字型拆分取码的几项原则,总结如下:
(1)对于键名字,可连续四次按该键输入。
(2)对于成字字根,可按笔画输入。
(3)对于大量的键外字,应依据如下拆分原则:
按书写顺序,从左到右,从上到下,从外到内取码的原则。
以基本字根为单位取码的原则。
按一二三末字根,最多只取四码的原则。
单体结构拆分取大优先的原则。
末笔字型交叉识别的原则,其中末笔识别码=末笔画的区号(十位数,1~5)+字型代码(个位数,1~3)=对应字母键,如表4-1所示。
五笔字型输入法把汉子输入分成三类,他们分别是:
1. 键名汉字输入
键名汉字是组字频度较高、各个区位上最常用的2个字根,除“纟”外,其他24个字根本身就是一个汉字。键名汉字有25个键名汉字的输入方法是把键名所在的键连击四下。如:
土:FFFF 日:JJJJ
木:SSSS 月:EEEE
由于每个汉字最多输入四个编码,输入了四个相同字母后,就不要再按空格键或回车键,字就直接出现在屏幕上了。
键名汉字共有25个,即:
王 土 大 木 工
目 日 口 田 山
禾 白 月 人 金
言 立 水 火 之
已 子 女 又 纟
2. 成字字根输入
在五笔字型字根键盘的每个键位上,除了一个键名字根外,还有数量不等的几种其他字根。它们中间的一部分本身也是一个汉字,我们称之为成字字根。
一切成字字根的输入,都采用统一的规定,可用一个公式表示为:
键名代码+首笔代码+次笔代码+末笔代码
也就是说:当要键入一个成字字根时,首先把它所在的那个键打一下,然后再依次打它的第一个笔画、第二个笔画及最末一个笔画。即打键名后,再打三个单笔画。如果该字根只有两个笔画,则以空格键结束。例如:
文:依次按键名41,首笔41,次笔直11,末笔41,即YYGY,屏幕上立即会出现“文”字。
由:25 21 51 11(MHNG)
十:12 11 21 (FGH)
在成字字根中,还有五种单笔划作为成字字根的一个特例,它的编码有特殊规定,将单笔画所在键击两次后,再击两个L健。这是因为单笔画并不是常用的汉字,加了两个“后缀”L键,用于区别常用汉字的简化输入。
一: 11 11 24 24 (GGLL)
丨: 21 21 24 24 (HHLL)
丿: 31 31 24 24 (TTLL)
丶: 41 41 24 24 (YYLL)
乙: 51 51 24 24 (NNLL)
由于键名字、成字字根的输入方法与一般汉字输入方法不同,必须熟悉与记住哪些字根是成字字根,哪些字根是键名字根。键名字根、成字字根还是构成汉字的基本单位。因此,应将键名字根和成字字根反复练习多次,以便熟悉和记忆。
3. 输入键外字
上述键名字及成字字根中的键面字总共有一百多个。键面字以外的汉字都是键外字,键外字是大量的。遵循以下原则将汉字进行拆分成基本字根,再按要求选取合适的基本字根即得到所需的汉字。
3.1 拆分汉字的原则
在五笔字型输入法中拆分汉字的原则可以概括成如下:
1.顺序拆分。
依照汉字的书写顺序拆分。例如:
新:“立”“木”“斤” 正确,符合书写顺序
“立”“斤”“木” 错误,未按书写顺序
中:“口”“丨” 正确,符合书写顺序
“丨”“口” 错误,未按书写顺序
夷:“一”“弓”“人” 正确,符合书写顺序
“大”“弓” 错误,未按书写顺序
2.取大优先。
“取大优先”也叫做“优先取大”。按“书写顺序”为汉字编码时,不能无限制地采用笔画少的字根。否则,汉字都将变成单笔画字根了。例如:
世:“一”“凵”“乙”错误
“廿”“乙” 正确
显然,前者是错误的,因为第二个字根“凵”,完全可以向前“凑”到“一”上:形成多一个笔画的字根“廿”。再如:
甩:“ ”“二”“乚”错误
“月”“乚” 正确
同样,第一种编码是错误的。因为第二字根的“二”,完全可以向前“凑”成“更大”一点的字根“月”。
“取大优先”,俗称“尽量往前凑”,是在汉字取字根时最常用到的“基本规则”。
3.兼顾直观。
在确认字根时,为了使字根特征明显易辨,有时就要“牺牲”“书写顺序”和“取大优先”的原则,形成个别特殊的情况。
例如:国,按“书写顺序”其字根应是:“冂、王、丶一”;但是这样编码,不但有悖于该字的字源,也不能使字根“ ”直观易辨。只好违背“书写顺序”,按“、王、丶”的顺序编码。
4.能连不交。
当一个字既可以视作“相连”的几个字根,也可视作“相交”的几个字根时,认为“相连”的情况是可取的。因为一般来说,“连”比“交”更为直观,更能显现字根的笔画结构特点。例如:
失:“�”“夫” 二者是相连的 正确
“�”“大” 二者是相交的 错误
朱:“丿”“未” 二者是相连的 正确
“�”“木” 二者是相交的 错误
注意:遇到既能“散”,又能“连”的时候,只要不是单笔画,一律按“能散不连”判别,即作为散的关系。
键外字按以上规则拆分成字根后,在编码选字根时,还要遵循以下原则:
(1)超过四码:取该字的1、2、3、末字根码。例如:
慧:三丨三心 DHDN
续:纟十乙大 SFND
(2)刚好四码:依次全部选取。例:照:日刀口灬。
容:宀八八口 PWWK
(3)不足四码:在字根键入完后由于信息量不够,需要另外加打“末笔字型交叉识别码”,仍不足四码,补空格键。
注意:如果上述编码不能输入所要的汉字,可按空格键。如果仍然不能输入正确的汉字,说明该字还需输入识别码。
3.2 输入汉字的原则
不管任何汉字,拆分成多少字根,顶多只能取汉字的四个字根。因此,键外字的编码规则为:
含四个或四个以上字根的汉字,用四个字根码组成编码;不足四个字根的汉字,编码除包括字根码以外,还须补加一个末笔识别码。如仍不够四码,可按空格键。
一个汉字拆分成的字根大于四个时,便取汉字的第一、二、三和最后一个字根码组成编码,依次的键入顺序。当键入最末一个字根码后,汉字会自动显示在计算机屏幕上,不需要打空格键。
一个汉字拆分的字根正好是四个时,即取第一、二、三和最后一个字根码组成编码,依次取完,在键入最末一个字根码(第四个编码)时,此汉字会自动显示在屏幕上,也不需要打空格键。
此处一、二、三、末笔笔画是按正常书写顺序,从左到右,从上到下,从外到内。举例如下:
编:纟 户 冂 艹 (XYNA)
照:日 刀 口 灬 (JVKO)
容:宀 八 人 口 (PWWK)
嫫:女 艹 日 大 (VAJD)
酩:西 一 夕 口 (SGQK)
3.3 识别码的定义
识别码即“末笔字型交叉识别码”,由单字的末笔画的类型编号和单字的字型编号组成。总体地说,识别代码为两位数字,第一位(十位)是末笔画类型编号(横1、竖2、撇3、捺4、折5),第二位(个位)是字型代码(左右型1、上下型2、杂合型3)。把识别代码看成为一个键的区位码,即得到交叉识别码的字母键。
识别码的作用是减少重码,加快选字,例如:
上例中,“沐”、“汀”、“洒”的编码都相同(IS),但末笔画不同,所以,加上末笔识别码后,它们的编码就不相同了。不然就会重码了。同样,“只”、“叭”的编码一样(KW),但字型不一样,所以加上字型识别码后,编码也就不相同了。
用于识别的末笔,有以下规定:
(1)凡是单笔画与字根相连者或带点结构都视为杂合型。
(2)字型区分时也用“能散不连”的原则。知、卡、严都视为上下型。
(3)内外型字属杂合型,如困、匝。但“见”为上下型。
(4)含两字根且相交者杂合型,如:东、串、电、本、无。
(5)下含“走之”字为杂合型:进、逞。
(6)以下各字为杂全型:司、床、厅、尼、式、后、反、办、皮,但相似的左、右、有、看、者、布、友等可视为上下型。
为了提高输入速度,我们将经常用汉字只取其前边一个、二个或三个字根构成简码构成了一、二、三级简码,以输入高频字。输入时只需按该字的前边一个、二个或三个字根,然后按空格键即可。因为省略了识别码,所以简码的设计会给用户带来很大的方便。
1. 一级简码
从11到55共25个键位代码,根据每一键位上的字根特征,每键安排一个最常用的高频汉字,这类字只要按键一次再敲空格键即可输入,共计25个。例如:
一(11G)地(12F)在(13D)要(14S)工(15A)
上(21H)是(22J)中(23K)国(24L)同(25M)
2. 二级简码
二级简码的汉字输入方法:只打入该字的前两个字根码再加上空格键。如:
化:亻匕 WX 玉:王丶 GY
红:纟 工 YT 张:弓 长 XT
妈:女 马 VC 克: 古 儿 DQ
3. 三级简码
三级简码由单字的前三个字根码组成,只要一个字的前三个字根码在整个编码体系中是唯一的,一般都选作三级简码,共计有4000多个。此类汉字,只要打其前三个字根代码再加空格键即可。因为需要加打空格键,并没有减少总的击键次数,由于省略了最未一个字根或者“交叉识别代码”的判定,可达到简单易用和提高编码输入速度之目的。
汉字由字根组成,字根由笔画构成,笔画、字根、整字是汉字结构的三个层次。五笔字型汉字编码所选字根多数是一些传统的汉字部首,少量的选用一些不是部首的笔画结构作为字根,也硬造出了一些“字根”来。
五笔字型的基本字根有130种,加上一些基本字根的变型,共有200个左右。按照每个字根的起笔代号,分为五个“区”。它们是1区-横区,2区-竖 区,3区-撇区,4区-捺区,5区-折区。每个区又分为五个“位”,区和位对应的编号就称为“区位号”。这样,就把 200个基本字根按规律放在25个区位号上,这些区位号用代码11、12、13、14、15;21、22……;51、52、53、54、55来表示,分布在计算机键盘的25个英文字母键上。
每个区位上有一个最常用的字根称为“键名字根汉字”,键名字根汉字既是组字频度高的字根,又是很常用的汉字。首先应熟记键名字根,以帮助各键位上其它字根的理解和记忆。下面是各区位上的键名字根,每个字根右面括号里的数字代码表示这个字的区位号。
1区(横区): 王(11) 土(12) 大(13) 木(14) 工(15)
2区(竖区): 目(21) 日(22) 口(23) 田(24) 山(25)
3区(撇区): 禾(31) 白(32) 月(33) 人(34) 金(35)
4区(捺区): 言(41) 立(42) 水(43) 火(44) 之(45)
5区(折区): 已(51) 子(52) 女(53) 又(54) 纟(55)
王旁青头戋五一,12 土士二干十寸雨。
13 大犬三羊古石厂,14 木丁西,15 工戈草头右框七。
21 目具上止卜虎皮,22 日早两竖与虫依。
23 口与川,字根稀,24 田甲方框四车力。
25 山由贝,下框几。
31 禾竹一撇双人立, 反文条头共三一。
32 白手看头三二斤,33 月衫乃用家衣底。
34 人和八,三四里,35 金勺缺点无尾鱼,犬旁留乂儿一点夕,氏无七。
41 言文方广在四一,高头一捺谁人去。
42 立辛两点六门病,43 水旁兴头小倒立。
44 火业头,四点米,45 之宝盖,摘礻(示)衤(衣)。
51 已半巳满不出己,左框折尸心和羽。
52 子耳了也框向上。
53 女刀九臼山朝西。
54 又巴马,丢矢矣,
55 慈母无心弓和匕,幼无力。
识别码!
要什么样的识别码就要看你所打的字的最后一笔是什么,五笔将键盘分成五个区,横、竖、撇、捺、折。若你打的字的最后一笔是横,就在横区找识别码!左右结构的字就第一个字母如“江”,打IA是可以打出,但是按照正规的打法应该是IAG;若是你打的字是上下结构就打F,综全结构就打D(就是非左右、非上下)。
横区识别码是G、F、D
竖区识别码是H、J、K
撇区是T、R、E
捺区是Y、U、I
折区是N、B、V
那是识别码,原则是:
看最后一笔,再看结构.
左右结构是1
上下结构是2
混合的为3
因为"地"为左右,而且是折,所以要加N.其实这个字一个键F就可以了
"灭"呢?是混合,最后一笔是捺,所以为I
有些还跟下载的输入法有关,你的为U,而我的就需要按i
就是这样.
是识别码,第一个加N是因为也的最后一笔是折,同上,火的最后一笔是抐
最后一笔++字型结构
为了降低重码率。
识别码。
困为这两个字都需要末笔识别啊.