五笔打字初学问题

关键词：五笔打字初学问题来源：汉字笔顺查询　浏览：53次　时间：2006-03-13

汉字是一种意形结合的象形文字，形体复杂，笔画繁多。它最基本的成分是笔画，由基本笔画构成汉字的偏旁部首，再由基本笔画及偏旁部首组成所有的有形有意的汉字。于是，可以将一些字的基本单位按照一定的规律组合成不同的汉字形体，构成相对独立的结构。
1. 汉字的五种笔画
所有的汉字都是由笔画构成的，在书写汉字时，不间断地一次连续写成的一个线条叫做汉字的笔画。笔画的基本形式是点和线，点和线在汉字里的位置不同，有一些笔画变体。把笔画的基本形式和变形加在一起，就有许多不同的形体。而“五笔字型”只考虑笔画的运笔方向，而不计其轻重长短，将汉字的笔画分为五类：横、竖、撇、捺、折。根据这五种笔画在汉字中所占频率的高低，依次用1、2、3、4、5作为这5种笔画的代号。
在汉字的具体形态结构中,其基本笔画“一、丨、丿、丶、乙”常因笔画和结构上的不同而产生某些变化，一些基本笔画的大小、长短有时也会不一致，于是就产生出了各式各样的笔画变异。横、竖、撇、捺四种笔画中,都有相应的短笔画。提笔和撇外形相似，但笔画走向不同，提笔因其笔画走向为从左到右，因此提笔属于横。这种变化仍然保留了基本笔画的变形特征。这种变化的例子还有一些，如：竖左钩属于竖，而竖右钩属于折。
一切带拐弯的笔划，不管有多少折笔，都归为折类。
汉字的五种基本笔画“一、丨、丿、丶、乙”不是编码的基本单位，只是起着辅助作用，而字根才是汉字编码的基本单位。
由基本笔画变形的笔画,与基本笔画是同一类笔画。这是因为：
（1）由“现”是“王”字旁可知，提笔“ ”实际是横的变形。
（2）由“村”是“木”字旁可知，点笔“丶”实际是捺的变形。
（3）由旧体的“木”字其竖笔带左钩可知，竖笔向左带钩“ ”应属于竖。
（4）其余一切带转折、拐弯的笔画，都归“折”一类。
2. 汉字构成的三个层次
一个完整的汉字，既不是一系列不同笔画的简单排列，也不是各种笔画的任意堆积，而是由若干笔画复合连接交叉所形成的相对不变的结构。通常说“木子李”、“立早章”是说“李”字由“木”字和“子”组成，“章”字是由“立”和“早”字组成的，“木”、“子”、“立”、“早”都是基本的字根。
造字法，构成汉字的笔画结构，常叫作字根，如：日、月、金、木、水、火等。
一般说来，字根是有形有意的，是构成汉字的基本单位。字根像搭积木那样，经过拼形结合，就组成了为数众多的汉字，如：明、林、森、吕、晶、能等。
由此可见，汉字从结构上讲，可分为三个层次，即笔画、字根、汉字。
要特别提注意的是，字根是一个文字学中的概念。当对汉字进行编码设计时，就不能用字根这个概念了。一方面，谁也说不清字根有多种，哪些是字根，哪些不是字根；另一方面，用字根的概念不能解释全部汉字的构成，总有许多汉字“说不清楚”，所以就无法设计出一贯到底的编码规则。
3. 汉字的三种字型
汉字是一种平面形文字。同样几个字根，摆放位置不同，就可能成为不同的字。如：用“口”和“八”两个字根，既可组成“叭”，也可组成“只”。再如：“口”和“木”两个字根，既可组成“杏”，也可组成“呆”。
由此，字根的位置关系，也是汉字的一种重要特征信息。这个“字型”信息，就是用计算机输入汉字时，告诉计算机所输入的字根的排列组合方式，有利于计算机识别。
根据汉字字根之间的位置关系，可以把成千上万的方块汉字分为三种字型：左右型、上下型、杂合型，并依序命以代号1、2、3，如表2-2所示。
4. 字根结构的四种关系
一切汉字都是由基本字根组成的，基本字根在组成汉字时，按照它们之间的位置关系可以分成四类基本结构。分析汉字的结构是为正确确定不同汉字的字型。
（1）单
单是指基本字根本身就单独构成一个汉字。
如:“由、雨、竹斤、车”等。
这类汉字不再分为某种字型,在五笔字型中称为键名字根或成字字根汉字，有专门的取码规则。
（2）散
散是指构成汉字的基本字根之间可以保持一定的距离。
如:“讲、肥、明、张、吴”等。
当对汉字提取左右、上下、杂合型字型信息时,正是以字根之间这种“散”的关系为前提的。因此，这类汉字的字型可分为左右型或上下型。
（3）连
连是指一个基本字根连一单笔画。
如“丿”下连“目”成为“自”,“丿”下连“十”成为“千”，“月”下连“一”成为“且”等。这类字虽然不多，但容易看成是上下型关系，它们的字型应该属于杂合型。
另一种情况是指“带点结构”。如：勺、术、太、主等。这种一个基本字根之前或之后的孤立点，一律视作与基本字根相连，这样的字一律视作“连”的结构。
连的关系只存在于单笔画与字根之间，而不存在于字根与字根之间。
（4）交
交是指几个基本字根交叉套迭之后构成的汉字,如:“申”是由“日、┃”，“里”是由“日、土”，“夷”是由“一、弓、人”交叉构成的等等。这类汉字的字型应属于杂合型。
在字根组字中，还有一种情况是混合型,即几个字根之间既有连的关系,又有交的关系。如“币”,是“ノ”下边连了一个“巾”,而“巾”又是由“冂”与“丨”相交形成的，自然这类汉字的字型也属于杂合型。
根据上面的分析，归纳如下：
①基本字根单独成字，在取码中对它有专门的规定，不需判断字型。
②属于“散”的汉字，可以分为左右、上下型。
③属于“连”与“交”的汉字，一律属于杂合型。
④不分左右、上下的汉字，一律属于杂合型。

汉字的编码是指汉字用一组代码来表示。例如：用数字来表示的电报码，用拼音字母来表示的拼音码。在五笔字型输入法中，汉字编码是指一个汉字由哪几个字根组成，即由所对应的哪几个键输入。这几个键就是这个汉字的编码，或者称为输入码。
为了便于记忆，把五笔字型的取码规则编成一首口诀。：
五笔字型均直观，依照笔顺把码编；
键名汉字打四下，基本字根请照搬；
一二三末取四码，顺序拆分大优先；
不足四码要注意，交叉识别补后边。
这首口诀可以概括为五笔字型拆分取码的几项原则，总结如下：
（1）对于键名字，可连续四次按该键输入。
（2）对于成字字根，可按笔画输入。
（3）对于大量的键外字，应依据如下拆分原则：
按书写顺序，从左到右，从上到下，从外到内取码的原则。
以基本字根为单位取码的原则。
按一二三末字根，最多只取四码的原则。
单体结构拆分取大优先的原则。
末笔字型交叉识别的原则，其中末笔识别码=末笔画的区号（十位数，1～5）+字型代码（个位数，1～3）=对应字母键，如表4-1所示。

五笔字型输入法把汉子输入分成三类，他们分别是：
1. 键名汉字输入
键名汉字是组字频度较高、各个区位上最常用的2个字根，除“纟”外，其他24个字根本身就是一个汉字。键名汉字有25个键名汉字的输入方法是把键名所在的键连击四下。如：
土：FFFF 日：JJJJ
木：SSSS 月：EEEE
由于每个汉字最多输入四个编码，输入了四个相同字母后，就不要再按空格键或回车键，字就直接出现在屏幕上了。
键名汉字共有25个，即：
王土大木工
目日口田山
禾白月人金
言立水火之
已子女又纟
2. 成字字根输入
在五笔字型字根键盘的每个键位上，除了一个键名字根外，还有数量不等的几种其他字根。它们中间的一部分本身也是一个汉字，我们称之为成字字根。
一切成字字根的输入，都采用统一的规定，可用一个公式表示为：
键名代码+首笔代码+次笔代码+末笔代码
也就是说：当要键入一个成字字根时，首先把它所在的那个键打一下，然后再依次打它的第一个笔画、第二个笔画及最末一个笔画。即打键名后，再打三个单笔画。如果该字根只有两个笔画，则以空格键结束。例如：
文：依次按键名41，首笔41，次笔直11，末笔41，即YYGY，屏幕上立即会出现“文”字。
由：25 21 51 11（MHNG）
十：12 11 21 （FGH）
在成字字根中，还有五种单笔划作为成字字根的一个特例，它的编码有特殊规定，将单笔画所在键击两次后，再击两个L健。这是因为单笔画并不是常用的汉字，加了两个“后缀”L键，用于区别常用汉字的简化输入。
一： 11 11 24 24 （GGLL）
丨： 21 21 24 24 （HHLL）
丿： 31 31 24 24 （TTLL）
丶： 41 41 24 24 （YYLL）
乙： 51 51 24 24 （NNLL）
由于键名字、成字字根的输入方法与一般汉字输入方法不同，必须熟悉与记住哪些字根是成字字根，哪些字根是键名字根。键名字根、成字字根还是构成汉字的基本单位。因此，应将键名字根和成字字根反复练习多次，以便熟悉和记忆。
3. 输入键外字
上述键名字及成字字根中的键面字总共有一百多个。键面字以外的汉字都是键外字，键外字是大量的。遵循以下原则将汉字进行拆分成基本字根，再按要求选取合适的基本字根即得到所需的汉字。
3.1 拆分汉字的原则
在五笔字型输入法中拆分汉字的原则可以概括成如下：
1．顺序拆分。
依照汉字的书写顺序拆分。例如：
新：“立”“木”“斤” 正确，符合书写顺序
“立”“斤”“木” 错误，未按书写顺序
中：“口”“丨” 正确，符合书写顺序
“丨”“口” 错误，未按书写顺序
夷：“一”“弓”“人” 正确，符合书写顺序
“大”“弓” 错误，未按书写顺序
2．取大优先。
“取大优先”也叫做“优先取大”。按“书写顺序”为汉字编码时，不能无限制地采用笔画少的字根。否则，汉字都将变成单笔画字根了。例如：
世：“一”“凵”“乙”错误
“廿”“乙” 正确
显然，前者是错误的，因为第二个字根“凵”，完全可以向前“凑”到“一”上：形成多一个笔画的字根“廿”。再如：
甩：“ ”“二”“乚”错误
“月”“乚” 正确
同样，第一种编码是错误的。因为第二字根的“二”，完全可以向前“凑”成“更大”一点的字根“月”。
“取大优先”，俗称“尽量往前凑”，是在汉字取字根时最常用到的“基本规则”。
3．兼顾直观。
在确认字根时，为了使字根特征明显易辨，有时就要“牺牲”“书写顺序”和“取大优先”的原则，形成个别特殊的情况。
例如：国，按“书写顺序”其字根应是：“冂、王、丶一”；但是这样编码，不但有悖于该字的字源，也不能使字根“ ”直观易辨。只好违背“书写顺序”，按“、王、丶”的顺序编码。
4．能连不交。
当一个字既可以视作“相连”的几个字根，也可视作“相交”的几个字根时，认为“相连”的情况是可取的。因为一般来说，“连”比“交”更为直观，更能显现字根的笔画结构特点。例如：
失：“�”“夫” 二者是相连的正确
“�”“大” 二者是相交的错误
朱：“丿”“未” 二者是相连的正确
“�”“木” 二者是相交的错误
注意：遇到既能“散”，又能“连”的时候，只要不是单笔画，一律按“能散不连”判别，即作为散的关系。
键外字按以上规则拆分成字根后，在编码选字根时，还要遵循以下原则：
（1）超过四码：取该字的1、2、3、末字根码。例如：
慧：三丨三心 DHDN
续：纟十乙大 SFND
（2）刚好四码：依次全部选取。例：照：日刀口灬。
容：宀八八口 PWWK
（3）不足四码：在字根键入完后由于信息量不够，需要另外加打“末笔字型交叉识别码”，仍不足四码，补空格键。
注意：如果上述编码不能输入所要的汉字，可按空格键。如果仍然不能输入正确的汉字，说明该字还需输入识别码。
3.2 输入汉字的原则
不管任何汉字，拆分成多少字根，顶多只能取汉字的四个字根。因此，键外字的编码规则为：
含四个或四个以上字根的汉字，用四个字根码组成编码；不足四个字根的汉字，编码除包括字根码以外，还须补加一个末笔识别码。如仍不够四码，可按空格键。
一个汉字拆分成的字根大于四个时，便取汉字的第一、二、三和最后一个字根码组成编码，依次的键入顺序。当键入最末一个字根码后，汉字会自动显示在计算机屏幕上，不需要打空格键。
一个汉字拆分的字根正好是四个时，即取第一、二、三和最后一个字根码组成编码，依次取完，在键入最末一个字根码（第四个编码）时，此汉字会自动显示在屏幕上，也不需要打空格键。
此处一、二、三、末笔笔画是按正常书写顺序，从左到右，从上到下，从外到内。举例如下：
编：纟户冂艹（XYNA）
照：日刀口灬（JVKO）
容：宀八人口（PWWK）
嫫：女艹日大（VAJD）
酩：西一夕口（SGQK）
3.3 识别码的定义
识别码即“末笔字型交叉识别码”，由单字的末笔画的类型编号和单字的字型编号组成。总体地说，识别代码为两位数字，第一位（十位）是末笔画类型编号（横1、竖2、撇3、捺4、折5），第二位（个位）是字型代码（左右型1、上下型2、杂合型3）。把识别代码看成为一个键的区位码，即得到交叉识别码的字母键。
识别码的作用是减少重码，加快选字，例如：

上例中，“沐”、“汀”、“洒”的编码都相同（IS），但末笔画不同，所以，加上末笔识别码后，它们的编码就不相同了。不然就会重码了。同样，“只”、“叭”的编码一样（KW），但字型不一样，所以加上字型识别码后，编码也就不相同了。
用于识别的末笔，有以下规定：
（1）凡是单笔画与字根相连者或带点结构都视为杂合型。
（2）字型区分时也用“能散不连”的原则。知、卡、严都视为上下型。
（3）内外型字属杂合型，如困、匝。但“见”为上下型。
（4）含两字根且相交者杂合型，如：东、串、电、本、无。
（5）下含“走之”字为杂合型：进、逞。
（6）以下各字为杂全型：司、床、厅、尼、式、后、反、办、皮，但相似的左、右、有、看、者、布、友等可视为上下型。

为了提高输入速度，我们将经常用汉字只取其前边一个、二个或三个字根构成简码构成了一、二、三级简码，以输入高频字。输入时只需按该字的前边一个、二个或三个字根，然后按空格键即可。因为省略了识别码，所以简码的设计会给用户带来很大的方便。
1. 一级简码
从11到55共25个键位代码，根据每一键位上的字根特征，每键安排一个最常用的高频汉字，这类字只要按键一次再敲空格键即可输入，共计25个。例如：
一（11G）地（12F）在（13D）要（14S）工（15A）
上（21H）是（22J）中（23K）国（24L）同（25M）
2. 二级简码
二级简码的汉字输入方法：只打入该字的前两个字根码再加上空格键。如：
化：亻匕 WX 玉：王丶 GY
红：纟工 YT 张：弓长 XT
妈：女马 VC 克：古儿 DQ
3. 三级简码
三级简码由单字的前三个字根码组成，只要一个字的前三个字根码在整个编码体系中是唯一的，一般都选作三级简码，共计有4000多个。此类汉字，只要打其前三个字根代码再加空格键即可。因为需要加打空格键，并没有减少总的击键次数，由于省略了最未一个字根或者“交叉识别代码”的判定，可达到简单易用和提高编码输入速度之目的。

汉字由字根组成，字根由笔画构成，笔画、字根、整字是汉字结构的三个层次。五笔字型汉字编码所选字根多数是一些传统的汉字部首，少量的选用一些不是部首的笔画结构作为字根，也硬造出了一些“字根”来。
五笔字型的基本字根有130种,加上一些基本字根的变型，共有200个左右。按照每个字根的起笔代号，分为五个“区”。它们是1区－横区，2区－竖区，3区－撇区，4区－捺区，5区－折区。每个区又分为五个“位”,区和位对应的编号就称为“区位号”。这样，就把 200个基本字根按规律放在25个区位号上，这些区位号用代码11、12、13、14、15；21、22……；51、52、53、54、55来表示，分布在计算机键盘的25个英文字母键上。
每个区位上有一个最常用的字根称为“键名字根汉字”，键名字根汉字既是组字频度高的字根，又是很常用的汉字。首先应熟记键名字根，以帮助各键位上其它字根的理解和记忆。下面是各区位上的键名字根，每个字根右面括号里的数字代码表示这个字的区位号。
1区(横区): 王(11) 土(12) 大(13) 木(14) 工(15)
2区(竖区): 目(21) 日(22) 口(23) 田(24) 山(25)
3区(撇区): 禾(31) 白(32) 月(33) 人(34) 金(35)
4区(捺区): 言(41) 立(42) 水(43) 火(44) 之(45)
5区(折区): 已(51) 子(52) 女(53) 又(54) 纟(55)

王旁青头戋五一，12 土士二干十寸雨。
13 大犬三羊古石厂，14 木丁西，15 工戈草头右框七。

21 目具上止卜虎皮，22 日早两竖与虫依。
23 口与川，字根稀，24 田甲方框四车力。
25 山由贝，下框几。

31 禾竹一撇双人立，反文条头共三一。
32 白手看头三二斤，33 月衫乃用家衣底。
34 人和八，三四里，35 金勺缺点无尾鱼，犬旁留乂儿一点夕，氏无七。
41 言文方广在四一，高头一捺谁人去。
42 立辛两点六门病，43 水旁兴头小倒立。
44 火业头，四点米，45 之宝盖，摘礻(示)衤(衣)。

51 已半巳满不出己，左框折尸心和羽。
52 子耳了也框向上。
53 女刀九臼山朝西。
54 又巴马，丢矢矣，
55 慈母无心弓和匕，幼无力。

识别码!
要什么样的识别码就要看你所打的字的最后一笔是什么,五笔将键盘分成五个区,横、竖、撇、捺、折。若你打的字的最后一笔是横，就在横区找识别码！左右结构的字就第一个字母如“江”，打IA是可以打出，但是按照正规的打法应该是IAG；若是你打的字是上下结构就打F，综全结构就打D（就是非左右、非上下）。
横区识别码是G、F、D
竖区识别码是H、J、K
撇区是T、R、E
捺区是Y、U、I
折区是N、B、V

那是识别码,原则是:
看最后一笔,再看结构.
左右结构是1
上下结构是2
混合的为3
因为"地"为左右,而且是折,所以要加N.其实这个字一个键F就可以了
"灭"呢?是混合,最后一笔是捺,所以为I
有些还跟下载的输入法有关,你的为U,而我的就需要按i
就是这样.

是识别码,第一个加N是因为也的最后一笔是折,同上,火的最后一笔是抐

最后一笔++字型结构

为了降低重码率。

识别码。

困为这两个字都需要末笔识别啊.

五笔打字初学问题

汉字文化