标准五笔字型教材




一.五笔字型基础知识

1.五笔字型输入法的特点
2.汉字的5种笔画
3.汉字的3种字型
4.5区25位的五笔字型键盘
5.五笔字型键盘的区位号规律
二.五笔字型键盘的各区字根

三.键面字输入

四.合体字的输入

1.合体字的取码规则
2.“多根字”的取码规则
3.“四根字”的编码规则
4.二根字和三根字的取码规则及“识别码”
五.简码和容错码
1.简码
2.容错码
六.词汇输入

七.附表

1.标准五笔字型简体字根键位图
2.标准五笔字型简繁体字根键位图
3.标准五笔字型字根助记歌
4.标准五笔字型编码流程图
5.标准五笔字型简体字根总表
6.标准五笔字型简繁体字根总表
7.6个特殊字符的编码
一.五笔字型基础知识

1.五笔字型输入法的特点

“五笔字型”是一种高效率的汉字输入法,是只使用25个字母键,在键盘上以汉字的笔画、字根为单位,向电脑输入汉字的方法。这一输入法,是在世界上占主导地位、应用最广的汉字键盘输入法。其主要特点如下:

(1)世界上重码最少的汉字输入法

纯形编码,编码的唯一性好。适合专职和非专职人员共同使用。按照“形码设计三原理”设计的字根键位分布,实现了同一键位上若干字根的相容性,合理地分配了编码空间,使重码减少到最低限度。平均每输入个汉字,仅有~2个字需要人工挑选。

(2)不受读音方言限制

GB18030-2000字集的汉字有27533个,中等文化水平的人只认识其中的3000个字左右,将近90%不认识或受方言影响读不准的字,只能用“形码”输入。

(3)有效地克服同音字、同音词

数万个汉字只有400多个读音,在GB18030中,读LI、JI、BI、XI、YI音的字都多达数百个;由同音字构成的同音词如“事实、失事、逝世、誓师……”,用“音码”无法辨别。然而用五笔字型输入时,字形不同,编码不同,特别适合汉字的特点及广大有方言的地区。

(4)输入效率高

五笔字型用双手十指打键。经过标准的指法训练,每分钟向电脑中输入100个汉字很是平常。1998年“京城五笔字型大奖赛”,冠军的速度是(在错1罚5的严厉评判规则下,输入生稿连续测试10分钟)经国家公证处公证,每分钟输入生稿293个汉字,创造了汉字输入的世界纪录。

(5)字词兼容

用五笔字型既能输入单字,还能输入词汇。无论多么复杂的汉字最多只打4下键,不超过32个汉字的词汇也只打4下键。字与词之间,不要任何转换或附加操作,既符合汉字构词灵活、语句中字和词难以“切分”的特点,又能大幅度地提高输入速度。

(6)越打越顺手
“五笔字型”依照“形码设计三原理”研究完成,实现了科学的“多目标”的统一。字根在键位上的组合符合“相容性”——使重码最少;键位安排符合“规律性”——使字根易记易学,而指法设计的“谐调性”——则使得各个手指的击键负担趋于合理,打起来顺手,越打越快。

(7)全球通用

“五笔字型”经过了18年之久的大规模社会实践的检验,已成为在国内外占主导地位的汉字输入技术,具有很好的通用性。学会了“五笔字型”,到处都有现成的电脑可供使用;厂家的电脑类产品装入了“五笔字型”,全国乃至世界各地,都有成百上千的人不经训练便会操作。
 

2.汉字的5种笔画

字根由笔画写成。笔画、字根、整字,是汉字结构的三个层次。

笔画是:书写汉字时,一次写成的一个连续不断的线段。 由此可推知:

(1)两笔写成的,不能叫笔画。例如:“十、口”等,它们只能叫“笔画结构”。
(2)一个连贯的笔画不能断开。例如不能把“申”分解为“丨田丨”等。

汉字的五种基本笔画是:横(一)、竖(丨)、撇(丿)、捺()、折(乙),分别用1、2、3、4、5代表。 其中,提笔“ ”实际是横“一”的变形。 点笔“丶”是捺“ ”的变形。 竖左钩“亅”是竖“丨”的变形。 折笔代表一切带转折、拐弯的笔画。

五种笔画及其代号:
 
代号
笔画
名称
走向
变形
1
左右
2
上下
3
丿
右上左下
4
左上右下
5
带转折

3.汉字的3种字型

习惯上,我们把构成汉字的基本笔画结构,称作“字根”或“部件”。根据构成汉字的各个字根之间的“位置关系”,我们可以把成千上万个方块汉字,分为以下3种字型:

左右型(字根左右排列);上下型(字根上下排列);杂合型(字根互相包围或交叉套迭)。 现在我们根据3种字型拥有字数的多少,顺序将3种字型命以数字代号1、2、3。 从此以后,我们便约定:

1型字,即指“左右型”汉字,其代号为1;
2型字,即指“上下型”汉字,其代号为2;
3型字,即指“杂合型”汉字,其代号为3。
将来,在给汉字编码时,“字型”及其代号将是非常有用的编码信息。但是,仅仅对于那些由2个或3个字根组成的字,我们才关心它的“字型”。如果一个汉字由4个或4个以上的字根组成,仅仅字根的编码已经达到了最大长度4个码,编码时,我们就不再计较是什么“型”,即不再追加“识别码”了。(“识别码”的概念及使用将会在下面有详细介绍)
 

4.5区25位的五笔字型键盘

汉字是由字根构成的,如“李”字是由“木”和“子”组成。输入“李”字时,就要依照书写顺序敲击“木”和“子”所在的键,这就好像是在电脑里让“木”和“子”拼合成了一个“李”字。

作者将构成汉字的字根,优选归纳为130种,按字根的首笔或次笔的笔画代号,有规律地分配在25个英文字母键上,形成了五笔字型的“字根键盘”。

五笔字型键盘分为5个区,区号从1到5;每一个区,各有5个键位,位号也是从1到5,位号从键盘中部向左右两端排列;区号与位号组合,共形成5×5=25个代码11,12……54,55。每个“区位号”与一个英文字母对应,其对应关系是:


 

5.五笔字型键盘的区位号规律

现以2区5位的M键为例,介绍快速记住字根区位码的方法。 第2区第5位M键如下:

由这个键可见,记住字根所在的键,可以遵循以下3点“规律”:
(1)区号与首笔代号一致。
(2)字根的位号与字根的第二笔代号一致 至此,大部分字根,只要用笔画代码“读”它的前2个笔画,就构成了字根的“区位号”(请记住,字根的这个“区位号”,正好是字根的五笔字型编码!)。
(3)单笔画的“个数”与其所在键的“位号”一致:

一、丨、丿、、乙,这5个单笔画,都在第1位;
二、,这5个双笔画,都在第2位;
三、、彡、氵、,由3个单笔构成,都在第3位;
、灬,由4个单笔构成,都在第4位。
依照以上3项规律,可立即知道以下几个字的“字根”在哪个键上:
例:参
厶:(首笔为折—5,次笔为点—4)在5区4位,54(C)
大:(首笔为横—1,次笔为撇—3)在1区3位,13(D)
彡:(撇在3区—3,系3个撇—3)在3区3位,33(E)
而54、13、33或CDE,就是“参”的五笔字型编码,即输入码。
 
 

二.五笔字型键盘的各区字根

1.第1区-横起笔

第1区:5个键上的字根及其助记词如下:

注:

1. 助记词中,11.G键上的“戋”读“兼”,13.D键上“羊”指“”。
2. “”和“”为适用于繁体汉字的字根。


2.第2区-竖起笔

第2区:5个键上的字根及其助记词如下:

注: “”、“”、“”、“” 为适用于繁体汉字的字根。
 

3.第3区-撇起笔

第3区:5个键上的字根及其助记词如下:

注:

1. 助记词中,35.Q键上的“乂”读“叉”
2. “”为适用于繁体汉字的字根


4.第4区-点起笔

第4区:5个键上的字根及其助记词如下:

注:

1. 助记词中,45.P键上的“礻”读“示”,“衤”读“衣”。
2. “”、“”、“”、“”,为适用于繁体汉字的字根,其中“”只用于繁体“飠”旁。


5.第5区-折起笔

第5区:5个键上的字根及其助记词如下:

注:

1. 助记词中,53.V键上的“臼”读“旧”,54.C键上“私”指“厶”,55.X键上的“幺”读“腰”、“”读“互腰”。
2. “”、“馬”、“”、“”、“”为适用于繁体汉字的字根。
三.键面字输入

1.键名字输入

每个键位上左上角的字根,及每句助记歌的第一个字,叫键名、键名字或键名字根。

键名字的输入法是:把所在的键连打4下。例如:

1区1位键名:11111111(GGGG)→王
3区2位键名:32323232(RRRR)→白
在标准五笔字型输入法中,键名字根有25个:
1区:王土大木工
2区:目日口田山
3区:禾白月人金
4区:言立水火之
5区:已子女又纟


2.成字字根输入

除键名以外,凡本身是汉字的字根,叫“成字根”或“成字字根”。其输入法分为两步:

① 先打一下它所在的键(这一下俗称“报户口”);
② 再打该字根的第一个、第二个及最末一个单笔画,共4下;不足4键时,补一个空格键。
例如:
用:用    丿     乙    丨          米:米    丶     丿     丶
        33    31     51    21                44    41    31     41
        E      T      N     H                  O     Y     T       Y
成字字根(包括平时不作为汉字、但也有国标码的偏旁、部首),计有100多个。其中本身是常用汉字的, 如:
1区:戋五一干士十二寸雨犬三古石厂丁西七(17个)
2区:上止早虫川甲四车力由贝几(12个)
3区:竹斤手乃八夕儿(7个)
4区:文方广辛六门小米(8个)
5区:心尸羽耳了也刀九巴马弓匕(12个)


3.单笔画输入

五种笔画 “一丨丿丶乙”的输入方法是:先打两下该笔画所在的键,再加打两下“L”键。 具体编码如下:

一:GGLL(11112424 )
丨:HHLL(21212424 )
丿:TTLL(31312424 )
丶:YYLL(41412424 )
乙:NNLL(51512424 )
说明:“一”作为常用字,被选作“高频字”,还可以打它的简码,只要打一个“G(11)”,再打一个空格便可输入。

注:其所以作如上规定,是为了把简短的编码“让位”给更常用的字,即“合理分布编码空间”。
 
 

四.合体字的输入

凡是“字根总表”上没有的汉字,也即“键外字”,都可以认为是由字根和笔画拼合而成的,这类字我们称之为“合体字”。

1.合体字的取码规则

(1)规范笔顺

“合体字”的编码,一般情况下,要按照正确的书写顺序进行。

例如:

新:立木斤(笔顺正确)
        立斤木(笔顺错误)


(2)取大优先

要以“再增添一个笔画,便不能构成笔画更多的字根”为限度,拆取“笔画尽可能多”的结构作为字根,这叫做“取大优先”。

例如:

建:  二 丨 廴(正确)
         * 一 十 廴(错误,因“十”的横笔可以向前凑,使“一”成为笔画更多的“二”)
注:“取大优先”,俗称“尽量往前凑”,是在拆分汉字时,最常用到、使拆分具有唯一性的基本规则。离开这一规则,必然使一个字有许多种拆法,使编码缺乏唯一性。例如,夷,按规范笔顺和取大优先只能拆成“一弓人”,因“弓”的第一笔添不到“一”上,“人”的第一笔也添不到“弓”上,所以拆成“一弓人”已经是“尽可能往前凑”了。另外,“夷”如拆成“大弓”,显然又违背了规范笔顺,故不可取。

(3)兼顾直观

在编码时,为了使字根特征明显易辨,有时就要暂时牺牲“书写顺序”和“取大优先”的原则,形成极个别例外的情况。

例:“国”字,按“书写顺序”,其字根应是:“冂王丶一”,但这样编码,不但有悖于该字的字源,也不能使字根“囗”直观易辨。我们只好违背“书写顺序”,按“囗王丶”的顺序编码。

同样的例子又如:

自:丿目(正确,似乎没有“取大优先”,但直观性很好。)
        亻三(错误,虽“取大优先”,但缺乏直观,且又太散。)
(4)能连不交

例如:

天:一大(正确,“一”与“大”是相连接的关系,比较直观。)
        二人(错误,“二”与“人”交叉在一起了。)
一般来说,“连”比“交”更为“直观”,更能显现字根的笔画结构特征,更易于辨认。所以,当有几种取码可能性时,“连”的应比“交”的优先。

(5)能散不连

有时候,一个汉字的几个字根,都不是单笔画,这些字根之间的关系,常常在“散”和“连”之间模棱两可。
如:  占:口 两个字根按“连”处理,便是杂合型(3型)字,如按“散”处理,便是上下型(2型)字。
如:  矢:大 当遇到这种既能“散”,又能“连”的情况时,我们规定:只要不是单笔画,一律按“能散不连”判别,即优先确定为“散”的关系,叫做“能散不连”。
 

2.“多根字”的取码规则

所谓“多根字”,是指有4个以上字根的字。这种字,我们仅仅“按书写顺序取第一、二、三及最末一个字根编码”,俗称“一二三末”,共编4个码(不再加“识别码”)。

例如:

戆:立 早  夂 工 贝 心
        42 22 31          51
        U   J   T           N
3.“四根字”的编码规则

“四根字”是指刚好由四个字根构成的字。其取码方法是“依照书写顺序将四个字根编码”。

例如:

照:日  刀 口 灬
        22 53 23 44
        J    V  K  O
4. 二根字和三根字的取码规则及“识别码”

(1) 末笔字型识别码

在使用25个键输入汉字的情况下,使用“识别码”可以极为有效地克服重码。

● 必要性之一:因字根相同,“字型”不同引起了重码:

吧:口巴(23 54, KC)
邑:口巴(23 54, KC)
这个例子说明,编码中丢失了“字型”信息,才使编码完全相同。可见,为避免重码,字型信息不能丢!

● 必要性之二:因几个字根被放在同一键位上引起了重码:

沐:氵木(43 14, IS)
汀:氵丁(43 14, IS)
洒:氵西(43 14, IS)
这个例子说明,因为“木、丁、西”同处一个键,才使三个字的编码完全相同。

由此可知,为了避免几个字的编码相同(重码),既不能丢掉“字型”信息,又有必要提取同键位字根的“笔画特征”用于编码。将这两类有区分重码能力的信息复合起来,就是“末笔字型识别码”,简称“识别码”。 “识别码”是由“末笔”代号加“字型”代号构成的一个“复合附加码”。 对于编码不够4个码的1、2、3型汉字,其“识别码”的构成及用法将在下面的“取码规则”中介绍(由4个字根或超过4个字根构成的字,是不必加“识别码”的)。

(2) 二根字及三根字的取码规则

只有2个字根的字,叫“二根字”;只有3个字根的字,叫“三根字”。

“二根字”或“三根字”,其输入编码法是:输入全部字根后,再追加一个“末笔字型识别码”(简称“识别码”)。识别码可以大量减少重码。 以下是简便直观、易学易用的识别码用法(应当在教学中大力提倡!):

① 对于1型(左右型)字,字根输入之后,补打1个末笔画,就等同于加了“识别码”(为了将识别码与实际的笔画有所区别,我们用带圆圈的笔画表示识别码)。 例如:

红:纟 工  
       55 15 11
       X   A  G
② 对于2型(上下型)字,字根输入之后,补打“由2个末笔画复合”构成的“字根”,就等同于加了“识别码”。 例如:
复:  日  夂 
        31 22 31 42
        T   J   T   U
③ 对于3型(杂合型)字,字根输完之后,补打由3个末笔画“复合构成”的“字根”,就等同于加了“识别码”。 例如:
同:冂  一  口  
        25 11  23 13
        M  G  K   D
请读者注意:凡“包围型”的字,均以“被包围部分的末笔”,作为整个字的“末笔”来构成“识别码”。 例:
“远”的识别码用“元”的末笔“乙”;
“国”的识别码用“玉”的末笔“丶”;
“或”的识别码用被“戈”包围部分“口”下边的“一”。
符号说明:以后,我们用笔画加圆圈,代表笔画形式的“识别码”。即:
1区(横区):—11·G—12·F—13·D
2区(竖区):—21·H—22·J—23·K
3区(撇区):—31·T—32·R—33·E
4区(捺区):—41·Y—42·U—43·I
5区(折区):—51·N—52·B—53·V
以上共15个符号,作为“笔画形式的识别码”。这一形式,与区位形式、字母形式的识别码完全通用。 例如,“汉”的末笔字型识别码是,意思是1型字,末笔为丶,既可以用“丶”的区位码41表示,也可以用4区1位的字母Y表示,、41、Y三者作用相同,因为打的是同一个键。

对于带圆圈的“笔画形式的识别码”,实际输入打键时,只打圈里边的笔画就行了。在书写时外带圆圈,只是为了便于与真正的笔画有所区别。
 
 

五.简码和容错码

1. 简码

常用的汉字,除可以按它的全码输入外,多数都还可以只取其最前边的一至三个字根,再加空格键输入。也就是只取其全码的最前边的一个、二个或三个码,再加打空格键(表示输入结束),形成所谓一、二、三级简码,从而提高了输入速度。

(1) 一级简码(又称“高频字”编码)

将各个字根键打一下,再打一下空格键,便可打出25个最常用的汉字(每键一个):

一地在要工,上是中国同,和的有人我,主产不为这,民了发以经
如:
一:11(G)
的:32(R)
和:31(T)
25个高频字与键位对应如下图所示:


 

(2)  二级简码(只输入全码的前2个码):

如:

化:亻匕(34 55,WX)
李:木子(14 52,SB)


(3) 三级简码(只输入全码的前3个码):

如:

想:木目心(14 21 51,SFN)
巍:山禾女(25 31 53,MTV)


2. 容错码

“容错码”的涵义是:“容易”编错,但“容许”编错的码。容错码的设置,是为了照顾不同的取码习惯,使他们用容易编错的码,照样可以打出所要的字来。“容错码”主要有以下三种类型:

(1)  编码容错 个别汉字的书写笔顺因人而异,致使字根的拆分序列也不尽相同,因而容易弄错。如“长”和“秉”都有多种笔顺:

长:丿TAYI (正确码)
长:丿ATYI(容错码)
长:丿一TGNY(容错码)
长:一丿GNTY(容错码)
(2)  字型容错 个别汉字的字型分类不易确定,如:
占:HKF(上下型,正确码)
占:HKD(杂合型,容错码)
(3)  定义后缀 为了进一步减少甚至杜绝重码,人为地将一些重码字的最后1个码或2个码修改为L(24),或改为有识别能力的字根的做法,叫“定义后缀”。

例如:“喜”与“嘉”重码,输入码都是FKUK。因为“喜”更常用,输入后显示在提示行的第一位,可以默认上屏,相当于不重码,等于“独享”原来的编码FKUK;为了使“嘉”在保留原来编码的同时,也能够“一步到位”上屏,就将最后一码K改为L,使“嘉”也可“独享”一个编码FKUL,这样输入FKUL就只出来“嘉”一个字了。  这些常见重码字的“人工修正码”请见下表:
 
汉字 原码 定义码
YEU YEUL
UFK UFKL
FGHY FGHL
IFH IFHL
MQI MQIL
YWXN YWXL
XNN XNNL
FKUK FKUL
IHIT IHIL
GOI GOIL
WFG WFGL
DDDD DDDL
SGNN SGNL
DYI DYIL
DNV DNVL
SOU SOUL
YUVO YUVL
UDHF UDHL
NNGN NNGL
YNKY YNKM
YNKY YNKV
YNKY YNKJ
YNKY YNKU
TMGT TMGM
TMGT TMGI
TMGT TMGG

注:字母下边加圆点“.”者为补加或被修改的编码。
 

六.词汇输入

在输入词汇时,32个汉字以内的词汇,一律只取4码,单字和词汇可以混合输入,字词之间不用任何换档或附加操作,这叫做“字词兼容”。

1.2字词编码

取每字全码的前两码组成,共4个码,例如:

生产:    丿    立   丿
                31  11  42   31(TGUT)
经济:    纟    氵   文
                55  54  43   41(XCIY)
2.3字词编码

前两个字各取第一码,最后一个字取前两码,共4个码,例如:

电视机:日   礻  木   几
                22  45 14   25(JPSM)
太平洋:大   一  氵  
                13  11  43  42(DGIU)
3. 4字词编码

每字各取其第一个码,共4个码,例如:

科学技术: 禾     扌  木
                     31  43  32  14(TIRS)
实事求是: 宀  一   十  日
                     45 11  12  22(PGFJ)
4. 多字词编码

取第一、二、三及最后一个汉字的第一个码,共4个码,例如:

常务委员会:   夂  禾   人
                        43  31  31  34(ITTW)
中华人民共和国:口   亻  人  囗
                                23  34  34  24(KWWL)
七.附表

1.标准五笔字型简体字根键位图


 

2.标准五笔字型简繁体字根键位图

注:

(1).P键上的繁体字根“”仅用于繁体偏旁“”中,“”的编码为:人(3445,WP)。
(2).在香港增补字中,其中某些字形结构可等同于标准五笔字型中的字根,具体如下:
”等同于字根“言”
”等同于字根“艹”
”等同于字根“
”等同于字根“雨”
”等同于字形“”,取码也是:人 (3445,WP)。
3.标准五笔字型字根助记歌

4.标准五笔字型编码流程图

flow

5.标准五笔字型简体字根总表

radicals

6.标准五笔字型简繁体字根总表

TCH

7.6个特殊字符的编码
 
GNE
NNE
GNEL
NNEL
HGGG
KGD