1.五笔字型输入法的特点二.五笔字型键盘的各区字根
2.汉字的5种笔画
3.汉字的3种字型
4.5区25位的五笔字型键盘
5.五笔字型键盘的区位号规律
1.合体字的取码规则五.简码和容错码
2.“多根字”的取码规则
3.“四根字”的编码规则
4.二根字和三根字的取码规则及“识别码”
1.简码六.词汇输入
2.容错码
1.标准五笔字型简体字根键位图一.五笔字型基础知识
2.标准五笔字型简繁体字根键位图
3.标准五笔字型字根助记歌
4.标准五笔字型编码流程图
5.标准五笔字型简体字根总表
6.标准五笔字型简繁体字根总表
7.6个特殊字符的编码
“五笔字型”是一种高效率的汉字输入法,是只使用25个字母键,在键盘上以汉字的笔画、字根为单位,向电脑输入汉字的方法。这一输入法,是在世界上占主导地位、应用最广的汉字键盘输入法。其主要特点如下:
(1)世界上重码最少的汉字输入法
纯形编码,编码的唯一性好。适合专职和非专职人员共同使用。按照“形码设计三原理”设计的字根键位分布,实现了同一键位上若干字根的相容性,合理地分配了编码空间,使重码减少到最低限度。平均每输入个汉字,仅有~2个字需要人工挑选。
(2)不受读音方言限制
GB18030-2000字集的汉字有27533个,中等文化水平的人只认识其中的3000个字左右,将近90%不认识或受方言影响读不准的字,只能用“形码”输入。
(3)有效地克服同音字、同音词
数万个汉字只有400多个读音,在GB18030中,读LI、JI、BI、XI、YI音的字都多达数百个;由同音字构成的同音词如“事实、失事、逝世、誓师……”,用“音码”无法辨别。然而用五笔字型输入时,字形不同,编码不同,特别适合汉字的特点及广大有方言的地区。
(4)输入效率高
五笔字型用双手十指打键。经过标准的指法训练,每分钟向电脑中输入100个汉字很是平常。1998年“京城五笔字型大奖赛”,冠军的速度是(在错1罚5的严厉评判规则下,输入生稿连续测试10分钟)经国家公证处公证,每分钟输入生稿293个汉字,创造了汉字输入的世界纪录。
(5)字词兼容
用五笔字型既能输入单字,还能输入词汇。无论多么复杂的汉字最多只打4下键,不超过32个汉字的词汇也只打4下键。字与词之间,不要任何转换或附加操作,既符合汉字构词灵活、语句中字和词难以“切分”的特点,又能大幅度地提高输入速度。
(6)越打越顺手
“五笔字型”依照“形码设计三原理”研究完成,实现了科学的“多目标”的统一。字根在键位上的组合符合“相容性”——使重码最少;键位安排符合“规律性”——使字根易记易学,而指法设计的“谐调性”——则使得各个手指的击键负担趋于合理,打起来顺手,越打越快。
(7)全球通用
“五笔字型”经过了18年之久的大规模社会实践的检验,已成为在国内外占主导地位的汉字输入技术,具有很好的通用性。学会了“五笔字型”,到处都有现成的电脑可供使用;厂家的电脑类产品装入了“五笔字型”,全国乃至世界各地,都有成百上千的人不经训练便会操作。
字根由笔画写成。笔画、字根、整字,是汉字结构的三个层次。
笔画是:书写汉字时,一次写成的一个连续不断的线段。 由此可推知:
(1)两笔写成的,不能叫笔画。例如:“十、口”等,它们只能叫“笔画结构”。
(2)一个连贯的笔画不能断开。例如不能把“申”分解为“丨田丨”等。
汉字的五种基本笔画是:横(一)、竖(丨)、撇(丿)、捺()、折(乙),分别用1、2、3、4、5代表。
其中,提笔“
”实际是横“一”的变形。
点笔“丶”是捺“
”的变形。
竖左钩“亅”是竖“丨”的变形。 折笔代表一切带转折、拐弯的笔画。
五种笔画及其代号:
|
|
|
|
|
|
|
|
|
![]() |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
![]() ![]() ![]() ![]() ![]() |
习惯上,我们把构成汉字的基本笔画结构,称作“字根”或“部件”。根据构成汉字的各个字根之间的“位置关系”,我们可以把成千上万个方块汉字,分为以下3种字型:
左右型(字根左右排列);上下型(字根上下排列);杂合型(字根互相包围或交叉套迭)。 现在我们根据3种字型拥有字数的多少,顺序将3种字型命以数字代号1、2、3。 从此以后,我们便约定:
1型字,即指“左右型”汉字,其代号为1;将来,在给汉字编码时,“字型”及其代号将是非常有用的编码信息。但是,仅仅对于那些由2个或3个字根组成的字,我们才关心它的“字型”。如果一个汉字由4个或4个以上的字根组成,仅仅字根的编码已经达到了最大长度4个码,编码时,我们就不再计较是什么“型”,即不再追加“识别码”了。(“识别码”的概念及使用将会在下面有详细介绍)
2型字,即指“上下型”汉字,其代号为2;
3型字,即指“杂合型”汉字,其代号为3。
汉字是由字根构成的,如“李”字是由“木”和“子”组成。输入“李”字时,就要依照书写顺序敲击“木”和“子”所在的键,这就好像是在电脑里让“木”和“子”拼合成了一个“李”字。
作者将构成汉字的字根,优选归纳为130种,按字根的首笔或次笔的笔画代号,有规律地分配在25个英文字母键上,形成了五笔字型的“字根键盘”。
五笔字型键盘分为5个区,区号从1到5;每一个区,各有5个键位,位号也是从1到5,位号从键盘中部向左右两端排列;区号与位号组合,共形成5×5=25个代码11,12……54,55。每个“区位号”与一个英文字母对应,其对应关系是:
现以2区5位的M键为例,介绍快速记住字根区位码的方法。 第2区第5位M键如下:
由这个键可见,记住字根所在的键,可以遵循以下3点“规律”:
(1)区号与首笔代号一致。
(2)字根的位号与字根的第二笔代号一致 至此,大部分字根,只要用笔画代码“读”它的前2个笔画,就构成了字根的“区位号”(请记住,字根的这个“区位号”,正好是字根的五笔字型编码!)。
(3)单笔画的“个数”与其所在键的“位号”一致:
一、丨、丿、依照以上3项规律,可立即知道以下几个字的“字根”在哪个键上:、乙,这5个单笔画,都在第1位;
二、、
、
、
,这5个双笔画,都在第2位;
三、、彡、氵、
,由3个单笔构成,都在第3位;
、灬,由4个单笔构成,都在第4位。
厶:(首笔为折—5,次笔为点—4)在5区4位,54(C)而54、13、33或CDE,就是“参”的五笔字型编码,即输入码。
大:(首笔为横—1,次笔为撇—3)在1区3位,13(D)
彡:(撇在3区—3,系3个撇—3)在3区3位,33(E)
第1区:5个键上的字根及其助记词如下:
注:
1. 助记词中,11.G键上的“戋”读“兼”,13.D键上“羊”指“”。
2. “”和“
”为适用于繁体汉字的字根。
第2区:5个键上的字根及其助记词如下:
注: “”、“
”、“
”、“
”
为适用于繁体汉字的字根。
第3区:5个键上的字根及其助记词如下:
注:
1. 助记词中,35.Q键上的“乂”读“叉”
2. “”为适用于繁体汉字的字根
第4区:5个键上的字根及其助记词如下:
注:
1. 助记词中,45.P键上的“礻”读“示”,“衤”读“衣”。
2. “”、“
”、“
”、“
”,为适用于繁体汉字的字根,其中“
”只用于繁体“飠”旁。
第5区:5个键上的字根及其助记词如下:
注:
1. 助记词中,53.V键上的“臼”读“旧”,54.C键上“私”指“厶”,55.X键上的“幺”读“腰”、“三.键面字输入”读“互腰”。
2. “”、“馬”、“
”、“
”、“
”为适用于繁体汉字的字根。
1.键名字输入
每个键位上左上角的字根,及每句助记歌的第一个字,叫键名、键名字或键名字根。
键名字的输入法是:把所在的键连打4下。例如:
1区1位键名:11111111(GGGG)→王在标准五笔字型输入法中,键名字根有25个:
3区2位键名:32323232(RRRR)→白
1区:王土大木工
2区:目日口田山
3区:禾白月人金
4区:言立水火之
5区:已子女又纟
2.成字字根输入
除键名以外,凡本身是汉字的字根,叫“成字根”或“成字字根”。其输入法分为两步:
① 先打一下它所在的键(这一下俗称“报户口”);例如:
② 再打该字根的第一个、第二个及最末一个单笔画,共4下;不足4键时,补一个空格键。
用:用 丿 乙 丨 米:米 丶 丿 丶成字字根(包括平时不作为汉字、但也有国标码的偏旁、部首),计有100多个。其中本身是常用汉字的, 如:
33 31 51 21 44 41 31 41
E T N H O Y T Y
1区:戋五一干士十二寸雨犬三古石厂丁西七(17个)
2区:上止早虫川甲四车力由贝几(12个)
3区:竹斤手乃八夕儿(7个)
4区:文方广辛六门小米(8个)
5区:心尸羽耳了也刀九巴马弓匕(12个)
3.单笔画输入
五种笔画 “一丨丿丶乙”的输入方法是:先打两下该笔画所在的键,再加打两下“L”键。 具体编码如下:
一:GGLL(11112424 )说明:“一”作为常用字,被选作“高频字”,还可以打它的简码,只要打一个“G(11)”,再打一个空格便可输入。
丨:HHLL(21212424 )
丿:TTLL(31312424 )
丶:YYLL(41412424 )
乙:NNLL(51512424 )
注:其所以作如上规定,是为了把简短的编码“让位”给更常用的字,即“合理分布编码空间”。
凡是“字根总表”上没有的汉字,也即“键外字”,都可以认为是由字根和笔画拼合而成的,这类字我们称之为“合体字”。
(1)规范笔顺
“合体字”的编码,一般情况下,要按照正确的书写顺序进行。
例如:
新:立木斤(笔顺正确)
立斤木(笔顺错误)
(2)取大优先
要以“再增添一个笔画,便不能构成笔画更多的字根”为限度,拆取“笔画尽可能多”的结构作为字根,这叫做“取大优先”。
例如:
建:注:“取大优先”,俗称“尽量往前凑”,是在拆分汉字时,最常用到、使拆分具有唯一性的基本规则。离开这一规则,必然使一个字有许多种拆法,使编码缺乏唯一性。例如,夷,按规范笔顺和取大优先只能拆成“一弓人”,因“弓”的第一笔添不到“一”上,“人”的第一笔也添不到“弓”上,所以拆成“一弓人”已经是“尽可能往前凑”了。另外,“夷”如拆成“大弓”,显然又违背了规范笔顺,故不可取。二 丨 廴(正确)
一 十 廴(错误,因“十”的横笔可以向前凑,使“一”成为笔画更多的“二”)
(3)兼顾直观
在编码时,为了使字根特征明显易辨,有时就要暂时牺牲“书写顺序”和“取大优先”的原则,形成极个别例外的情况。
例:“国”字,按“书写顺序”,其字根应是:“冂王丶一”,但这样编码,不但有悖于该字的字源,也不能使字根“囗”直观易辨。我们只好违背“书写顺序”,按“囗王丶”的顺序编码。
同样的例子又如:
(4)能连不交自:丿目(正确,似乎没有“取大优先”,但直观性很好。)
亻三(错误,虽“取大优先”,但缺乏直观,且又太散。)
例如:
天:一大(正确,“一”与“大”是相连接的关系,比较直观。)一般来说,“连”比“交”更为“直观”,更能显现字根的笔画结构特征,更易于辨认。所以,当有几种取码可能性时,“连”的应比“交”的优先。
二人(错误,“二”与“人”交叉在一起了。)
(5)能散不连
有时候,一个汉字的几个字根,都不是单笔画,这些字根之间的关系,常常在“散”和“连”之间模棱两可。
如: 占:口
两个字根按“连”处理,便是杂合型(3型)字,如按“散”处理,便是上下型(2型)字。
如: 矢:大
当遇到这种既能“散”,又能“连”的情况时,我们规定:只要不是单笔画,一律按“能散不连”判别,即优先确定为“散”的关系,叫做“能散不连”。
所谓“多根字”,是指有4个以上字根的字。这种字,我们仅仅“按书写顺序取第一、二、三及最末一个字根编码”,俗称“一二三末”,共编4个码(不再加“识别码”)。
例如:
戆:立 早 夂 工 贝 心3.“四根字”的编码规则
42 22 31 51
U J T N
“四根字”是指刚好由四个字根构成的字。其取码方法是“依照书写顺序将四个字根编码”。
例如:
照:日 刀 口 灬4. 二根字和三根字的取码规则及“识别码”
22 53 23 44
J V K O
(1) 末笔字型识别码
在使用25个键输入汉字的情况下,使用“识别码”可以极为有效地克服重码。
● 必要性之一:因字根相同,“字型”不同引起了重码:
吧:口巴(23 54, KC)这个例子说明,编码中丢失了“字型”信息,才使编码完全相同。可见,为避免重码,字型信息不能丢!
邑:口巴(23 54, KC)
● 必要性之二:因几个字根被放在同一键位上引起了重码:
沐:氵木(43 14, IS)这个例子说明,因为“木、丁、西”同处一个键,才使三个字的编码完全相同。
汀:氵丁(43 14, IS)
洒:氵西(43 14, IS)
由此可知,为了避免几个字的编码相同(重码),既不能丢掉“字型”信息,又有必要提取同键位字根的“笔画特征”用于编码。将这两类有区分重码能力的信息复合起来,就是“末笔字型识别码”,简称“识别码”。 “识别码”是由“末笔”代号加“字型”代号构成的一个“复合附加码”。 对于编码不够4个码的1、2、3型汉字,其“识别码”的构成及用法将在下面的“取码规则”中介绍(由4个字根或超过4个字根构成的字,是不必加“识别码”的)。
(2) 二根字及三根字的取码规则
只有2个字根的字,叫“二根字”;只有3个字根的字,叫“三根字”。
“二根字”或“三根字”,其输入编码法是:输入全部字根后,再追加一个“末笔字型识别码”(简称“识别码”)。识别码可以大量减少重码。 以下是简便直观、易学易用的识别码用法(应当在教学中大力提倡!):
① 对于1型(左右型)字,字根输入之后,补打1个末笔画,就等同于加了“识别码”(为了将识别码与实际的笔画有所区别,我们用带圆圈的笔画表示识别码)。 例如:
红:纟 工② 对于2型(上下型)字,字根输入之后,补打“由2个末笔画复合”构成的“字根”,就等同于加了“识别码”。 例如:![]()
55 15 11
X A G
复:③ 对于3型(杂合型)字,字根输完之后,补打由3个末笔画“复合构成”的“字根”,就等同于加了“识别码”。 例如:日 夂
![]()
31 22 31 42
T J T U
同:冂 一 口请读者注意:凡“包围型”的字,均以“被包围部分的末笔”,作为整个字的“末笔”来构成“识别码”。 例:![]()
25 11 23 13
M G K D
“远”的识别码用“元”的末笔“乙”;符号说明:以后,我们用笔画加圆圈,代表笔画形式的“识别码”。即:
“国”的识别码用“玉”的末笔“丶”;
“或”的识别码用被“戈”包围部分“口”下边的“一”。
1区(横区):以上共15个符号,作为“笔画形式的识别码”。这一形式,与区位形式、字母形式的识别码完全通用。 例如,“汉”的末笔字型识别码是,意思是1型字,末笔为丶,既可以用“丶”的区位码41表示,也可以用4区1位的字母Y表示,—11·G
—12·F
—13·D
2区(竖区):—21·H
—22·J
—23·K
3区(撇区):—31·T
—32·R
—33·E
4区(捺区):—41·Y
—42·U
—43·I
5区(折区):—51·N
—52·B
—53·V
对于带圆圈的“笔画形式的识别码”,实际输入打键时,只打圈里边的笔画就行了。在书写时外带圆圈,只是为了便于与真正的笔画有所区别。
常用的汉字,除可以按它的全码输入外,多数都还可以只取其最前边的一至三个字根,再加空格键输入。也就是只取其全码的最前边的一个、二个或三个码,再加打空格键(表示输入结束),形成所谓一、二、三级简码,从而提高了输入速度。
(1) 一级简码(又称“高频字”编码)
将各个字根键打一下,再打一下空格键,便可打出25个最常用的汉字(每键一个):
一地在要工,上是中国同,和的有人我,主产不为这,民了发以经如:
一:11(G)25个高频字与键位对应如下图所示:
的:32(R)
和:31(T)
(2) 二级简码(只输入全码的前2个码):
如:
化:亻匕(34 55,WX)
李:木子(14 52,SB)
(3) 三级简码(只输入全码的前3个码):
如:
想:木目心(14 21 51,SFN)
巍:山禾女(25 31 53,MTV)
“容错码”的涵义是:“容易”编错,但“容许”编错的码。容错码的设置,是为了照顾不同的取码习惯,使他们用容易编错的码,照样可以打出所要的字来。“容错码”主要有以下三种类型:
(1) 编码容错 个别汉字的书写笔顺因人而异,致使字根的拆分序列也不尽相同,因而容易弄错。如“长”和“秉”都有多种笔顺:
长:丿(2) 字型容错 个别汉字的字型分类不易确定,如:TAYI (正确码)
长:丿
ATYI(容错码)
长:丿一TGNY(容错码)
长:一丿
GNTY(容错码)
占:(3) 定义后缀 为了进一步减少甚至杜绝重码,人为地将一些重码字的最后1个码或2个码修改为L(24),或改为有识别能力的字根的做法,叫“定义后缀”。口
HKF(上下型,正确码)
占:口
HKD(杂合型,容错码)
例如:“喜”与“嘉”重码,输入码都是FKUK。因为“喜”更常用,输入后显示在提示行的第一位,可以默认上屏,相当于不重码,等于“独享”原来的编码FKUK;为了使“嘉”在保留原来编码的同时,也能够“一步到位”上屏,就将最后一码K改为L,使“嘉”也可“独享”一个编码FKUL,这样输入FKUL就只出来“嘉”一个字了。 这些常见重码字的“人工修正码”请见下表:
汉字 | 原码 | 定义码 |
哀 | YEU | YEUL |
斗 | UFK | UFKL |
寸 | FGHY | FGHL |
汁 | IFH | IFHL |
冈 | MQI | MQIL |
讹 | YWXN | YWXL |
幻 | XNN | XNNL |
嘉 | FKUK | FKUL |
渺 | IHIT | IHIL |
灭 | GOI | GOIL |
仕 | WFG | WFGL |
靥 | DDDD | DDDL |
朽 | SGNN | SGNL |
丈 | DYI | DYIL |
尤 | DNV | DNVL |
粟 | SOU | SOUL |
谦 | YUVO | YUVL |
眷 | UDHF | UDHL |
巳 | NNGN | NNGL |
赢 | YNKY | YNKM |
嬴 | YNKY | YNKV |
蠃 | YNKY | YNKJ |
羸 | YNKY | YNKU |
微 | TMGT | TMGM |
徽 | TMGT | TMGI |
徵 | TMGT | TMGG |
注:字母下边加圆点“.”者为补加或被修改的编码。
在输入词汇时,32个汉字以内的词汇,一律只取4码,单字和词汇可以混合输入,字词之间不用任何换档或附加操作,这叫做“字词兼容”。
1.2字词编码
取每字全码的前两码组成,共4个码,例如:
生产: 丿2.3字词编码立 丿
31 11 42 31(TGUT)
经济: 纟氵 文
55 54 43 41(XCIY)
前两个字各取第一码,最后一个字取前两码,共4个码,例如:
电视机:日 礻 木 几3. 4字词编码
22 45 14 25(JPSM)
太平洋:大 一 氵![]()
13 11 43 42(DGIU)
每字各取其第一个码,共4个码,例如:
科学技术: 禾4. 多字词编码扌 木
31 43 32 14(TIRS)
实事求是: 宀 一 十 日
45 11 12 22(PGFJ)
取第一、二、三及最后一个汉字的第一个码,共4个码,例如:
常务委员会:七.附表夂 禾 人
43 31 31 34(ITTW)
中华人民共和国:口 亻 人 囗
23 34 34 24(KWWL)
注:
(1).P键上的繁体字根“3.标准五笔字型字根助记歌”仅用于繁体偏旁“
”中,“
”的编码为:人
(3445,WP)。
(2).在香港增补字中,其中某些字形结构可等同于标准五笔字型中的字根,具体如下:“”等同于字根“言”
“”等同于字根“艹”
“”等同于字根“
”
“”等同于字根“雨”
“”等同于字形“
”,取码也是:人
(3445,WP)。
![]() |
GNE |
![]() |
NNE |
![]() |
GNEL |
![]() |
NNEL |
![]() |
HGGG |
![]() |
KGD |