正扬社区

 找回密码
 立即注册
搜索
热搜: 活动 交友 discuz
查看: 8845|回复: 20

汉字编码

[复制链接]
发表于 2015-6-11 18:07:23 | 显示全部楼层 |阅读模式
本帖最后由 任振敏 于 2015-6-11 21:06 编辑

                           《通用汉字输入法》培训教材
            说明
通用取码汉字输入法》已由国家专利局于2013年12月11日公示,2013年12月18日进入实质审查阶段。(专利申请号201310411410)    本教材是发明者工作单位湖南省澧县兰江职业中专的校本教材,为即将授权后的推广工作培训教学人员之用。任何人未经发明人允许,不得将本教材以及相关内容擅自商用,否则将依《中华人民共和国专利法》追究其法律责任。
    发明人从上世纪70年代末就开始进行汉字编码研究工作。在发明本专利的过程中,首先得到原常德师专(现湖南文理学院)党委书记陈芳柏同志和中文科负责人萧汉初同志,中文科教授胡力文先生的支持与鼓励。本发明涉及一定数量的音韵学知识,有不少知识点受益于湖南文理学院教授易亚新老师的指导。在申报专利的过程中,得到了原湖南省科技厅厅长,省政府科技顾问,现湖南省创新方法研究会理事长曾庆炎同志,省知识产权局负责人陈仲伯同志和曾艺同志的指导和帮助。发明人所在学校的前后三任校长卢次之同志,彭光乔同志和曾斌同志都给予了大力支持和鼓励。其他学校领导和处室负责人丁士贵,孙际泉,曾贤君,邬继金,张亚雄,谭学荣,皮业书,毛先溪,张远军,金义淼,周奇志,王承松,周乾净,赵跃林,杨绍华,黎正云,王本为等同志以及同事张国平,汤应辉,李世宏,易平,王岚,戴明,杨福界,刘清炎,王卫平,张华,张业银,张承梅,张小林,唐劲松,毛传淼,向林英,蒋浩华,李金莲,祁德生,杨小梅,皮华丽,李华云,赵平,胡萍华,黄志象,皮远协,曾凡梅,黄珍香,陈红云,向艳红,陈娟 ,彭元雄,尹福生,毛士军,宋贤宏,周平,张愈忠,陈培贵,唐雄伟,严文生,阳贤珍,王彩和彭红霞等老师或者是多次给与指导,或者是经常交换意见。特别应该提到的是我校信息科学高级讲师毛泽玉老师和李和清老师就有关专业知识多次给与及时的指导。学校教研科学资料编印处的负责人周巧银老师和向才连老师为有关资料的编印长期提供及时而优质的服务。我家的世交,多年邻居,中国工程院院士雷志栋教授也曾经对我的相关工作表示关心。本专利申报由湖南长沙星耀专利事务所代理,姜芳蕊,宁星耀,黄美龄等老师为此付出了许多心血。我的许多同学以及曾经教过的学生也为本方案的诞生做出了各自的贡献,限于篇幅,这里就不一一提及了。在此,我仅以诚挚之心,真挚之情对各位的厚爱与关心表示感谢!
                    任振敏  2014,5,15.
    目录

       一   通用汉字输入法基础知识                            二   独体字的取码方法     
       三   二部分字的取码方法                                四   三部分字的取码方法
       五   特殊字型部分的划分                  
       六   简码与特码                          
       七   通用取码输入法音形混合版            
       八   通用取码法全息数字版               
       九   难点解析                           
       十   评估与展望(阅读材料)              
            

回复

使用道具 举报

发表于 2015-6-11 18:25:16 | 显示全部楼层
    要保护知识产权,要尊重发明者!
回复 支持 反对

使用道具 举报

 楼主| 发表于 2015-6-11 18:38:17 | 显示全部楼层
谢谢!
回复

使用道具 举报

发表于 2015-6-12 10:44:46 | 显示全部楼层
佩服任先生!敬重任先生!!
回复 支持 反对

使用道具 举报

 楼主| 发表于 2015-6-12 12:39:02 | 显示全部楼层
本帖最后由 任振敏 于 2015-6-12 12:43 编辑
毛先金 发表于 2015-6-12 10:44
佩服任先生!敬重任先生!!

     难忘当年同学情!
我简单把您的名字的编码过程介绍一下。
   这是独体字,第一笔是“撇”,第二笔和第三笔组成“多横”,第四笔是“弯”,第一码位由最开始的两笔(或笔组)决定,即“撇-多横”,“撇”的代号是3,“多横”的代号是2,这样第一码位就由(3,2)确定。查表知对应字母H,由于“毛”字笔画少,除了最开始的笔画(组)对以外,只有最后笔画(组)对了,而且“多横”还要重复用两次。最后笔画(组)对为“多横-弯” 对应(2,5),查表知对应字母为V。最后一笔是弯,它有2个交点,就是它与两横的相交点,与撇的公共点叫作“通点”,是一笔的端点与另一笔的中间点重合,不算“交点”,弯“的代号为5,两个交点的代号为4,那么末必状态为”弯-两交点“,对应(5,4),查表对应字母T。”毛“是比较常用的字,一般用三位简码就行了。所以”毛“的常用简码是HVT,如果有的场合必须用全码的话,由于”毛“不是数字,用第一笔”撇“的拼音第一字母P补充,所以,”毛“的全码是HVTP.
   该字的上部的四笔不是国家规定的偏旁部首而又和下部连在一起,该字还是算独体字,(由于恰好是四笔,错看成二部分字也不影响编码的正确性),该字的第一,第二和最后笔画对分别是”撇-横“,”竖-横“和”撇-弯“,分别对应(3,1),(2,1)和(3,5)。对应的字母分别是C,B和W.最后一笔是弯,代号为5.和横有一个”通点“,即一笔的端点与另一笔的中间点重合,这样状态为”只有一通点“,代号为2,这样他的末笔状态对应(5,2),进而对应字母J,所以”先“字的编码为CBWJ.
    虽是两部分字,因第一部分为2笔,与独体字编码的方法相同。第一,第二,第三和最后笔画对是”撇—捺“,”多横—竖“,”点—撇“和”撇—横“,分别对应字母R,G,N,C.故该字的编码为RGNC。
   这种纯形码版在划分部分上有点麻烦,音形混合版不须划分部分,简单得多,容后再谈。
回复 支持 反对

使用道具 举报

发表于 2015-6-12 15:59:41 | 显示全部楼层
佩服!
回复

使用道具 举报

发表于 2015-6-12 16:01:33 | 显示全部楼层


我慢慢学习。
回复 支持 反对

使用道具 举报

发表于 2015-6-12 19:03:14 | 显示全部楼层
任振敏 发表于 2015-6-12 12:39
难忘当年同学情!
我简单把您的名字的编码过程介绍一下。
毛    这是独体字,第一笔是“撇”,第 ...

领教了!
回复 支持 反对

使用道具 举报

 楼主| 发表于 2015-6-12 21:46:25 | 显示全部楼层
本帖最后由 任振敏 于 2015-6-12 21:54 编辑

      分为左右两大部分,左边是国家规定的偏旁部首,有没有被分成各自连接起来的几块,不能再分割,右边的上部虽然不是国家规定的偏旁部首,但各笔连接成一个板块,可作为右边的一个小部分,右边的下部既是规定的偏旁部首,又连接成一块,是右边的最后小部分。左边是“多点-横”,对应(5,1)进而对应字母E。右边的上部有3笔组,(有两横合并为多横),可以取出两对笔画对,第一对是“多横-竖”,对应(2.2)进而对应字母G,最后一对是“竖-横”,对应(2,1),进而对应字母B。右边的下部虽然可取两对笔画(组),但只剩下一个码位了,全字的最后笔画对应优先利用,即用“弯-多横”,对应(5,2)进而对应字母J.所以,清字的编码是EGBJ.
河    边的情况与前一个字相同,右边是半包围结构,而且包围构件要分两次书写,按规定“横为”第一部分,“口”为第二部分,“竖钩”为第三部分。取码时,要尽量取出最靠边的笔画。右边的第一笔画对跨越了两个小部分,为“横-竖”对应字母F,接着第三码位是难点,“口”字的下面一横的下面在没有笔画,应被取出,所以第三码位应为字母E,只要能去除第四码位,毫无例外都是整个字的最后一组笔画对决定,即由“横-弯”决定字母U.所以“河”字的编码是EFEU.
   要用到末笔状态,最后一笔为“竖”,它与“弯”的公共点同时为两笔的中间点,称作“交点”,所以末笔状态为“竖--  一交”,对应(2,3),进而对应字母L所以。该字的编码是KVJL.
衣    最后一笔“捺”与前面的横和两撇都有公共点,与横和后撇的公共点是“通点”,与前撇的公共点是“接点”,即公共点为两笔的端点,但这一点与捺和横的公共点重合,能看成通点的不做接点,能看成交点的不看成接点,故末笔状态是“捺-仅通”,对应(4.2)进而对应字母I。该字的编码是DWRI.
    EUCT        松    FRRT         山      用了末笔状态还没有编满四位,该字不是数字,用她的第一笔“竖”的汉语拼音第一字母 填补。该字的编码是VJBS.
衣”和“山”都是常用字,很可能不必使用四位全码,我是为了说明一般方法而讲的。






-
回复 支持 反对

使用道具 举报

 楼主| 发表于 2015-6-13 07:47:55 | 显示全部楼层
本帖最后由 任振敏 于 2015-6-13 07:49 编辑
吉祥 发表于 2015-6-11 18:25
要保护知识产权,要尊重发明者!

吉      很明显分为上下两部分。上部也是全字第一对是“横--竖”,对应(1,2),进而对应字母F.上部最后一对是“竖--横”,对应(2,1)进而对应字母B。下部第一对”竖--弯“,对应(2,5)进而对应字母V。下部也是全字最后一对”弯--横“对应(5,1)进而对应字母E.该字的编码是FBVE.
      分为左右两大部分,左边第一对”点--弯“对应(4,5)进而对应字母X,左边最后对”竖--点“对应(2,4)进而对应字母Q。右边第一对”点--撇“对应(4,3)进而对应字母N.全字最后一对”多横--竖“对应(2,2)进而对应字母G。该字的编码为FQNG.
这是两个最容易编码的字。明显分为两部分,每部分都有3笔(组)或以上。一半以上的汉字都属于这种情况。






回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|小黑屋|手机版|Archiver|正扬社区

GMT+8, 2025-2-15 08:07 , Processed in 0.040999 second(s), 20 queries .

Powered by http://www.cdzyw.cn 常德正扬社区

© 2022-2023 正扬社区

快速回复 返回顶部 返回列表