温暖一平方
守护困在信息系统“盲区”的生僻字
中青报·中青网记者 沈杰群
最近,一个生僻字冲上热搜。[(上边是少了一横的“鸟”,下边是“甲”),nia,四声]姓是云南丽江傈僳族中一支以鸟为图腾家族的姓氏,这个字为上下结构的汉字,上边是少了一横的“鸟”,下边是“甲”。
进入数字时代,由于(nià)这个姓氏无法在信息系统中使用,为避免购票、办卡等均无法正常输入、显示的麻烦,该姓氏的上百人被迫把姓改成了“鸭”。
据统计,全国有6000万人名及大量地名、古籍、方言中包含生僻字,其中多数尚未实现数字化。很多人名、地名中的生僻字还无法在信息化系统中正常使用。
数字时代,我们该如何守护那些被困在信息系统“盲区”的汉字?中青报·中青网记者在温暖一平方直播间展开了采访。
图片来源:“汉字守护计划”
中国社会科学院语言研究所研究员、原词典编辑室主任谭景春认为:“汉字正是由于独特的表意方块形体,才具备超时间和空间的能力,使得我国7个大方言区的人们的交流在书面上能够顺利进行,也使得中国几千年的灿烂文化能够留传至今。”
谭景春表示,“汉字收录在《康熙字典》里的有4万多个,收录在《汉语大字典》里的有6万多个,收录在《中华字海》里的有87019个。不过现代通用的也就5000到8000个,比如2013年6月,由国务院正式发布的《通用规范汉字表》收录了8105个汉字”。几千年来,汉字在维护民族和国家的统一,记录和保存文化遗产等方面发挥了巨大的作用。
每一个生僻字姓氏,往往承载着本土文化的“基因”。
《中国民间故事丛书》的云南丽江华坪卷,记述了关于傈僳“nià”姓来历的传说故事。
传说很久很久以前,深居在大山里的一户傈僳族人家生下了一个小孩,但没几天小孩的妈妈因病去世,父亲用鸟肉汤喂养小孩活下来,逐渐长大。为了让孩子记住这段经历,父亲就给他取了一个名,叫“nià”,意思是用鸟肉汤喂大的孩子。从此以后,傈僳族中就有了这个姓氏。
“nià”这个姓氏留存着傈僳族对如守护神一般鸟类的纪念和崇拜。因姓氏无法在信息系统中顺畅地输入与显示,为了避免麻烦被迫改姓“鸭”,这是一种何其无奈的遗憾。“弃用”生僻汉字,无疑意味着当地人被迫割舍了一段深厚的民族历史文化。
[(冫口),zhàn]子庄位于山东省日照市东港区涛雒镇驻地东南7公里,紧邻黄海,交通便捷。因“(冫口)”字生僻,20世纪80年代地名标准化的过程中,在官方名称里被同音字“栈”替代。
山东日照栈子村村民傅承田接受中青报·中青网记者采访时表示,传说清朝时一位军官发现地图上此地没有名字,便集思广益,让当地人一起取名。部分读书人观察地形、方位和周围物象,最终造出了“(冫口)”这个字和zhàn的读音。村里50岁以上的人都知道“(冫口)”字的来历,但是年轻人对这个字和背后的来历没有印象。
傅承田说,该村目前居住着3000多人,在外地的约有四五千人。“我非常希望‘(冫口)’字能够让更多人了解,让我们村的历史也能返璞归真”。
由于汉字属于象形、表意文字,难学、难记、难写。进入了数字时代,用键盘输入汉字仍然存在着难写的问题——有些汉字打不出来。谭景春认为“这是数字时代对汉字提出的挑战,同时也是时代给予中华民族的一次机遇”。
在谭景春看来,打不出生僻字,不仅会给一部分人的工作和生活带来困扰和不便,也意味着宝贵的汉字文化遗产正在流失。
为何生僻字的信息化如此难?
工信部电子工业标准化研究院中文信息研究室主任黄姗姗介绍,汉字是一种表意文字,跟表音文字不同。每个汉字都有它独特的含义和字形,那么生僻字其实就是表意字所特有的信息处理问题。“信息系统要认识汉字就需要一字一形一码来建立对照表,一个汉字有形没有码,或者编码不被某个系统所支持,就成了信息时代的生僻字”。
黄姗姗说,汉字信息化编码难度高,开发字库的工作费时费力,生僻字的标准化专业又复杂。“目前的一个痛点是,虽然尽管很多字已经被收录进了标准,但是产品对标准的支持并不充分。大多数应用、软件产品支持的汉字量都在2万-3万,一些个性化的字库产品甚至只有几千字”。
黄姗姗坦言,生僻字的搜集和整理是一个长期的工作,已经开展了几十年,未来还会继续开展。
日前,由腾讯搜狗输入法联合工信部电子工业标准化研究院等多方发布“汉字守护计划”公益行动,守护那些“被困”数字时代盲区的生僻字。
今年4月20日“联合国中文日”,搜狗输入法联合多方上线全国首个“生僻字征集”微信小程序,直接面向用户征集无法输入的生僻字。该程序是由工信部电子工业标准化研究院指导和推荐的生僻字提交入口,用户通过拍照上传,即可提交。
“生僻字征集”小程序上线后,首日访问量突破63万,用户提交生僻字1404个。经专业审核,通过的生僻字将被赋码并录入国标字库,最终实现在电脑、手机等设备及信息系统中无障碍地输入与显示。
工信部电子工业标准化研究院副院长孙文龙表示:“电子标准院2022年牵头制定强制性国家标准GB 18030《信息技术 中文编码字符集》,所有政务服务、公共服务的产品与系统均须符合标准,这将有效解决生僻字引发的公共障碍。”