新浪科技

腾讯上线救字文档,发挥公众力量抢救457个“濒危”生僻字

中国青年网

关注

据不完全统计,全国有6000余万人的姓名,以及大量地名、古籍、方言中包含生僻字。缺少信息系统里的通用编码,亦或编码不被某个系统支持,都会造成生僻字无法输入和显示问题。这些无法被显示的“数字障碍”,给人们工作生活带来诸多不便,有不少人甚至被迫改名换姓。

11月10日,“汉字守护计划”公益行动发布一周年成果。官方指导“生僻字征集”小程序迄今有2500多万人次参与,共提交生僻字16800个。经工信部电子工业标准化研究院初筛,其中有457个生僻字尚未获得强制性国家标准GB 18030《信息技术 中文编码字符集》编码。

这些生僻字以地名、人名、方言用字为主,具有较高的实用价值或文化价值。例如在广西岑溪市南渡镇,一种传统手工地方小吃中出现的“米助”字、广东佛山市高明区地名用字“土㞧”、广东河源市连平县的方言用字“扌篮”等。

为进一步判断是否适宜编入编码字符集,专家们还需要收集更多资料做价值考证,包括但不限于这些生僻字的读音、字形、释义、文献用例、实际用例等。这是一项繁琐耗时的工作,即使以平均两天一个字的考证速度来算,整理完457个生僻字也得两年多。有不少疑难字缺乏文献记载,即便耗费大量时间,依然无法找到文献用例,只能去到实际使用的地方寻找佐证材料。

对此,腾讯在“生僻字征集”小程序内上线“救字文档”功能,面向公众征集457个生僻字的相关考证资料,以协助专家组加快完成考证及编码申请。如果你在日常生活中看见过这些字,或在古籍、地方志等文献资料中发现这些字,都可以将这些信息拍照,填写至“救字文档”,资料汇集后,有助于专家更高效便捷地收集考证资料。微信搜索“生僻字征集”小程序即可加入。

生僻字数字化是一项复杂的系统工程。每个汉字应用于数字系统,都要经历“发现、考证、编码、扩容国标、字形设计、输入显示、推广应用”等一系列环节。

为打通这条数字化链路,去年11月,腾讯联合工信部电子工业标准化研究院、北京国家金融标准化研究院、汉仪字库、OPPO、陕西历史博物馆等机构与企业,共同发起“汉字守护计划”公益行动,发挥各自优势,加速贯通生僻字数字化全链路,旨在助力破解生僻字使用难题。该计划于今年4月20日世界中文日上线“生僻字征集”小程序,直接面向公众征集无法输入的生僻字。

腾讯输入法部总经理鲁剑表示,“汉字守护计划关注全链路,‘生僻字征集’小程序初见成效,核心在于以民生与文化为出发点,以数字科技汇聚公众向善之力。此次开发‘救字文档’,希望发挥平台的连接作用,让这些未编码汉字尽早拥有‘数字身份’。同时,腾讯搜狗输入法将继续务实推进生僻字解决方案在金融、医疗等民生场景落地。”

工信部电子工业标准化研究院中文信息研究室主任黄姗姗表示,“生僻字征集小程序以创新方式为‘收字’提供高效支撑,特别是此次筛选的457个未编码汉字,更多来源于各地居民的日常生活,有着很深的群众基础和鲜活的社会生命力。电子工业标准化研究院正全力优先开展此批汉字的考证工作,加快推动编码,扩容国标字库。”

加载中...