难念的汉字生意经

中国经济周刊
作为中国最大的中文字库厂商,方正诉宝洁公司侵犯著作权案,更像是说书人开场前那一记醒木:提醒你,要讲述的是整个中国字库行业的故事——曾经的辉煌和自豪,现在的惨淡和悲哀。
这是一个历史悠久、曾经规模庞大、但一直鲜为人知的行业。从当年超过60多亿的“铅字”产业规模到如今仅仅数百万的电脑字库年营业额,市场极度萎缩,人才严重流失,企业奄奄一息,这个与我们每个人息息相关的行业,发生了哪些不为人知的故事?
方正维权,有人认为是对汉字的垄断,有人认为是字库厂商存亡的关键,有人认为是信息化产业知识产权困境的写照。事关几个汉字,索赔不过百万,为何如此复杂?
《中国经济周刊》记者 张伟/北京报道
没有中国人能离得开汉字。但对于计算机字库和字体,可能很多人并不了解,哪怕是一些业内人士。一位字库企业的工作人员就曾对记者解释说:“宋体,是宋徽宗写的字。”其实,宋体不是宋徽宗写的字,宋徽宗写的字叫“瘦金体”。
我们在日常生活中经常接触到字库。用电脑写文章时,Word软件里面供选择的字体,如宋体、黑体、楷体等,就是字库在电脑中的体现。用手机发短信时,那一个个汉字,也是因为手机里捆绑了字库。通俗地讲,字库就是把字体数字化后形成的数据库软件。
我们用字库在电脑里写文章,用手机发短信,企业用字库制作广告,打印文件等等,需要向字库企业交钱吗?交多少钱?
这正是方正想通过起诉宝洁告诉我们的。
方正电子:
起诉宝洁、暴雪皆因“字体”维权
“打官司是被迫的,不是我们期望的。我们希望通过这样的官司,能够有典型的意义,教育更多的人,去合理合法地使用方正字库。”北京北大方正电子有限公司(下称“方正电子”)字模开发部部长黄学钧说。
6月18日,北京市海淀区法院对“北京北大方正电子有限公司诉广州宝洁有限公司(下称‘宝洁公司’)侵犯著作权”一案开庭审理。
据黄学钧介绍,2008年5月,方正电子在位于中关村的家乐福发现,宝洁公司生产的55款产品的外包装、产品标识、产品商标、产品广告宣传品上,大量使用了方正的字库产品——方正“倩体”系列(细倩、中倩、粗倩)等5款字体,侵权产品包括“飘柔洗发露”、“飘柔精华素”等。经过数次交涉,同年8月,方正电子以侵犯美术作品著作权为由,将生产商宝洁公司和家乐福一起告上了法庭,要求宝洁立即停止使用并销毁所有带有方正5款字体的外包装、产品标识、产品商标、产品广告宣传品;家乐福立即停止销售所有带有上述字库字体的产品;要求两被告公开赔礼道歉、消除影响,连带赔偿经济损失142万元和原告为制止侵权行为支出的费用5.8万元。
庭审时,方正电子当庭改变了诉讼请求,将涉案字体由方正倩体等5款字体减至倩体1种,赔偿数额也由142万元降至134万元,撤销了要求家乐福承担连带赔偿责任的请求。黄学钧告诉《中国经济周刊》,改变诉讼请求是希望更简单更快地把案子了结,其他几款被侵权字体将会单独提起诉讼。
海淀法院并未当庭宣判。
为什么告宝洁?
尽管身为国内字库厂商的龙头,拥有160多种、数百款字体,占据国内字库市场的大半江山,但方正字库本身并不赚钱。“字库业务的投入和产出基本持平,要靠公司的其他业务来养,”黄学钧告诉《中国经济周刊》,“我们面临的最大问题就是盗版问题。”
以方正电子2007年与演员徐静蕾合作开发的个性化字体——方正静蕾简体为例,自推出到现在,10元一套的字库,方正电子只卖出了2000多套,而网上的非法免费下载,据方正电子估计,应该不少于100万套。“产品推出的第二天,网上就出现了盗版,我们为开发这款字体投入了大量的人力、财力,最后赔了。”
用百度检索“方正字库下载”和“方正字体下载”,分别有27800和33800个页面。而这6万多个下载链接中,没有一个是方正授权的。“我们现在的合法用户几乎全在报社,我们的收入来源也主要在报社。”据黄学钧介绍,这和双方多年来的合作有关,方正的传统业务就是报纸的排版系统,直到今天,将近90%的内地报纸和海外中文报纸依然是方正的客户。
根据方正字库的授权模式,用户购买了一套正版的方正字库即拥有了字库软件的使用权,可以安装到一台计算机上使用。个人用户可用于个人非商业目的,企业用户可用于内部编辑、打印、设计小样等工作。如果企业要将方正字体应用于广告、产品包装等商业目的,必须得到方正电子专门的授权。根据用户选择的字体、使用范围和使用时间,方正电子根据现有价格体系提供相应的授权价格。
“就像你买了一张DVD光碟,你自己在家看,没有任何问题,但你要用作商业目的,就得另外掏钱。”据黄学钧介绍,常见的字库侵权行为有三种:一为非法复制,如全球知名游戏开发和运营公司美国暴雪公司,在其开发的网络游戏《魔兽世界》中,未经方正电子的许可,大量复制、使用了方正北魏楷书体等5款字体。二为剽窃,如潍坊文星科技开发有限公司(下称“文星公司”)将方正电子的12款字体进行简单修改后,作为自己的字库产品进行销售。三为非法使用,在方正电子看来,宝洁就属于这一情况,未得到授权就将方正倩体用做商业用途。
“很多盗版我们视他们是善意的,他们不了解,不清楚,无意中使用了我们的字体,我们先给他发个函件,告知他侵权的事,大部分都会在收到函件后积极和我们协商解决。”黄学钧告诉《中国经济周刊》,之所以起诉宝洁,是因为宝洁收到方正电子的律师函后没有积极地回应,“刚开始还有一两个邮件回复我们,后来就不理我们了。没办法,我们只能寻求法律上的帮助。”
而起诉宝洁的目的,则是想“教育市场”。“主要是觉得公众、企业的版权意识越来越强,环境越来越好,我们去打这样的官司才有意义,否则,忙活半天,无疾而终,做了也白做。” 方正电子字模部总经理张建国表示。这从2007年方正电子起诉暴雪公司侵权案可以得到证明。
“起诉暴雪对我们有直接的正面影响。我们现在向企业发函,谈字库的使用、授权,企业已经很少和我们谈法律问题了,一般都直接谈授权价格。以前和企业交涉,他们和网友的想法差不多:这东西还有版权?这两年,有企业会主动和我们联系,而且主动的越来越多。”据业内人士透露,基于“为和而打,以打促和”的原则,2008年,方正把世界500强在华的企业挨个“捋了一遍”,收获500多万。
方正:野心家还是受害者?
2007年方正诉暴雪字体侵权案,尽管至今尚未正式开庭,但在方正电子看来,一点悬念也没有。
“100%能赢,我们非常有信心。”黄学钧说,因为暴雪公司是非法整体复制方正的5款字体,侵犯了字库作为软件的著作权。“案子至今尚未审理,主要是过程中的问题,法院调查、取证,包括审计暴雪公司靠游戏盈利的情况,可能需要一定的时间。”
此案曾位居《中国经济周刊》推出的“2007中国十大知识产权案件”之首。
但宝洁案和暴雪案并不一样。第一,宝洁公司购买了方正电子的正版字库软件;所以,并不构成侵犯字库软件的著作权。第二,宝洁公司相关产品只使用了方正倩体等5款字体的部分汉字,并非像暴雪一样,整体复制。
据媒体报道,宝洁公司的代理律师认为,宝洁公司已经购买了方正字库,所以有权在外包装上使用该字体,方正公司的诉求属于“二次收费”,损害了文字的传播,损害了公众利益。
有网友说:“方正疯了,想垄断汉字。”如果说,诉暴雪的方正在许多人心中尚是“民族英雄”的话,那么,诉宝洁的方正在许多人心中似乎已成了“野心家”。至少,宝洁公司的代理律师就宣称,他们不是为宝洁而战,而是为社会而战。
“字体不等于汉字,这是两个概念。”黄学钧表示,字体是汉字的风格,就像汉字的衣服,方正的各款计算机字库都是投入巨大的人力、物力、财力开发出来的,具有软件和美术作品的著作权,宝洁公司在未得到方正电子授权的情况下将方正字体用于广告、包装等商业用途,属于侵权行为。
此外,黄学钧还表示,方正电子不仅没有垄断汉字,相反,为了方便大家使用汉字,主动放弃了方正的书宋、仿宋、黑体、楷体4款字体的发布权收费,“只要你购买了正版字库软件,这4款字体,不管是个人使用还是商业使用,我们都不再收费。这4款字体完全可以满足人们日常生活中90%以上的需要。此外,只要是公益性质的或者非商业学术性活动,方正所有的字库产品都是免费的。”
方正电子的代理律师董秀生告诉《中国经济周刊》,本案的焦点是字体是否应该受到《著作权法》中的美术作品著作权保护。记者在采访中了解到,字库作为软件受到著作权的保护,已是法律界的共识,但能否作为美术作品受到著作权保护,还存在争议。
记者曾多次致电宝洁中国,但截至发稿时未能与相关部门取得联系。
“我们饱受盗版之苦,但这么多年来我们没有大声地去说,去主张我们的权利,因为‘大声说’需要花钱,我们没钱。”黄学钧说。
方正尚且如此,其他字库厂商可想而知。
字库厂商:
“如果方正输了,我们就死了”
让人不可思议的是,最关心、最紧张方正诉宝洁侵权案结果的,并不是当事双方。因为对于他们来说,结果无非是输赢。但对于一些字库企业来说,此案的结果“关系着自己的生死”。
一家字库企业的苦涩
这是一家曾经非常辉煌的字库企业,但因为盗版等原因,企业长期亏损,目前已几乎无法正常运营。公司的老总在讲述过程中,几度眼眶湿润,他用“惨状”来形容企业的现状。“我就是一个最贫穷的家长,带着一帮孩子,天天围着灶台转,煮了一锅稀饭,别说吃好了,我能把他们喂饱吗?能把他们养活吗?”
因为还要继续艰难经营,他不希望记者披露他的姓名和企业的名称,“因为这些状况写出来太难看了。当然,你就是不说名字,同行也知道我是谁,因为做字库的就剩我们几家了。”
2000年时,这家企业便开始出现亏损,并持续至今。因为一直亏损,大股东开始裁员减薪。“我们的薪水在上世纪90年代曾经是中上水平,但2004年之后,竟然倒退到了1998年的水平,现在还是这样。10年间,物价涨了多少?现在北京市的平均工资3000多元,而我们的员工一半以上都不用交税,因为收入达不到个税起征点。”
“我们的员工都是字库行业的精英,他们从18岁就开始做字库,都有10多年的从业经验,在全球字库行业都应该是大家争抢的人才,但薪水就这个价格。我们生活在社会的最底层。有的员工工作十几年了,老婆都娶不起。许多员工买不起房子,养不起小孩,看不起病,基本上要靠家人养着。但这个行业又很窄,员工另找工作也不容易,除非跳到方正,但也就这么一家方正。”
这位公司老总说,自己最不好意思和外人提及薪水状况,“我是总经理,1998年我的月工资就有5000多元,而现在只有4000多元。有一次,我觉得一个培训班挺好的,想参加,但需要缴纳2000元的费用,我就没去,太贵了,公司不能再加大亏损了,一分钱我得当两分钱花啊。我办公室的花挺漂亮吧,都是我自己掏钱买的。”
薪酬过低导致公司人才流失严重。“我的设计师被挖走了,我的销售经理被挖走了,我的技术支持改行了,我的技术经理跳槽了。”据这位公司老总介绍,公司员工已经从几年前的40多人减少至目前的十几个人。现在,他还兼着技术部经理、市场部经理和造字部经理三个职务。“没办法,我只能兼着了,一个人做四个人的活儿。”
因为长期亏损,该公司已经许多年没有进行字库研发,没有推出新产品了。“我们现在已经难到不能再难了。”据公司老总介绍,大股东一直想放弃,一直要卖掉公司。“我对他们说,我在这里做了这么多年,公司就是我的孩子,你卖给谁,我就跟着谁走。但是最好别卖,我们的技术和品牌还在,卖了,国内就剩方正一家了,就没竞争了。我们也是中国文化产业的一个重要组成部分,消失了是一大损失。”
“我们非常希望媒体能把我们的惨状告诉公众和相关部门,多宣传宣传我们字库行业,让大家知道字库是有知识产权的,是我们投入心血和劳动换来的,”这位公司老总告诉《中国经济周刊》,“我们非常关注方正起诉宝洁的案子,如果方正赢了,我们就可以把它作为案例去维权,去和那么多使用我们字库的企业谈判:你们都免费用了这么多年了,该交钱了吧!但如果方正输了,我们就死了。” 最后几句话,他几乎是咬着牙,一个字一个字地说出来的。
国内的字库行业似乎从来没有像今天这样的脆弱。10多年前,业内人士还自豪于字库行业的“辉煌”。
曾经的辉煌
计算机时代到来之前,我们暂且把这个设计字体、铸造铅字的行业称为字体行业。
我国古代印刷出版业在宋代进入黄金时代。宋代木刻雕版的字体逐渐形成一定的风格,并于明朝趋于成熟,被称作“宋体”或者“明体”,是现代最通行的汉字印刷体——宋体的始祖。
清朝末年,近代印刷术传入中国,铅字印刷继续沿用宋体。与此同时,中国印刷出版界开始研究、推出新的字体。至上世纪三四十年代,仿宋、黑体、楷体等现代最通行的印刷字体先后出现。
解放后,随着我国出版事业的繁荣发展,以及配合国家汉字简化方案的实施,才逐步形成现在我们所使用的标准化、规范化的字体。上世纪60年代初,黑体、宋体、仿宋、楷体(简称“黑宋仿楷”)成为印刷出版中的常用字体。
据《中华印刷通史》记载,到上世纪70年代末,国内三家字模厂共有设备463台,职工1084人,字模年产量达3457万只。
据方正电子字模开发部部长黄学钧介绍,计算机字体出现前,国内仅铸字耗用的铅合金便达20万吨,铜模有200万副,当时价值人民币60亿元。这是一个规模庞大的产业。以文字605厂(原上海字模二厂)为例,其1987年的产值便达到了1300万元。
1975年,由北京大学王选教授主持研制汉字激光照排系统,史称“748工程”。1987年,方正汉字激光照排系统开始在《经济日报》全面应用,中国出版印刷业告别“铅与火”,迎来“光与电”。字模厂、字模、铅字逐渐退出历史舞台。
据方正电子字模部总经理张建国介绍,当时许多企业出于惯性开始生产字库。“方正有报纸排版系统,中国印刷科学技术研究所有图书排版系统,联想、四通有文字处理机,大家必须要开发中文字库。但限于当时的技术水平,各家字库无法兼容,方正当时开发的字库,别家的系统也没法用。”激光照排应用后,信息化时代到来之前,字库开发主要为了印刷,解决铅字时代的很多印刷字体字稿,如黑宋仿楷等的数字化的过程。简单地说,就是如何把纸上的汉字变到计算机里去。“当时,市场对字库的需求量很大,大家处于一种饥渴的状态。”
北京汉仪科印信息技术有限公司(下称“汉仪公司”)便是在此背景下成立的。它成立于1993年,由中国印刷科学技术研究所(下称“印科所”)与海峡交流基金会首任董事长辜振甫先生旗下的台泥资讯股份有限公司合资成立,专业从事开发、销售中文字库。
“汉仪的名字就是辜振甫先生起的,意思是宣扬汉字的仪态、汉文化的风度。”据汉仪公司副总经理刘嘉煜介绍,上世纪90 年代初期,国内市场上还没有数字化曲线轮廓字库(目前的主流字库类型),仅有10 来种字体风格的点阵或矢量的数字化字库,如黑宋仿楷、魏碑、隶书、圆头、彩云,且字数不全,彩云体才4000多字。而且,点阵字库在显示上并不能令人满意。“我们看好这个市场,觉得未来有很大的发展空间,公司成立之前,就和台泥开始合作,去国外接受培训,购买设备和技术,同时,组织专家设计字稿,比如把彩云体补齐。”1995年,汉仪公司便向市场推出46款高质量的字体。
据刘嘉煜介绍,从上世纪90年代初开始,整个90年代成为我国字库行业发展最辉煌的年代,国内大大小小的字库厂商有几十家,比较知名的有方正、汉仪、华文、华光、中易、四通、长城等。短短10年中,国内高品质的数字化曲线轮廓字库从无到有,发展到近200 种不同字体风格的近 400 款字库。
据记者了解 ,字库行业主要厂商都有各自的客户群。新闻出版界,主要是方正;平面设计方面,主要是汉仪;电雕制版行业,主要是华文。
盗版来了
“1997-1999年,公司还是盈利的。”汉仪公司副总经理刘嘉煜告诉《中国经济周刊》,当时,汉仪的高端产品捆绑在照排机上销售,每套售价六七万元,在市场上非常受欢迎。“但后来,盗版出来了。”
字库产品分为前端产品(用于排版系统)和后端产品(即高端产品,用于输出设备)。前端产品售价低,以汉仪字库为例,从1995年到2007年,从40多款字体到130多款字体,价格一直没变,每套168元,2007年后,调价至1000元。
“前端产品没法保护,你提不提价,反正没人买,都是盗版使用。每次我们参加展会等活动,打折,50元一套,能卖出几十套就不错了,一年的销售额也不过几万元。”后端产品是汉仪公司的主要收入来源。但因为盗版的出现,汉仪字库受到了极大的冲击。“我们的后端产品本来是加密的,但道高一尺魔高一丈,被解密了。我们怎么加密,人家怎么解密,我们不得已开始降价,但人家总比我们便宜很多。因为盗版,后端产品的市场迅速饱和。此外,大大小小的输出中心越来越多,输出行业的利润空间越来越小,输出四色胶片,原来一张40多元,现在一张只有几块钱,他们也不可能花很多钱买我们的字库。再加上一些公司搞了新技术,把我们的前端字库进行转化,可以用在后端设备去输出使用,更是雪上加霜。”
据刘嘉煜介绍,由于字库厂商的投资得不到应有的回报,厂商开发字库的热情降低。最近五六年,投放市场的字库数量较之上世纪90年代有了很大的下降,只有几十款。国内的字库厂商数量也从几十家减少到几家,而真正具有生产规模的字库厂商只有方正和汉仪。字库行业的很多优秀人才也纷纷改行。记者在采访中了解到,有的字体设计师甚至改行做了汽车销售。
据方正电子字模开发部部长黄学钧介绍,方正因为有排版软件、输出软件,所以自己的字库不仅单独卖,还会加在系统里卖。“只卖字库是生存不下去了。现在,学设计的年轻人,愿意做字体设计的很少,因为赚不了钱。我们公司做字体设计的,在方正体系内还可以,因为方正对字库还有投入,但离开方正就很难生存。”
汉仪公司则开始转向海外市场。“我们这些年在做海外市场,还能赚些钱,有时还做代工,谁给钱我们就给谁设计字体,我们得吃饭。”汉仪公司副总经理刘嘉煜感慨地说。
被误解的字库经济
几乎每个人都是字库厂商的直接或间接用户。即便你不读书不上网不用手机,但你难道不看电视,不看春晚?而春晚的字幕、贺电和对联等,用的便是某家字库厂商的字体。但这家企业的负责人很委婉地拒绝了记者的提问——“它付钱了吗?”
面对巨大的生存压力,面对规模庞大的“善意”的盗版者,字库企业谨慎地表达着自己的愿望。
汉仪公司副总经理刘嘉煜告诉《中国经济周刊》,很多用户不了解造字行业,有很多误解。
首先,有人认为,字库是先设计几十或几百个字,然后其它字由电脑程序变化出来的。
“实际上一款好的字库是经过很复杂的工艺流程设计、加工出来的,像绣花一样,是一个字一个字地绣出来的。一款国标GB2312-80字库有6763个汉字,根据难易程度,成本在20万~50万元人民币。截至目前,公司在开发字库上已投入了几千万元。”
其次,有人认为,常规的正文字库,如宋、黑、仿、楷等字体,是老祖宗留下来的东西,字库厂商怎么会拥有版权呢?应该是由国家投资,做好后让大家免费使用。
“实际上,做字库是没有政府行为的,国家没有投一分钱,这都是厂商的投资行为。黑宋仿楷比别的字库更难做,费用高、周期长,因为它是印刷字体,用途广,要求高。”
第三,有人认为,古人的字迹、作品加工成字库后应该没有版权归属,大家可以随便使用。
“以宋徽宗赵佶的瘦金体为例,国标字库至少需要6763个汉字,但赵佶没写那么多字,只有4000多字,而且还是繁体字,还有异体字,大家不一定认识。我们要进行简化字设计,还要拼字,有一系列的再加工。古人的书法作品没有版权,但经过厂商投入,制作成数字化字库之后的字体是有版权归属的。”
第四,有人认为,买了字库光盘就可以任意使用:如显示、编辑、打印、传输、媒体发布等等。
“我们需要强调和宣传的是,字库是一种艺术作品的集合,任何艺术作品在复制、发布、发行时都是需要获得授权的。”
许多人还无法接受使用某款字体需要付费的现实。而字库企业无法接受的是,自己的字库即使卖得这么便宜,许多人还不愿意付费。“我们在销售字库时,把产品分成了‘使用权’和‘发布权’,这是国情决定的。国外一个西文字库,百十个字符,卖几十美金或者欧元,我们一款字库,至少近7000个汉字,卖不到人民币10元。所以,要对发布权进行授权使用,否则我们靠什么生存?一个广告公司,你有几百台电脑,一年流水十几个亿,你哪怕100台电脑中安装我的正版软件,也花不了多少钱,才几万元。因为你安装得多,我会给你打折。”
一家不愿意透露姓名的字库企业负责人告诉《中国经济周刊》,如果有5%的用户使用正版,公司就可以生存下去,但目前使用盗版的用户是99.99%。
字库的未来
作为信息化时代的高新技术产品和新鲜事物,字库维权在法律上缺少足够的支持,法律界对如何保护字库的著作权也有不同的看法。怎么保护字库?应不应该保护字体?国外哪些做法可以借鉴?如何判断字体侵权?
方正电子字模部总经理张建国告诉《中国经济周刊》,方正开始重视版权,是从起诉文星公司侵权开始的。“上世纪九十年代之前,整个行业的版权意识都不是很强。我们饱受盗版之苦,但也不知道怎么保护。当时文星把我们12款字库拷贝之后,改了个名字,就变成他的文星XX字体了。我们当时还不知道怎么去起诉,就是觉得这里肯定有问题,但它侵犯了我们什么权利,我们也和律师在讨论。法院最后判它侵犯我们的美术作品著作权,从那时候开始,我们才知道有这样一条路可以走,可以去维权。”为防止侵权,方正在设计字体上进行着越来越严格的量化,比如宋体“一”字的右上角有一个小三角,“我们会把三个角的度数确定下来,并申请著作权保护”。
“字库行业很窄、很冷门,没人了解我们的酸甜苦辣,我们怎么活的,怎么生存,大家都不知道。所以,现在维权、打盗版非常难。那些提供非法下载的小网站,好多我连他的联系人和联系方式都找不见,好不容易找到一个,举报了,关了,人家两个小时后重新注册一个域名,又开始了,防不胜防。我们有时候连诉讼的保全费都出不起,经常出了很多调查费用、公证费用,找不着人,维权之路艰难而漫长。盗版,音乐开始抓了,电影也在抓了,图片也在抓了,可我们字库呢?”一位字库企业的负责人说。
其实,世界上最好、最大的中文字库在日本。据方正电子介绍,目前,大陆有421款中文字库,香港有106款,台湾有296款,三者相加,也不及日本字库总数的零头,日本有2973款字库,仅宋体就有300多款,每一款字库中,除几十个片假名、平假名外,其他几千个字都是汉字。受盗版所累,国内的字库产品不仅字体少,字体质量也差,技术也落后。
“我们经常看见国外的明星有汉字纹身,会很高兴,很自豪:外国人喜欢中国和中国文化。其实,这些老外中间有相当一部分人都以为这是日本字,因为他们是从日本字库或者日本出版物里选的。”一位业内人士叹息道。
事实上,常被我们引以自豪的、如群星璀璨的中国书法名家的作品,大部分并未开发成字库。国内字库产品中,大多数是印刷字体,是不同风格的黑宋仿楷系列。以方正为例,古今书法名家的字体,只开发了5款:柳(公权)体、瘦金书、康(有为)体、舒(同)体、启(功)体。原因是:目前的正版客户主要集中在出版印刷业,这个领域的主要需求是印刷字体。“中国古今书法名家的作品,是我们独特的、巨大的、珍贵的资源。这将是我们以后的重点开发方向,但目前,我们只能先保证企业生存。”方正电子字模开发部部长黄学钧说。
汉仪公司副总刘嘉煜告诉《中国经济周刊》,经常会有用户问她:“汉仪的字这么好,我们很喜欢用,你们为什么不开发新产品了?每次他们问我这个问题时,我就反问:好啊,我们可以做新字体,你会掏钱买吗?对方笑一笑,就不吭声了。”
从文化资源到生产力范畴,从语言问题理念到语言资源理念,从文字信息化到语言信息化——
语言文字:
信息化时代的国家“硬实力”
——专访国家语委副主任、
教育部语言文字信息管理司司长李宇明
《中国经济周刊》记者 张伟/北京报道
最近,教育部语言文字信息管理司李宇明司长和商务印书馆的老总王涛在筹划一件事情——设立“中国语言奖”,由商务印书馆斥资成立基金会,每年评选一次,奖励那些把语言和语言知识转化为生产力和经济产品的人。
“我想,第一个可以得奖的是王选院士和他的团队。激光照排技术让中国出版印刷业告别‘铅与火’,走进‘光与电’;第二个就是104岁的周有光先生,《汉语拼音方案》的主要创制人之一,我们民族走向现代化的过程中,汉语拼音起了很大的作用;第三个得奖的,应该是解决了人机自动翻译的人,这一问题的解决,使我们不用再承受外语学习带来的巨大压力,只培养优秀的外语人才就可以了,不需要全民学外语了。”李宇明司长告诉《中国经济周刊》,筹划设立中国语言奖的初衷,是希望大家每年关注一次语言文字学的国家使命和对国家的贡献,鼓励语言学家从书斋里走出来,鼓励科学家能够创造性地解决语言问题。
信息化时代,作为中华文明重要载体和组成部分的语言资源,应该如何进行传承、保护?我国的语言文字信息化处于何种发展阶段?应该如何对语言资源进行开发、利用?就此相关问题,《中国经济周刊》对国家语委副主任、教育部语言文字信息管理司司长李宇明进行了专访。以下为记者整理的采访实录。
语言资源也是生产力
人类信息大约80%是以语言文字为载体的。信息化时代,人类的语言文字传播进入了前所未有的新时代,利用现代信息技术进行信息的收集、加工和交换,成为人类生活的必需。国家信息化的主战场应当在语言文字的信息化。
目前,我国的语言文字信息化还处于起步阶段——文字信息化阶段。计算机可以没有智力,只要把每个字和相对应的符号进行比对就可以了。但人类希望计算机有智能,能够理解语言,能进行真正的语言处理。这就涉及到计算机对词汇、语法、语义、篇章的掌握。计算机能够处理一种语言还不够,还需要能够处理多种语言,实现语言的自动翻译。我们目前还远没有达到这种水平。自动翻译是未来人工智能的一个很重要的发展方向,它将是人类克服语言障碍的一个极具魅力的领域。比如在工业领域,有大量的技术参数需要翻译,而这些工业数据在语言上一般都较为规则,人工翻译耗时耗力,也容易出错。如果有机器做自动翻译,或者再加上人工校助,会非常有成效。语言文字信息化工作,当前要推进的就是从文字信息化阶段进入语言信息化阶段。
信息化时代,我们应该有新的理念——语言资源理念。过去,人们一直把语言当问题当麻烦来看待,方言不通,就推广普通话;中外交流不通,就搞外语教育。百多年来,我们为了解决语言问题做了大量的工作,取得了巨大成就。但是仅有语言问题理念是不够的。和语言问题理念不同,语言资源理念把语言看做造福于社会和国家的一种资源,像水资源、森林资源、土地资源、矿产资源一样,去保护、开发、利用,去获取“语言红利”。
过去,我们基本上是把语言文字看做一种文化现象。信息化时代,语言及其知识开始成为工业标准,成为信息化高新技术的基础,进入了生产力的范畴。它和国家安全、经济发展、信息化发展和高新科技发展息息相关,成为我们在国际竞争中非常重要的一种竞争力。利用得好,就会成为国家的“硬实力”。正因为我们有独特的语言资源,才使得我们民族的高新技术产业发展起来,才有了联想、方正、汉王、四通等高新企业,才能和其他发达的信息化国家有一争,有一比。
语言经济红利巨大
信息化的发展和中国改革开放的时代结合在一起,形成了新的语言产业、语言职业和语言经济。比如联想、方正、汉王等,都可以看做是语言产业,它们处理的都是语言文字问题,它们的加工对象是语言文字和语言文字所负载的信息。语言产业需要专门的人才,于是社会上就出现了很多新兴的职业,叫语言职业。比如速录师,是2003年我国新承认的一个语言职业,这看似很小,其实是一场伟大的变革。速录师可以让你的讲话迅速在网上传播,可以让重要会议的发言迅速汇总,进行分析研究,变成纪要、简报,并有条理地、漂亮地传播出去;它对司法进程的推进也非常巨大,法院的书记员采用速录后,庭审记录的速度、完整性和真实性都有了极大的改善,增加了司法的公正和透明。当然,现在还有好多新兴的语言职业,比如语言工程师、语言广告师、语言治疗师等,还没有被当做一个正式职业来培育。
语言文字的信息传递所带来的经济效益非常巨大。如果有经济学家进行研究,说不准就可以建立语言经济学。我相信,语言给国家带来的红利,应该在前十名之内。
在计算机键盘方面,汉字当年遇到的困难极大。因为计算机的通用键盘是为字母文字设计的,我们的汉字成千上万,如何解决中文输入、字库开发和屏幕显示等问题,我们付出了极大的努力,取得了巨大的进步,看到了中国气势。
当然,整个语言文字作为信息化的资源向前发展,道路更崎岖,竞争更激烈。如果我们不能采取有效措施,仍然会输给别人。
比如手机数字化键盘输入。手机在中国这么普及,除了科技进步、经济发展之外,汉语在手机屏幕显示和数字化键盘输入方面的优势非常明显。第一,汉语语音结构有优势,声韵母结构在数字键盘上的输入效率非常高。比如输入“S”,计算机马上知道“S”是声母,因为它的前面不会出现别的音素,而它的后面只能出现开口呼和合口呼两类韵母;但“S”在英语中,其前后都可能出现许多音素,计算机处理起来远没有汉语快捷。当然汉字除音码外,还有许多高效的形码输入法和形音码输入法。第二,同样的手机屏幕,汉字的信息量远比英文信息量要大。汉字之间不需要空格,还有大量的单音节词可以节省字数。但遗憾的是,数字键盘汉字输入法的知识产权,多数都在外国厂商手里。这对我们的信息安全和整个国家的发展是很不利的,也是不公平的。这些输入法多数应该是中国人设计的,但被外国厂商买走了。据说我们每买一部手机,仅输入法就要付给外国厂商好几块钱。中国约有6亿部手机,而且两三年就要更换一次。我们不能失去数字键盘为中华民族提供的天然良机。
语言文字信息化的困局
首先,从学术上看,我们的教育制度不适合语言信息产业和信息科学的发展,文理分家太严重。信息技术需要文理工结合。谁在做信息技术?学计算机的,学数学的,学物理的,他们从高中就开始把兴趣放在了理科。解决语言文字问题,语言文字学家多数不懂信息化,计算机专家很难把握语言文字的微妙。为什么我们迟迟停留在文字信息化阶段,进入不了语言信息化阶段,原因之一是我们的人才结构不合理,人才的知识结构不合理。
其次,从科研管理来看,我们仍然是文理分家的管理体制。经费投入也是人文科研管理部门管文科,科学技术管理部门管理科,中间缺少沟通,重复建设时有发生。这种文管文、理管理的科研管理体制,也不适应语言信息化的发展。
第三,在行政管理上,语言文字的事情有好多部门都有职责。教育部、国家语委、国家民委、工信部、国家标准委、外交部等都在管。我们缺乏一个能够把语言文字工作(包括语言文字信息化工作)沟通起来的总的机制,政出多门,人人都须管,人人都在管,人人管不了。
清朝的洋务运动提出“以夷制夷”的口号。现在外国公司特别是一些信息产业的公司,也在“以华制华”,利用中国人的发明创造来赚中国人的钱,来与中国企业竞争。当然,一方面应当感谢这些公司,它们创造了大量的中国语言文字信息化成果,促进了中国信息化的水平。但是核心技术永远掌握在外国公司手里,必然不是好事情。中国的语言信息化问题,最终要靠中国人自己解决。
第四,在法律层面,我们缺乏对高新技术,特别是信息化产业的有效的知识产权保护,知识产权方面的法律滞后。出版法也好,其他法也好,基本上是对以纸媒出版物和传统工业为基础的保护。计算机字库的知识产权问题,语料库的知识产权问题,输入法的知识产权问题,怎么保护?这一领域的法律,不是想制定就能制定出来的,必须专门研究,知识结构要能够适应,国际上的情况要熟悉,还要了解中国,还要知道信息科学进步需要怎么做。这种法律的制定对全世界都是新事物。
方正这次打官司,其实是在讲一个故事,这个故事不只是讲给老百姓,也在讲给我们政府,讲给执权柄者。故事的中心思想是我国信息产业的发展问题。
举报成功