王永民:中国文化都在汉字结构里
王永民 受访者供图
当前汉字输入法呈现出多元化的趋势,除了五笔输入法,还有拼音输入法。随着人工智能的发展,语音输入也渐渐被人使用。
作为“王码五笔字型”的发明者,王永民如何看待拼音输入法和语音输入法带来的挑战?
在接受中新社国是直通车记者专访时,王永民表示,汉语拼音原本是为汉字注音的,如果推行“用拼音代替汉字”,汉字必然会“安乐死”,实际上拼音输入是汉字文化的掘墓机。而语音输入法同样避开了汉字的字形,必然使人提笔忘字,给人们带来某些方便的同时也让人们越来越不知道汉字的内涵,离开了汉字的字形,实际上是给汉字文化挖坑。
以下为部分访谈实录:
中新社国是直通车:计算机刚进入中国的时候,汉字输入成为一个“卡脖子”的事情。你当时如何看待这个问题?为什么选择研究形码?
王永民:计算机来的时候,有人说汉字要废除了,要拼音化了,这实在不能容忍,打心底是抵触的。1978年有人研究音码(按照拼音编码),也有人研究形码(按照字形编码),这是两大流派,并行不悖。但是最终能够从根本上解决汉字输入问题的,必然是形码。
因为拼音只有400多种,汉字国家标准里面有27533个字。 每个读音平均对应几十个字。读Li音的字有407个,如何用拼音代替?实际上,拼音输入是汉字文化的掘墓机。从1978年到现在,整整41年时间,我一直在研究形码输入法,包括高效的五笔字型和简单易学的数字王码,还有引发汉字查字法革命的《王码查字法》。
中新社国是直通车:你刚开始研究形码的时候,心里有把握会成功吗?有没有想过最终要做成什么样子?
王永民:一开始普遍认为,将汉字输入电脑就要给汉字做专用键盘,因为汉字成千上万,西文一个字母一个键就能解决问题,如果我们一个汉字一个键,不仅键盘大,汉字输入永远也快不了,而且,谁能记住每个字都在哪里?
所以,我们必须甩掉大键盘,专门为汉字做一个小键盘。当时我经过研究,用了两年时间,对汉字作理论分析和统计,找到了汉字的基本规律,还是《说文解字》里面的话:“独体为文,合体为字。”汉字虽有几万个,但是组成汉字的基本单元即“字根”却可以很少。经过优化综合,我找出了125种字根,并且自己做了一个62键的键盘,重码非常少。
1982年,62键是全国最好的四个方案之一,但是后来发现这个设计毕竟需要专门做键盘,体积还是很大,所以就进一步压缩。一直到1982年6月2日,我研究出36键方案,这时就不需要再做键盘了,因为标准键盘本身有26个字母键和10个数字键,刚好36个键,汉字已经能很好地用标准键盘输入计算机了。
中新社国是直通车:1982年冬天,你带着优化了的36键方案,来到河北保定华北终端厂上机试验。36键方案在当时已经很好了,你为什么还是不满意?
王永民:我们在河北保定进行36键上机试验的时候,有消息说台湾一个叫朱邦复的人发明了“仓颉码”,用的是标准键盘,26个键,当时是世界上最好的。我们研究了几年弄了个36键,人家台湾已经26键了,36键打汉字,要打数字还得换挡,所以,在保定我毅然决定扔掉36键,大胆创新,用十天时间成功试验了26键的新设计,但是真正完全定型,还需要几个月的努力。
1983年元旦,我们在保定已经能用26个键打出7000个汉字,这是一个主要指标超过了台湾仓颉输入法的方案。每个字最多打四下,不但打字,还可打词汇。当初36键方案本来就可以向河南省科委交卷了,但是我们不满足于36键,必须更进一步,发明了“末笔字型识别码”,实现了理论的重大突破,实现了汉字输入技术的登顶一跳。
整整五年,1800个日夜发明了五笔字型,那是一个日日夜夜工作,编写了12万张卡片,不知疲劳不知辛苦,蓬头垢面像疯子一样的年代。
中新社国是直通车:汉字输入,是一个涉及文字学、计算机科学、人机工程学、概率论等多种学科的交叉学科。你是无线电专业出身,你怎么应对这种交叉?
王永民:汉字输入本身是个非常复杂的交叉学科,字根在键盘上怎么摆,这里有很大的学问,并不是像鸡蛋一样可以摆来摆去,哪些字根与哪些字根可以摆在一起让重码最少,这是一个信息爆炸的数学问题,要建一个数学模型才能完成。另外,打键的时候要保证手指的功能协调均衡,打得快,手指不紧,重码尽量少,这又是一个数学问题。
我是边研究边学习,中国科技大学并不是什么都学习了,在学校里主要是学会了科研的方法。
中新社国是直通车:由于五笔字型需要一定时间的培训才能够熟练使用,你是如何将它推广的?推广的过程中遇到了哪些障碍?
下一篇:林毅夫:我对中美贸易战的三个观点
中国观察