新浪博客

刘兴亮|中文输入法的三个里程碑

2021-10-19 10:10阅读:

刘兴亮

DCCI互联网研究院院长、互联网专家 微博原创视频博主

关注
近日,搜狗发布公告,称其与腾讯已完成合并,将成为腾讯的间接全资子公司,并从纽交所退市,搜索和输入法等业务将保持搜狗品牌运营。
从诞生后,一路坎坷走来的搜狗,最终还是嫁人了,这次相当于领了证。
 图片来源于网络 图片来源于网络
也许大多数人在搜索行为中不会频繁使用搜狗,但是在电脑上敲字,用搜狗输入法的人数应该很多。尤其我们这些写字多的人,对输入法的性能、智能化的推荐和记忆方法,都有着非常细腻的感受。不可否认,搜狗输入法,是非常出色的一款。
两家变成一家人,未来,搜狗输入法的名字还能不能保住,要打个问号。借此机会,我们来盘点一下中文输入法的历史。我应该是全程见证了中文输入法的发展历史,二十多年来用过的输入法至少有十几种。
要知道,在互联网刚刚兴起的时候,适逢我们进入大学的时期,使用电脑成了必备技能,第一件有成就的学习项目,就是学会打字,看着屏幕上一个一个蹦出来的汉字或字母,感觉自己的手很有科技感。从此后,输入法就成为人生路上长相思守的伴侣。我们这就说说中国输入法的历史和趣闻。由于输入法太多,我挑主要的、具有里程碑意义的代表讲讲。
老规矩,亮三点:

  • 左一点:五笔输入法。

计算机是美国人发明的,虽然,有人声称计算机处理器的二进制来源于中国的周易八卦图,但是只要低头瞅一瞅键盘,我们就会发现,那东西由字母组成,虽然也有阿拉伯数字,但每个按键上边的符号基本上围绕英文字母进行。
这就带来一个问题。在计算机刚刚引进中国的时候,如何打字成了一个难题,由于想不到好办法,有人甚至建议用拼音代替汉字。
就像很多乡镇饭店那样,把拼音写在汉字底下,显得洋气。这毕竟不是个办法,几乎每个汉字都有同音字,何况还有一二三四,四个声调,如果用拼音表达,还得绞尽脑汁琢磨,通过上下文的逻辑链条推测其意思,非常麻烦。
一直到了1983年,一个名叫王永民的人出现,才打破了这种尴尬的局
面,他开发出了一种汉字输入法——五笔。如今的年轻人是否知道,是否使用五笔输入法,很难说了。不过当时,这一技术的出现意义是非常重大,新华社评价「五笔的重要性不亚于活字印刷」。也是我们读书时的必学项目。

五笔这么牛,后来怎么会衰落了呢?原因就是它太难学了。键盘上的字母还得再画上笔画,这样才能一一对应起来,并且对于打字的人来说,五笔输入法多了一层大脑内的转换工作,从字母转为五笔,再从五笔构成汉字,从学习到使用,都有一定的挑战意味。
说白了,学的时候有门槛,不能上手就用,用的过程需巩固,不坚持就会忘。与此同时,后来的拼音输入法却越来越智能,打字速度也能够越来越快。
于是,像我这样当年用五笔打字能达到每分钟100字的人,现在的口诀也就只能记住一句「王旁青头兼五一,土士二干十寸雨」了。

 图片来源于网络 图片来源于网络
  • 右一点:智能ABC。

五笔输入法发明10年后,输入法历史上的另一位里程碑式的人物出现了,北京大学的朱守涛先生。他发明了智能ABC输入法,简单易学、快速灵活,一出现就受到广大用户的青睐。于是后来被微软内置到Windows系统中,很快成为了中国大陆使用人数最多的输入法软件。
这款输入法的优势在于它不是一种纯粹的拼音输入法,而是一种音形结合输入法。
因此在输入拼音的基础上如果再加上该字第一笔形状编码的笔形码,就可以快速检索到这个字。因为同样的发音,汉字很多,有时候要找到生僻的字,需要翻好几页。智能ABC就是智能,仅仅用了一小招,看似没什么,却解决了大问题。
但是,正因为它创新的这个举措,也带来了与五笔输入法相似的一个问题,那就是用户需要记住横竖撇捺等偏旁的相应按键,增加了一个逻辑链条,想要得心应手的用起来,也需要一个过程。
这就导致许多用户在使用过程中并没有真正掌握这种输入法,而仅仅是将其作为拼音输入法的翻版来使用,使其强大的功能与便利远未能得到充分的发挥。
对于大多数人而言,当然是越懒惰的方法越受欢迎。

  • 下一点:搜狗输入法。

搜狗之前,拼音输入法已经有很多了,除了智能ABC,知名的还有很多,比如拼音加加、微软拼音、紫光拼音、智能狂拼等, 那搜狗是怎么脱颖而出的呢?
当然还在创新。用搜狗创始人王小川的话说,是采用了跨代的技术,利用搜索技术解决了词库问题。
 图片来源于网络 图片来源于网络
这句话是什么意思呢?早期的拼音输入法,被大家亲切的称呼为是鼻涕输入法,有了一点鼻涕,就要赶紧擦掉,不要等它老长了掉到嘴上了再去擦。
这个比喻讽刺的就是那些输入法由于受词库所限,不能输入长句,每个词都得修正。否则你不管不顾地飞速打字,屏幕上就会出现一堆前言不搭后语的汉字组合。
如果写个长文章的话,思路要被不停打断、打断、打断。写诗还好,写长篇小说就很费劲,有时拧住了,还不如用笔手写快呢。万没有一气呵成功成名就的感受和可能,令人沮丧而落魄。
输入法中每个拼音背后的汉字都被排了名次,排前边的就会自动地优先出现,那么很多字组合起来构成的拼音,需要很大的库存来指导它们之间结合起来最可能的那个汉字集。
由于搜狗革命性的采用了互联网词库,利用搜索技术,使得输入长句的正确率越来越高。于是像我这样的五笔高手也放弃了,用起了当年被自己鄙视过的拼音输入法,变成了自己曾经讨厌的那个样子……

我的更多文章

下载客户端阅读体验更佳

APP专享