从机械键盘被发明开始,人们对于输入法就有着特殊的感情,一面对“键盘”有太多的不舍,即便全触屏的智能手机早已普及,输入时依旧要依赖于“虚拟键盘”;一面又急于寻找更为高效的输入方案,比如笃定语音交互将成为主流的人机交互方式。
1月16日的百度输入法发布会上,百度输入法AI探索版正式亮相,不仅将全语音输入作为默认输入方式,并开启了调动表情、肢体的全感官输入2.0时代。曾经困扰人们多年的键盘输入纠结症,终于有了新答案。
输入法AI化,先来解决三个痛点
智能手机的诞生已经有了十多个年头,可为何语音输入取代键盘的一幕直到2019年才开始出现?要回答这个问题,先要看语音输入面临的三个痛点:
1、准确率能否再高一点?
早在几年前,百度、科大讯飞等相继宣布语音识别准确率高达97%,并不怀疑数字的真实性,Attention模型已经较为成熟,各家也在实验室里进行了大量的机器学习,但在实际应用中却存在两个用户体验上的“盲点”。
一个是流式解码的问题。诸如谷歌LAS等传统Attention模型,大多是基于整句的建模,客观上需要整句语音上传到服务器后,才开始声学打分计算和解码,势必会产生较长的用户等待时间。










