讯飞输入法10周年A.I.输入沙龙 引领手机输入效率飙升
作为移动互联网时代的史诗级产品,输入法见证了商业更迭的市场规律,承载了用户行为的变迁轨迹,自身也在技术浪潮的推动下完成了一次次的跃迁:搜狗将输入法从单机时代带进了互联网时代,讯飞又为输入法打开了人工智能的大门。
借着讯飞输入法上线10周年的契机,似乎有必要盘点下输入法在上一个10年的历程:站在人工智能时代的起点上,曾经革新了移动互联网交互方式的输入法,还将对世界产生什么样的影响?
随着智能手机的出现,改变了原有的产品形态,传统的物理键盘彻底消失,虚拟输入法逐渐成为一种刚需,如何提升用户的输入效率,成了多方力量角逐的赛点。在PC时代杀出一条血路的搜狗输入法,随即开始向手机市场倾斜,原本适用于PC的产品逻辑被复制到手机上;汲取了PC市场经验的手机厂商也开始行动,谷歌将自家的输入法作为系统的默认选项,主张封闭生态的苹果牢牢掌控着输入法的控制权,直到2014年才开放了第三方输入法的 API。
同样是2010年,科大讯飞的一群工程师们也加入了手机输入法的角逐赛,不过他们并没有沿袭功能机时代的输入理念,而是主打语音技术,在既有输入键盘上增加一个麦克风图标,用户点击后就能语音输入。时间同样验证了讯飞输入法的前瞻性,到了2012年的时候,搜狗输入法和百度输入法先后推出了语音输入,2013年讯飞输入法的激活用户量正式破亿……语音输入逐渐衍生成为新的流派。
智能手机时代的降临,催生的不只有造机潮,还有工具产品的爆发:早期的原生操作系统体验并不完善,桌面类、美颜类等工具类产品悄然崛起,第三方输入法或多或少享受了特殊的红利周期。作为工具属性的产品,是不是都只是用过就“丢”一边的产品呢?随着技术革新,让工具类产品有了新答案。老罗在2016年锤子手机M1的发布会上用很快的语速说了相当长的一段话,讯飞输入法无时差同步输出了文字版本,结果几乎没有任何偏差,发布会现场随即一片欢呼。发布会结束的第二天,讯飞输入法霸占了多家应用商店的下载榜单。
讯飞输入法的高光时刻至今仍时常被提及,外界忽略的是背后的技术深耕。讯飞输入法刚刚上线的2010年,行业内还没有中文语音识别的概念。讯飞输入法团队首创了语音输入的功能,一开始的识别准确率还只有70%作用,团队使用大数据训练和深度学习技术后,语音识别的准确率在2013年达到了92%,然后在2014年快速跨越到业内领先的95%,在一定程度上超出了人耳。
其实当讯飞输入法的语音识别准确率达到97%后,用户规模已经在不到两年时间内已经翻了一番,罗永浩的示范不过是点燃引线的小火星。相比于那些与用户需求和行业生态脱节的工具类产品,讯飞输入法为工具类产品正名的策略并不复杂,即通过技术的持续创新将工具类产品服务化,向用户提供的不是工具,而是一种服务。工具的弱点是用户粘性低、可替代性强,但讯飞输入法用技术创新和产品服务巧妙地让短板变成了长板。
“直面用户需求就能得到用户的欢心。”讯飞输入法选择需求排名最高的粤语、四川话和河南话入手,2012年的一次版本更新后上线了粤语语音输入,成为首款支持粤语语音输入的输入法,紧接着上线了四川话和河南话的语音输入。截止到目前,讯飞输入法的粤语语音识别准确率已经超过95%,陆续上线了23种方言的语音识别。
因对用户输入习惯的洞察,讯飞输入法在2013年上线了英文语音输入;2015年讯飞输入法在语音输入的基础上首创了语音翻译功能 “随声译”,目前已经支持英日韩俄等多种外语的面对面翻译,输入法开始进化成为一种人际沟通工具。
除了语音识别技术上的纵向深挖,讯飞输入法还积极在输入场景上进行横向延伸,比如在传统的手写、键盘输入外,加入了OCR扫描、智能预测等功能。
“输入法的产品生命周期,其实才刚刚开始。”讯飞输入法上线的2010年,深度学习技术还方兴未艾,人工智能还处于第二次浪潮后的静默期。然而过了十个年头后,等待语音技术的却是全新的局面:阿尔法狗燃起了人工智能的第三波浪潮,深度学习等前沿技术加速了落地应用的进程,语音也从小众一跃成为主流的人机交互方式之一。
至少透过讯飞输入法等行业领跑者的动作,外界看到的并非是时间赋予的老迈,而是一无既往的探索和创新精神。
就在讯飞输入法10周年发布会上,知名相声演员方清平上演了一场极限语速挑战赛,用远超罗永浩当年的语速读了一段《木兰辞》,以测试讯飞输入法在极限快语速下的识别效果。结果让人惊喜,方清平的语速快过了吉尼斯世界纪录,讯飞输入法照旧给出了100%的识别准确率。
与四年前的有所不同的是,同样是技术上的秀肌肉,对于“快”的诠释有了新的注解。如果说讯飞输入法当年的一夜爆红,某种程度上与大众对语音输入带来的新鲜感有关,这一次除了速度,还有温度。
比如讯飞输入法新近推出的10.0版本,通过唇形辅助输入,进一步优化输入效率,在近距离多人说话的复杂场景中,其他人的声音不会干扰语音识别结果;再比如针对盲人群体输入不便的情况,不断无障碍模式,实现了输入面板、菜单面板以及表情面板的屏幕随选朗读,用户在视力不便的情况下也能无障碍输入文字和表情。
这些年人工智能(A.I.)技术发展非常快,将人们对于智能生活的想象呈现在眼前。我们常用的讯飞输入法,通过A.I.赋能将语音输入效率一次又一次提升,甚至突破想象。
相关阅读
- 上海“双千兆”释放产业强大潜能2020-10-26
- 智能时代,老年人不该被忽视2020-10-26
- 二手手机交易市场待规范2020-10-26
- 5G,敢问路在何方——计算机领域专家前瞻5G时代2020-10-26
- 重庆丰都:鼓励直播带货推动电商扶贫2020-10-26
- 谷歌涉嫌垄断遭美司法部起诉2020-10-26
- 埃及电子支付加速发展2020-10-26
- 超高清视频产业发展大会将在穗举行2020-10-26
- 智能制造能力成熟度国家标准推进工作会在北京召开2020-10-26
- 5G赋能 共享共赢 2020世界5G大会将在广州举行2020-10-26