1月17日,百度输入法在北京举办了主题为“AI输入,开启全感官输入时代”的发布会。大会上,百度输入法宣布,截至目前百度输入法月活用户已达4亿,语音输入日流量超过2.5亿,接下来百度输入法作为百度AI技术的桥头堡,将不断落地全新的AI功能,开启全感官输入时代。
百度副总裁、AI技术平台体系(AIG)总负责人王海峰,百度语音技术部总监高亮,百度输入法负责人蔡玉婷,桃花坞年画传承人房志达等合作伙伴及行业媒体、用户等百余名嘉宾共同出席参加大会。此次发布会还请到著名主持人华少主持,作为“中国好舌头”的他在发布会现场与百度语音技术进行了一场夺人眼球的“人机大战”。
王海峰在致辞中表示“8年前百度就开始布局人工智能,如今我们不仅把*进的AI技术应用到输入法等产品中,更把技术开放出来给合作伙伴和开发者,一起共享这个AI时代。”他说,“输入法是百度AI技术的桥头堡,未来我们将用更多人工智能技术打造AI输入,让输入法更懂你的表达,让AI真正改变人们的生活。”
百度副总裁、AI技术平台体系(AIG)总负责人王海峰为发布会致辞
此外,作为此次发布会的亮点之一,百度语音技术部总监高亮,在大会上发布了百度语音技术的最新突破——Deep Peak 2模型。该技术全称为“基于LSTM 和CTC 的上下文无关音素组合建模”,该模型突破了沿用十几年的传统模型,能够更充分地发挥神经网络模型的参数优势,大幅提升中英文、多种口音、多种风格(如朗读、聊天、轻声)混合输入的识别准确率,聊天场景下的相对正确率较行业*水平提升20%,让机器更轻松适应用户的自然对话。
此前,百度“实时语音识别上屏技术”就曾在2017年百度世界大会上收获诸多关注,而此次应用了最新Deep Peak 2模型的“实时语音识别上屏技术”在识别准确率上更上了一层楼。华少在现场也即兴挑战了一下百度语音识别技术,最终百度AI在58秒内实时正确识别了华少426字的“脱口秀”,令全场嘉宾赞叹不已。
华少现场挑战百度语音识别技术
随后,百度输入法负责人蔡玉婷宣布了百度输入法v8.0版本的正式上线,该版本在此前已有的AI功能上增加了“语音速记”和“AR表情”两大全新AI功能。
其中,“语音速记”在输入法领域*首发了“声纹识别”技术,该技术针对2-3人小型会议场景,可根据声纹自动区别发言人,实现智能化的语音识别。而“AR表情”功能基于百度*的人脸识别技术和AR 技术,用户不仅可根据相机或相册进行人脸识别、制作表情包,还支持用户通过自己的表情控制虚拟人物形象。制作出来的AR表情,可以直接通过输入法搜索、语音输入和键盘输入时展示出来。同时,百度输入法还与桃花坞等中国非物质文化遗产达成合作,将中国民间传统艺术如年画等引入到表情中,让众多古典人物形象冲破次元壁垒“活”了起来,成为对中国历史文化*的传承。
百度输入法v8.0版本AR表情功能
蔡玉婷现场表示,“百度输入法v8.0版本不仅在功能上落地,更拥抱年轻文化,贴近用户的个性化需求。语音识别、图像识别等AI技术在输入法中的应用,让输入法跳脱出语言的局限,懂得用户多种不同的表达形态。”百度输入法除了完成用文字输入形式的人机交互外,还能从声音、图片,甚至有望从动作、眼神中捕捉信息,让用户拥有更自然、更个性化的体验。
AI技术的发展带来开启了AI输入的全感官输入时代,正如王海峰在发布时提到的那样,“我们期待AI时代的输入法,成为真正‘懂我们’的输入法!”