“小爱同学”是如何成长的
北京晚报
“小爱同学”“我在”……每一天,这样看似简单的对话会在全球重复1亿次以上。“小爱同学”如今已成为许多人智能生活中不可或缺的一部分。
在这套强大的智能语音交互系统背后,有一支约90人的队伍,他们就是小米集团人工智能实验室语音组。今年“五一”前夕,他们荣获了“全国工人先锋号”荣誉称号。
2017年1月,小米人工智能实验室语音组成立,当时整个团队只有4个人。4个月后,语音组就开发出了小米第一个语音识别系统。团队带头人、小米集团声学语音技术总监王育军把这段经历戏称为“444岁月”,“4个人,经过40多次试验,历时4个月,不但上线了语音识别系统,还发表了相关论文。”在王育军看来,接下来的小米音箱语音唤醒功能开发,才是第一块“硬骨头”。“我们要进行语音交互,先得成功叫醒它,这是第一道环节,所以唤醒的成功率和误唤醒率都非常重要。”王育军解释,所谓成功唤醒,就是当用户呼叫“小爱同学”时,系统能准确地识别出来是在进行唤醒;而误唤醒,就是毫不相关的声音或是发音近似的声音,也会唤醒音箱。
半年后,误唤醒率依然无法达到预期目标。于是,一个45天计划诞生了,团队成员兵分三路,采取3种不同的方法,共同向着一个目的地前进,最终,把误唤醒率控制在了一天一次,进而一周4次,且仍在不断降低。语音识别,为“小爱同学”装上了“耳朵”,但要能听会说,还要有“嘴巴”。于是,语音组研发推出了语音生成技术,可以将文本转化成语音。
到去年年底,小米人工智能实验室声学语音组已将自研声学语音技术全面应用于小米手机、音箱、电视、耳机、手表、机器人等79个品类,共计5312款智能产品中。“小爱同学”月活跃用户数量为1.15亿,已成为世界上最忙的语音助手之一。本报记者 王天淇