当前位置:

OFweek电子工程网

数字信号处理

正文

Nikko Strom揭秘语音识别技术:Alexa是怎样炼成的?

导读: 本月18日,由美中技术与创新协会主办的第一届“AI NEXT”大会在西雅图召开,亚马逊首席科学家 Nikko Strom 再次以“Alexa是怎样炼成的”为主题讲述了 Alexa 的深度学习基本架构、声学模型、语音合成等内容。

1490690311425006404.png

OFweek电子工程网讯 Nikko Strom,现任亚马逊首席科学家,是 Echo 和 Alexa 项目的创始成员,在语音识别技术相关领域有着资深的研究及从业经验:

 1997 年于瑞典皇家理工学院语音通信实验室获得博士学位,后担任MIT计算机科学实验室研究员;

 2000 年加入语音技术初创公司 Tellme Networks;

 2007 年随着 Tellme Networks 被微软收购,加入微软,推进商业语音识别技术的前沿研究;

 2011 年加入亚马逊,担任首席科学家,领导语音识别及相关领域的深度学习项目。

以下是 Nikko Strom 在本次大会上的演讲。

先简单介绍下我们的产品。如果你买了 Amazon Echo,意味着你可以通过 Alexa 语音识别系统控制它,并与它对话,而且不需要拿遥控器。左边(下图)是 Holiday Season,是我们新加入的白色Echo和Dot,相信在座应该有很多人比较偏爱白色的电子产品。

Echo 还可以与没有内置 Alexa 系统的家电进行连接,如灯具、咖啡机、恒温器等,只需要唤醒Alexa,就可以让这些家电设备执行一些命令。此外,开发者还可以通过工具包 Alexa Skills Kit,打造个性化的功能。

Nikko Strom揭秘语音识别技术:Alexa是怎样炼成的?

现如今,Echo已经进入了数百万用户的家中,每天它都在被大量地使用着,也让我们得到了无法想象的数据量。

深度学习基础框架

事实上,人耳并非每时每刻都在搜集语音信息,真正在“听”的时间大约只占 10%,所以一个人成长到 16岁时,他/她所听到的语音训练时间大概有 14016 个小时。

Nikko Strom揭秘语音识别技术:Alexa是怎样炼成的?

回到 Alexa,我们把数千个小时的真实语音训练数据存储到 S3 中,使用 EC2 云上的分布式 GPU 集群来训练深度学习模型。

Nikko Strom揭秘语音识别技术:Alexa是怎样炼成的?

1  2  3  下一页>  
责任编辑:Moon
免责声明: 本文仅代表作者个人观点,与 OFweek电子工程网 无关。其原创性以及文中陈述文字和内容未经本站证实, 对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅 作参考,并请自行核实相关内容。

我来说两句

(共0条评论,0人参与)

请输入评论

请输入评论/评论长度6~500个字

您提交的评论过于频繁,请输入验证码继续

暂无评论

暂无评论

文章纠错
x
*文字标题:
*纠错内容:
联系邮箱:
*验 证 码: