当前位置:

OFweek电子工程网

开发工具/算法

正文

回溯深度学习革命 盘点16大历史时刻

导读: 过去四年来许多领域的技术都取得了跨越性的发展。其中,最引人瞩目的是智能手机的语音识别功能比以往有了显著提升。当我们用声音命令手机给另一半打电话时,我们能够与他们取得联系,手机没有再将电话错拨给陌生人或已经不在一起的那个人。

  OFweek电子工程网讯 过去四年来许多领域的技术都取得了跨越性的发展。其中,最引人瞩目的是智能手机的语音识别功能比以往有了显著提升。当我们用声音命令手机给另一半打电话时,我们能够与他们取得联系,手机没有再将电话错拨给陌生人或已经不在一起的那个人。

  实际上,我们现在越来越多地通过对话与计算机互动,无论是亚马逊的 Alexa、苹果的 Siri、微软的 Cortana,还是谷歌许多产品中的语音反馈功能。中国搜索巨头百度表示,使用语音界面的用户在过去 18 个月翻了三倍。

  机器翻译和其他语言处理也有了长足的发展,谷歌、Facebook、微软和百度每个月都有新功能发布。谷歌翻译现在能提供 32 种语言对的语音翻译(输入是语音输出的也是语音),提供包括宿务语、伊博语、祖鲁语在内的共 103 种语言的文字翻译。谷歌邮箱应用有 3 种现成的自动回复。

  接着要说的当时图像识别方面的进展。还是上面那 4 家公司,都有产品供你搜索或自动组织没有明确标签的照片。你可以要求系统显示所有带有狗的照片,或者有雪的,甚至抽象些比如含有拥抱场景的。这些公司都有研发中的产品,可以自动生成一句话那么长的图说。

  深度学习推动计算产业逼近新的拐点

  试想,要搜集含有狗的照片,应用程序必须识别出从吉娃娃到德国牧羊犬这么多种类的狗,还不能因为小狗上下颠倒或左边右边被雪被雾遮住了一块就被骗过。同时还要排除狼和猫。只靠像素。这究竟是怎么做到的?

  回溯深度学习革命 盘点16大历史时刻

  图像识别技术的发展影响之深,已经远不止在你手机上很炫酷的社交应用。医疗初创公司声称,他们马上就能用计算机分辨 X 光片、MRI 和 CT 扫描图片,而且比放射学家读得更准更快,上至诊断预防癌症,下至加速发现治病救命的新药。更好的图像识别技术对于机器人、无人机以及自动驾驶汽车而言也是至关重要的。自动驾驶汽车在今年 6 月登上了本刊的封面报道。福特、特斯拉、Uber、百度和谷歌的母公司 Alphabet,都在公路上测试自动驾驶的原型样车。

  但大多人没有意识到的是,所有这些突破实际上都是一样的。它们都受益于人工智能技术当中的深度学习,或者用大部分研究人员爱用的词形容——深度神经网络。

  关于神经网络最不可思议的事情是,没有人曾经编程让计算机去执行这些任务。实际上,没有人能够做到这一点。程序员不再编程,而是提供给计算机一个学习算法,然后用海量的数据去训练它,这一过程会使计算机自己学会如何分辨需要分辨的物体、单词或句子。

  一句话,这样的计算机可以自己教自己。用图像处理器巨头英伟达 CEO 黄仁勋的话说,“本质上说就是让软件写软件”。英伟达在大约 5 年前便看准深度学习,对这项技术做了大力投资。

  神经网络也并非新兴技术。其概念可以回溯到上世纪 50 年代,而神经网络很多重要的算法突破都发生在 20 世纪 80 到 90 年代。让情况有所不同的是,如今的科学家终于将强大的计算力和海量的数据握在手中——从图像、视频、音频到文本,互联网上到处都是数据——而且人们发现,数据是让神经网络运行良好的关键。“这是深度学习的寒武纪大爆发,”投资公司 Andereesen Horowitz 的合伙人 Frank Chen 说。

  这一剧变引发之下,AI 创业公司数量暴涨,根据调研公司 CB Insights,AI 投资额在过去一季度超过了 10 亿美元。2016 年第二季度有 121 轮融资,而 2011 年同期只发生了 21 笔。投资额从 2011 年第二季度到 2016 年第二季度超过 75 亿美元,其中有 60 多亿美元都是在 2014 年后产生的。(今年 9 月,5 家 AI 巨头——亚马逊、Facebook、谷歌、IBM 和微软——成立了一个非盈利组织,旨在促进公众理解 AI 技术并就伦理、操作规范展开调查。)

  2012 年时,谷歌有两个深度学习项目。现在这个数字超过了 1000。根据一位谷歌发言人,现在谷歌所有主要产品分区中,从搜索、安卓、Gmail、翻译、地图、YouTube 到无人车,都有深度学习的影子。IBM 旗下的 Watson 赢得 Jeopardy 时虽用了人工智能,但没用到深度学习。但现如今,Watson CTO Rob High 表示,Watson 提供的 30 多种服务都因为深度学习而得到增强。

  5 年前根本没有听说过深度学习的投资人,如今对于初创公司没有深度学习技术感到无比焦虑。“我们身处这样一个时代,”Chen 认为:“将来每个人都必须能够编写复杂的应用程序。”很快人们就会说,“你们自然语处理的版本在哪里?”“我该怎么跟你的 App 对话?因为我懒得打字。”

  这些公司已经将深度学习整合进了每天的工作日程。微软研究院的 Peter Lee 说:“我们的销售团队使用神经网络与买房取得联系。”

  硬件市场同样感受到了震动。摩尔定律带来芯片升级换代,更重要的是英伟达生产的图像处理器在进行深度学习计算时要比传统 CPU 快上 20 到 50 倍。过去的 8 月份,英伟达公布第 3 季度财报,数据中心这部分的销售额是去年同期的两倍多,达到了 1.15 亿美元。英伟达的 CTO 告诉投资人,大部分的增长来自深度学习。在 83 分钟的投资人会议里,深度学习被提到了 81 次。

  芯片巨头英特尔当然没有什么都不做。在过去的两个月里,英特尔收购了 Nervana Systems(超过 4 亿美元)和 Movidius(金额未公开),两家针对深度学习做技术的公司。

  至于谷歌,则在 5 月份公布它在过去一年多的时间里,偷偷使用自己的定制芯片 TPU 加速深度学习。

  企业或许真的到了又一个转折点。百度首席科学家吴恩达说:“很多 S&P 500 CEO 都想着自己要是早些开始思考互联网战略就好了。再过 5 年,很多 S&P CEO 会想着自己要是早些思考 AI 战略就好了。”

  在吴恩达看来,拥有深度学习的 AI 比互联网还强大。他说:“AI 是新的电力,就像 100 年前电力引发产业革命一样,AI 也会改变许许多多的行业。”

1  2  3  4  下一页>  
责任编辑:Trista
免责声明: 本文仅代表作者个人观点,与 OFweek电子工程网 无关。其原创性以及文中陈述文字和内容未经本站证实, 对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅 作参考,并请自行核实相关内容。

我来说两句

(共0条评论,0人参与)

请输入评论

请输入评论/评论长度6~500个字

您提交的评论过于频繁,请输入验证码继续

暂无评论

暂无评论

文章纠错
x
*文字标题:
*纠错内容:
联系邮箱:
*验 证 码: