人工智能是如何解散芯片行业

频道:财经资讯 日期: 浏览:0

从计算的早期开始,人们就一直认为人工智能有朝一日会改变这个世界。几十年来,我们已经看到无数流行文化参考和未来主义思想家所描述的未来,但技术本身仍然难以捉摸。增量进步主要归功于边缘学术界和消费性企业研究部门。

这一切都在五年前发生了变化。随着现代深度学习的出现,我们已经看到了这项技术在行动中的真实一瞥:计算机开始看到,听到和谈论。人工智能第一次感觉有形,触手可及。

今天的人工智能开发主要围绕深度学习算法,如卷积网络,循环网络,生成对抗网络,强化学习,胶囊网等。所有这些都有一个共同点,就是它们需要大量的计算能力。为了在推广这种智能方面取得实际进展,我们需要彻底检查为这项技术提供动力的计算系统。

2009年发现gpu作为计算设备通常被视为一个关键时刻,帮助引发了围绕深度学习的寒武纪爆发。从那时起,对并行计算架构的投资爆炸式增长。谷歌tpu(tensor processing unit)的兴奋就是一个很好的例子,但tpu才刚刚开始。cb insights的发言人告诉我的团队,仅在2017年,新的专用ai芯片初创公司就筹集了15亿美元。这太惊人了。

我们已经看到新的创业公司进入现场,挑战英特尔,amd,nvidia,微软,高通,谷歌和ibm等老牌企业。像graphcore,nervana,cerebras,groq,vathys,cambricon,sambanova systems和wave computing等新兴公司正在成为为深度学习的未来铺平道路的新星。虽然这些创业公司肯定资金充足,但这些都是早期的,我们还没有看到谁将成为赢家,以及将来会有什么样的老卫兵。

nvidia将gpu作为人工智能和深度学习的替代品引入主流。该公司计算从消费者游戏领导者转变为ai芯片公司的过程非常出色。就像其对volta的30亿美元投资以及像cuda / cudnn这样的深度学习软件库的推动,它将其从领先地位推向市场主导地位。去年,它的股票走到了尽头,首席执行官jensen huang被“财富”杂志评为年度最佳商人,并因此获得了“新英特尔”的美誉。

但是虽然nvidia在外观上可能看起来完全不同,但它仍然只是制造了几十年来制作的相同显卡。但gpu作为ai技术的未来尚不确定。批评者认为,gpu已经挤满了20年的不适用于深度学习。gpu是通用设备,可支持各种应用,包括从物理模拟到电影渲染的所有应用。我们不要忘记,2009年在深度学习中首次使用gpu基本上是一种黑客行为。

攻击芯片市场的公司正在证明ai将在专用芯片上更快地执行光照。最有可能的候选者是asic(专用集成电路),它可以高度优化以执行特定任务。

如果您认为芯片是从通用到专用的发展,那么频谱包括一方面的cpu,中间的gpu和fpga,另一方面包括asic。

cpu在执行高度复杂的操作方面非常有效 - 基本上与支持深度学习训练和推理的特定数学类型相反。新进入者正在押注asic,因为它们可以在芯片级设计,以处理大量简单的任务。该板可以专用于一组窄函数 - 在这种情况下,稀疏矩阵乘法,具有高度并行性。即使是设计为可编程且因此稍微更加通用化的fpga,其隐含的多功能性也受到阻碍。

专用ai芯片的性能提升是显而易见的。那么这对更广泛的技术领域意味着什么呢?

相对于cpu而言,gpu已经没有商品化了,而且我们看到ai芯片投资的大量涌入,gpu最终将被更专业的东西取代。考虑到nvidia的存在,英特尔的x86 cpu技术过于普遍化,无法满足对图形密集型应用不断增长的需求,这里有一点讽刺。这一次,英特尔和nvidia都不会袖手旁观,让创业公司吞噬这个新市场。机会太大了。

可能的情况是,我们会看到nvidia和英特尔继续大力投资volta和nervana(以及他们的继任者)。由于互操作性问题,amd一直在苦苦挣扎(参见下面的软件部分),但很可能会很快提出可用的东西。微软和谷歌正在与brainwave和tpu以及许多其他项目合作。然后是所有创业公司。这份名单似乎每周增长,你很难找到一个风险投资基金,该基金没有对至少一个参与者进行过相当大的赌注。

芯片领域的另一个问题是边缘计算,其中推理是直接在设备上计算的,而不是云内环境或公司数据中心。模型可以直接部署在边缘,以满足低延迟要求(移动)或对低功耗,间歇连接设备(嵌入式,物联网)进行预测。最近有几个关于基于边缘的ai加速器的公告,例如google的edge tpu。

芯片领域的任何新人面临的最大挑战可能不是硬件 - 它是软件。nvidia凭借cuda / cudnn在市场上占有一席之地,cuda / cudnn是软件库,构成了位于芯片顶部的必要抽象层,使tensorflow和pytorch等框架无需编写复杂的低级指令即可运行。如果没有这些高级库,通常很难从代码的角度来定位芯片。

问题是,cuda和cudnn不是开源的。它们是专有包,只能在nvidia硬件上运行。在开发人员可以利用asic之前,提供商需要首先找到一种新方法,使框架可以轻松访问其芯片。如果没有这一点,开发人员将不会采用重要的(如果有的话) - 开发人员只会坚持使用nvidia,因为它可行。需要有一个等同于cuda / cudnn的开源或需要移植到特定asic的框架,就像google对tpu和tensorflow所做的那样。没有明显的解决方案,这是一个巨大的障碍。

至少在短期内,我们会看到过多的芯片,一些直接相互竞争,另一些则专注于培训和推理的特定方面。这对行业意味着开发人员会有很多选择。与大规模商品化的cpu市场不同,该行业看起来正朝着更加多样化,异构化和特定应用的未来发展。

虽然我们不知道具体结果是什么,但有一点是肯定的:人工智能的未来在于专用asic而不是商品硬件。

daniel kobran是gpu云平台paperspace的联合创始人。

虚拟制作

全身动作捕捉

无线动作捕捉系统

手指动作捕捉服务

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 931614094@qq.com 举报,一经查实,本站将立刻删除。