Issue #066 2020-10-14

📢 Editor’s Note

长假回归,本期首先解读一份 AI 行业报告「State of AI」,今年的报告用 177 页的篇幅,详细展示了当下 AI 领域——从机器学习基础研究到基于量子计算机的机器学习——的变化与未来路径,我会摘取其中的几个要点,涵盖 NLP、自动驾驶以及 AI 芯片等领域。

IBM 分拆是近期最大的科技新闻之一,相比 2005 年将个人 PC 业务卖给联想、2014 年卖掉半导体业务,此次 IBM 分拆带来的影响极大;而在收购 ARM 的同时,英伟达发布的 DPU 进一步凸显其在数据中心的布局,本期都会做重点分析。

假期期间 Waymo 宣布重启自动驾驶出租车业务引发行业热议,作为在融资、车辆测试里程遥遥领先的公司,Waymo 此举会产生怎样的影响,本期会提供几个观察视角,并将结合百度在北京开放自动驾驶出租车的事件做一些分析。

本期还将提供一些近期围绕 AI 领域的行业报告:美国国会对于 AWS 垄断指控的 11 页报告、中美计算机视觉专利分析、2015——2019 全球 AI 投资变化、2010–2018 俄罗斯 AI 发展总结等。

解读 2020「State of AI」

由两位英国投资人 Ian Hogarth、Nathan Benaich 制作的 AI 行业报告「State of AI」已经连续发布了三年。在上周发布的最新报告里,两位投资人用 177 页的篇幅,详细展示了当下 AI 领域——从机器学习基础研究到基于量子计算机的机器学习——的变化与未来发展路径,非常值得一读。

该报告下载地址在这里,国内读者也可以通过这个地址快速下载。

接下来,我会分享在这份报告里的所读所想。

首先,机器学习进入到「big-model world」。随着计算能力的提升,研究者们开始热衷于挖掘算力的极限,寄希望于通过更大的模型来实现更好的成绩,这导致了当下机器学习模型,特别是语言模型的参数规模越来越大,今年亮相的若干个机器学习模型,其模型参数都达到了史无前例的规模,比如 GPT-3 的参数就达到千亿。

img

从模型最后的表现来看,「越大越好」的结论的确成立,但也带来一系列更大的问题:这些模型既是「烧钱机器」也是「能源消耗机器」,如下图所示。

img

第二,MLOps 成为开源社区 Github 上增长最快的机器学习关键词,下面这张图很有代表性,正如两位投资人所言,这也意味着越来越多的企业开始从构建机器学习模型转向如何运行模型,换言之,企业开始考虑如何在业务层面引入机器学习。

img

第三,2020 疫情之下,机器学习与医疗的结合备受关注。这里需要提醒一下,医疗领域的外延非常大,所以不能简单地判定机器学习是否会改变医疗发展,机器学习在某些医疗场景已经足够出色,比如通过对新冠肺炎患者症状的分析,可以建立相对精准的预测体系,如下图。

img

但另一方面,在诸如药物发现领域,机器学习还处在相对早期的阶段,下图展示的是一组 2019 年至今获得大笔融资的 AI 药物发现创业公司,他们的征程才刚刚开始。

img

一如我在今年多期「AI Insider」里所言,这些看似成功的案例背后,藏着一种「幸存者偏差」,一些可以获得海量数据支持的机构或公司,研发出一系列相对精准的模型,但绝大多数 AI 医疗公司拿不到足够的训练数据,这对于「没有数据就没有智能」的 AI 产品来说几乎无解,也是在这样的大背景下,《MIT 科技评论》曾一针见血地指出:AI 无法拯救人类的疫情,至少这一次。

第四,自动驾驶领域的三个关键词:「烧钱游戏、垂直领域整合、开源」

  • 「烧钱游戏」,只需看一下下面这张图就可以理解,这个领域对于资金的需求已经远超很多人的想象,而资本也开始越发集中,由此带来的马太效应也会凸显,对很多创业公司来说,破产还是被收购,已经成为一道必选题了。
img
  • 「垂直领域整合」,以自动驾驶最关键的组件激光雷达为例,包括 Waymo 在内的公司相继收购了多家激光雷达厂商,其目的就是实现内部研发、制造这一关键元器件,从而降低车辆成本。
  • 「开源」,下图展示了自 2019 年以来的开源数据集。
img

第五,围绕计算能力的竞争还在继续。站在 2020 年的时间节点,整个行业已经达成了共识:面向机器学习/深度学习的场景,需要专属的计算芯片

从 Google 、英伟达到阿里巴巴、华为等巨头,再到 GraphCore 这样的创业公司,已经在围绕算力的赛道上不断加速,你追我赶的势头还将持续。

这里提供一个数字对比,可以感受到 AI 算力提升有多大:以 BERT 模型训练为例,2018 年,需要 3 天才能完成训练,2019 年 4 月的时候,时间缩短到 76 分钟(论文在这里),2020 年 8 月的时候,英伟达与 Google 将训练这个模型的时间降低到妙级。

第六,面向未来的预测,下图是两位作者对于未来 12 个月行业发展的预测。

img

我个人认可 1、2、4、8,语言模型的参数大战还会持续,OpenAI 依然值得关注,而军事领域的 AI 之争会在当下复杂的国际趋势里更加突出,至于英伟达是否能完成对 ARM 的收购,我一直持怀疑态度。

IBM 分拆、AMD 寻求收购 Xilinx

IBM 上周宣布将分拆公司的 IT 基础设施部门。官方新闻稿称,拆分完成后,新公司将以「NewCo」的名称和独立公司的身份继续为已有的客户服务,资本市场对于该消息给出积极反应,IBM 当天股价上涨 6%,《华尔街日报》援引 Gartner 云计算首席分析师 Daryl Plummer 的话:

If it works, it could be a turning point, similar to the one at Microsoft…If it doesn’t work, it could be a turning point of a different sort.

事实上,相比 2005 年将个人 PC 业务卖给联想、2014 年卖掉半导体业务,此次 IBM 分拆带来的影响极大。IT 基础设施部门曾是 IBM 上世纪 90 年代实现「大象跳舞」后的必然结果,定义着一代人对蓝色巨人的认知,但在云计算的冲击下,这个部门尽管是 IBM 重要的营收部门,不过已经处在连续下滑的「危险」阶段,而在面向云计算的领域,IBM 希望将此前 340 亿美元收购的红帽放在核心地位,以此来塑造所谓的「新 IBM」。

「新 IBM」会继续聚焦企业混合云以及 AI 业务,其市场口号是「a Leading Hybrid Cloud and AI Company」,下图是「新IBM」的定位以及对于未来的愿景:从基础设施服务商转向基于混合云的平台服务商

img

不过值得注意的是,曾经大红大紫的 IBM Watson 会如何处理,目前还是一个未知数。

AMD 寻求收购 Xilinx。上周 Bloomberg 报道称,芯片公司 AMD 正在寻求以 300 亿美元收购 FPGA 厂商 Xilinx,这也成为英伟达 400 亿收购 ARM 以来又一笔半导体领域的重磅收购。

当然,AMD 的这笔收购还没有进一步的消息,但收购的潜在逻辑不难理解。

依托 PC 处理器起家的 AMD,希望借助 Xilinx 的产品扩大自己的产品品类,后者不仅提供 FPGA(现场可编程门阵列,英特尔的解释)芯片,还向电信运营商销售无线芯片。

这意味着,收购 Xilinx,可以成为 AMD 快速进入 AI 芯片(侧重数据中心)、5G 领域的踏板,特别是在数据中心领域,AMD 能够形成与英特尔和英伟达一致的产品组合。

但瑞银分析师给出的分析称:Xilinx 的数据中心营收只有每年 5 亿美元,远远低于英伟达 65 亿美元/年和英特尔 260 亿美元/年的规模。所以这笔收购对于 AMD 是否可以形成数据中心竞争力还有待观察。

行业·巨头

自动驾驶的关键时刻。上周,Alphabet 旗下的自动驾驶公司 Waymo 宣布将在美国亚利桑那凤凰城重启自动驾驶出租业务,根据其官方博客的说法,此前注册成为 「Waymo One」的会员将可以在重启后体验到无人类安全员的自动驾驶服务,未来几周将把该服务展到当地所有居民。

此举既是自动驾驶因疫情停止后的重启,也被认为是 Waymo 加速商业化的重要事件,更重要的是,作为在融资、车辆测试里程遥遥领先的公司,Waymo 的举动也再次激发自动驾驶领域的热情。

自动驾驶创业公司 voyage 创始人 Oliver Cameron 在一封邮件通讯里直言:Waymo 代表了「第一波自动驾驶潮流」。这股潮流与此前的电动车甚至 iPhone 的早期发展类似,既从被嘲笑、被无视逐步成长为行业发展的主流。

Oliver Cameron 的看法也代表了行业从业者的普遍观点。在国内,第一财经采访了包括 AutoX、小马智行等在内多家创业公司高管,其中 AutoX 创始人 CEO 肖健雄这样说道:

Waymo扩张无人驾驶运营举措的意义非常重大,说明未来全自动无人驾驶将完全成为现实,并且任何人都能打到没有人类司机的无人驾驶车。只有在技术达到非常成熟度的时候,公司才敢放开给所有人坐。

百度也在本周宣布,自动驾驶出租车服务在北京全面开放,用户可在北京经济技术开发区、海淀区、顺义区的数十个自动驾驶出租车站点,直接下单免费试乘自动驾驶出租车服务。

该信息引发众多科技媒体试用体验,《21 世纪经济报道》记者的体验任务,「与正常的招手即来的出租车相比,目前的 Robotaxi 更像是一辆特定区域内的区间摆渡车」。而「深燃财经」的体验报告则称,「等待时间长、出行效率低,行驶效率和人们习惯的网约车还有一定差距,不适合赶时间的用户」。

从商业模式看,百度目前的策略与 Waymo 并无差别,都是将自动驾驶技术与出行服务结合起来,在持续的真实道路测试中提升技术能力,并教育市场与用户,进而建立起基于自动驾驶技术与品牌的护城河。

但需要看到的是,自动驾驶的现状远不能满足用户与市场的期许,而包括百度在内的公司有意无意地释放出类似「自动驾驶出行即将改变彻底世界」的营销口号,势必进一步扩大自动驾驶理想与用户现实体验之间的鸿沟,这对整个行业的健康持续发展并不是一件好事。

更重要的一点,Waymo 与百度的商业模式不过是自动驾驶发展路线的一种,就在社交媒体上广泛讨论 Waymo 将如何影响自动驾驶发展的时候,伊隆·马斯克发推说道:

Waymo is impressive, but a highly specialized solution. The Tesla approach is a general solution. The latest build is capable of zero intervention drives. Will release limited beta in a few weeks.

火药味渐浓。

英伟达的 DPU 计划。英伟达上周发布的 DPU 颇具看点,从产品定位上看,这是一个面向数据中心的数据处理产品,如果说 CPU 是通用场景计算方案,那么 DPU 则是数据计算专属方案,加上本身在图形计算领域优势明显的 GPU,英伟达向数据中心又迈出重要一步。

img

其二,根据英伟达的说法,DPU 可以大幅提升机器学习中数据性能,DPU 也可以与 CPU 等同时工作,从而进一步释放数据中心 CPU、GPU 的计算负载。换句话说,DPU 可以让 CPU、GPU 承载更多的计算任务,这也是面向未来数据中心的现实需求。

其三,英伟达已经宣布 400 亿美元收购 ARM,尽管这个收购还需要主要国家监管部门的批准,但足以彰显出英伟达对于数据中心的野心,而结合 DPU 这条产品线,英伟达俨然具备更多底气,去一步步获取英特尔垄断的 X86 服务器市场,至少,目前英伟达的产品线可以在 X86 中低端市场博一下。

AWS:降价、垄断指控。假期期间,AWS 调整了部分 Sagemaker 计算实例的价格,最高降幅达到 18%,Sagemaker 是 AWS 提供的完全托管在云上的机器学习服务。你可以将其理解为适合机器学习的云服务器,通过整合大量 AWS 的机器学习产品,实现一站式的训练与部署。下图是其基本架构。

img

更详细的价格变化,请参考 AWS 官方新闻稿

也是在中国假期时间,美国众议院司法委员会发表了一份长达 449 页的反垄断调查报告,详细介绍了对苹果、Google、亚马逊、Facebook 四家公司的垄断调查,其中对亚马逊的指控也提及 AWS 的垄断行为,大概包括几点:

  • 大量客户选择 AWS 作为云服务首选,而 AWS 利用复杂的产品和功能设置,形成了客户迁移到其他云服务的障碍;
  • AWS 将一些开源服务商业化,从而让使用开源服务的客户无法轻易离开 AWS,其中最知名的事件就是 MaogoDB;

你可以在这里免费获取这份调查报告全文,如果只是对 AWS 相关部分感兴趣,可以通过这个地址下载我整理的 11 页报告。

Deepfake,Maxine 是英伟达上周发布的一个基于 GPU 的云视频会议工具,根据英伟达的官方介绍,开发者可以通过该工具提升视频会议与会人员的体验,包括更高分辨率的展示、视频降噪以及人脸优化等多个效果,科技媒体 VB 指出,这些对人脸增强的技术背后,还需要考虑诸如算法偏见(肤色是一个重要维度)、人脸图像优化的心理影响(Google 已经默认关闭智能手机相机的滤镜功能)以及是否会陷入 Deepfake 的滥用等等。

正如 Wired 英国版这篇报道所言,由于类似 deepfake 这类技术发展速度非常快,整个社会还没有完全适应,导致监管不力。由于缺乏监管,大量 deepfake 视频充斥在成人网站,面向银行的 deepfake 欺诈也日益增多、社交媒体上基于 deepfake 的「假脸」已经成为部分国家、政治团体进行传播虚假信息的重要途径。

FT 的这篇长文进一步谈到识别这些「假脸」的方法,不过就像文末一位专家的判断一样:当下通过「假脸」、deepfake 进行的欺骗还需要巨大的工作量(计算成本高),这也极大限制了这些技术的「作恶潜力」,而随着该领域技术成本的下降,其潜力也将被释放。

最后补充两个 deepfake 的「善举」:在 HBO 新纪录片「Welcome to Chechnya」里,制作团队为了保护几位同性恋采访对象的隐私,后期采用了 Deepfake 技术做了处理;今年美国黑人抗议运动 BLM 里,斯坦福大学开发了一个基于 deepfake 的面部保护工具

资源·报告

整理一组近期 AI 领域的相关资源。

  • 透过计算机视觉领域的专利,一窥中美两国在该领域的竞争格局,报告下载地址
  • 2015–2019 年全球 AI 投资变化分析,提供了大量数据,报告下载地址
  • 2010–2018 俄罗斯 AI 发展总结,可以作为了解当地 AI 发展的入门,报告下载地址
  • 免费的数据伦理课程「Practical Data Ethics」,共计 6 节课、9 个视频、总时长大概 10 个小时,详细介绍了虚假信息、数据伦理与偏见、隐私等方面的理论研究与实际案例,视频之外还有大量文本阅读材料推荐以及测试代码,课程地址
以上就是本期「AI Insider」的全部内容,再次感谢您的支持,有任何问题或建议,欢迎写邮件给我:zhaosaipo@gmail.com
这封邮件是 Dailyio 的付费邮件,但我欢迎您将这封邮件转发给您身边关注或从事 AI 与云计算的朋友。并希望您向更多人推荐「AI Insider」。

您可以 更新邮箱信息 或者 取消订阅

Email Marketing Powered by Mailchimp