Issue #108 2021-10-13

📢 Editor’s Note

又是十月长假回来的第一期「AI Insider」,而焦点话题也和去年一模一样,我会带来最新的「State of AI」 报告解读,今年报告的篇幅为 188 页(去年 177 页),主体部分从基础研究、人才、产业、政策四大方面勾勒过去一年的 AI 发展格局,同时还提供了接下来一年的几个预测。

超大规模语言模型的「军备竞赛」还在继续,微软与英伟达联合发布的新语言模型达到 5300 亿参数;百度近期推出拥有 110 亿个参数的超大规模对话问答模型 PLATO-XL;浪潮也展示了类似 GPT-3 的超大规模语言模型 Yuan,其参数达到 2450 亿。

本期还将关注:

  • AWS S3 到底有多贵以及 AWS 历史上的宕机事故;
  • Google 分享交通信号灯研究、DeepMind 盈利;
  • 芯片、自动驾驶以及合成数据市场的新动态;
  • 五角大楼前官员直言中国 AI 完胜美国、两个利用 AI 增强警察执法能力的实验;

焦点

2021「State of AI」报告

又是十月长假回来的第一期「AI Insider」,而焦点话题也和去年一模一样,两位英国投资人 Ian Hogarth、Nathan Benaich 刚刚发布了 2021 年的「State of AI」,这一次的篇幅为 188 页(去年 177 页),主体部分从基础研究、人才、产业、政策四大方面勾勒过去一年的 AI 发展格局,同时还提供了接下来一年的几个预测。

接下来我会分享其中我认为最值得关注的技术或产业趋势,你也可以在这里获取该报告的完整版本。

1.Transformer 模型全面进入计算机视觉领域

Transformer 模型最早出现在自然语言领域,但随着 Google 提出视觉领域的 Transformer 模型(Vision Transfomer),这个领域的研究开始变得火热,研究者也发现,在诸如图像分割、识别等场景中,Transformer 的表现更好。

值得一提的是,上月的特斯拉 AI Day 上,特斯拉也介绍了其将 Transformer 应用到自动驾驶场景的思考,另外,在国内,背靠长城汽车的自动驾驶创业公司毫末智行也引入了 Transfomer 模型。

img

与此同时,该报告还指出,研究者还在探索 Transformer 模型的更多场景,上图显示了其在诸多测试里的巨大潜力。

2.人才领域的新趋势

AI 人才招聘趋势变化所反映的是当地 AI 发展情况,报告指出,巴西和印度的 AI 人才招聘增速非常快,相比于 2017 年增长了 3 倍,这也从一个侧面展现出这两个国家的 AI 产业需求。

img

另外一组趋势是,科技巨头公司对于高校人才、研究学者的争夺持续,下图展示了科技巨头与高校人才的关系。 img

3.AI 产业链向芯片领域扩张

过往很长一段时间,AI 局限在算法、数据层面,即便对算力的需求,也不外乎通过现有的通用芯片或专属芯片进行训练或部署,但在过去一年,AI 产业链持续向上扩张,芯片公司以及制造芯片工具的公司已然成为 AI 产业链的关键,并且也和地缘政治紧密结合在一起。

下图展示了不同地区在芯片产业上的价值。

img

更进一步,这一年的芯片短缺已经直接影响到汽车产业。

img

4.关于预测

img

相较于去年的八个预测,今年有七个预测,如上图所示,我个人认可其中的 1、2、4、5、6,特别是 Transformer 模型的持续流行,会带来非常大的产业变革机会;而 ASML 与 DeepMind 也是最需要关注的公司。

对于第三个预测中的 Anthropic 公司,尽管潜力巨大,但距离发布类似 GPT 等级的研究成果还需要一定的时间。

市场·业界

芯片。来自以色列的 AI 创业公司 Hailo 日前完成一笔 1.36 亿美元的融资,此轮融资后,该公司的估值超过 10 亿美元。

Hailo 研发的芯片可以应用在智能摄像机、汽车以及其他边缘设备上,该公司透露其客户规模已经达到 100 个。

关于 AI 芯片的市场的规模,一份被引用较多的数字显示:预计到 2030 年全球 AI 芯片市场将达到 2533 亿美元,这个数字在 2019 年只有 93 亿美元。

巨大的市场潜力也在吸引大量资本涌入,特别是在中美两国持续技术对抗,围绕所谓「卡脖子」技术的攻坚,已然成为中国科技公司与资本共同发力的方向。

但也必须看到几点:

  • AI 芯片是一种场景式的芯片,不是像 CPU 那般的通用芯片;
  • AI 芯片与其他芯片一样,不仅需要技术突破,还是生态竞争;
  • 就中国市场目前的应用来看,安防是 AI 芯片最大的应用场景(市场),而自动驾驶的应用潜力非常大。

在中国,多家媒体披露 AI 芯片创业公司地平线正在将 IPO 地点从美国转移到香港,财经网援引消息人士的话称,目前整个计划还处在初步阶段,地平线未对此做出回复。

事实上,在网络安全管理日趋严格的时间段,赴美上市已不是一个明智的选择,刚刚发布的《网络安全审查办法》明确要求 「掌握超过100万用户个人信息的运营者赴国外上市,必须审批」。

自动驾驶。通用旗下的自动驾驶公司 Cruise 日前表示,2030 年将拥有 100 万辆自动驾驶出租车队。

这是一个极富野心的目标,来看看 Cruise 最近的布局:

  • 成为迪拜的自动驾驶出租车业务服务商;
  • 获得加州商业化运营网约车的许可;

此前该公司已经获得微软的投资,并将使用微软的云服务。

你认为这个目标可以实现吗?至少我不乐观,在所有围绕自动驾驶的场景里,载人特别是商业化载人模式是最具挑战性的场景,从 Uber、Lyft 先后卖掉自己的自动驾驶业务也可以看出,坐拥网约车「网络效应」的公司,现阶段也无法应对,这对 Cruise 这样没有所谓互联网基因的公司而言,难度更大。

路透社的报道称,来自德国的汽车供应链企业 ZF Friedrichshafen AG 上周投资了一家总部位于英国的自动驾驶创业公司 Oxbotica,投资金额未透露。

两家公司早在 2019 年就已经在自动驾驶软件领域展开了合作,另外 Oxbotica 已经在今年获得英国在线生鲜公司 Ocado 的 1360 万美元投资,双方将探索「最后一公里」配送的成本与效率。

合成数据。不管「数据就是石油」的说法是否正确,至少在 AI 领域,数据极其昂贵,但在巨大的数据需求面前,通过计算机模拟出来的数据——合成数据——开始流行起来,由此也带动了整个市场的火热,咨询公司 Gartner 曾在今年 7 月的预测中指出,预计到 2024 年,AI 项目中的 60% 数据将使用合成数据。

近期围绕合成数据的重要事件:

  • 上周,合成数据公司 Gretel AI 完成 5000 万美元的 B 轮融资,估值达到 3.5 亿美元;
  • Facebook 被披露收购了一家名为「AI Reverie」的合成数据公司,这家公司提供合成视频、图像数据,以 API 的形式提供给需要训练 AI 系统的公司,科技媒体 VB 称,交易金额未透露。
  • 微软展示基于合成数据的大规模面部识别数据集;

巨头

微软。在超大规模语言模型的争夺战上,微软的 MT-NLG 已经赶上了 GPT-3,这个模型由微软与英伟达共同打造,其参数规模是 GPT-3 的 3 倍,达到 5300 亿个,「迄今为止最大、性能最强大的单一 Transfomer 语言模型」,英伟达的官方博客写道。

img

在语言模型领域,参数越大、网络也就越复杂,其训练效果也越好,带给用户(开发者)的感知就是「更聪明」,不过随之而来的则是巨大的计算成本,此次微软的这个模型使用了英伟达价值超过 8500 万美元的 Selene 超级计算机进行训练。

另一方面,超大规模语言模型带来的能耗也被广泛关注,而其复杂的网络设计与庞大的训练数据,也强化了语言模型的所谓「毒性」与「偏见」。

与此同时,中国公司浪潮也在近期展示了类 GPT-3 的大规模语言模型 Yuan,研究人员设计了一套可以过滤原始数据的机制,从而提升了模型训练的速度,该模型的参数高达 2450 亿个,其论文表示:「Yuan 1.0具有很强的自然语言生成能力,而且生成的文章很难与人写的文章区分开来」,你可以在这里查看该模型的论文。

微软上周还宣布,其云服务 Azure 的机器翻译服务中新增 12 种语言支持,目前已经覆盖超过 100 种语言的文本和文档翻译能力。

百度。百度近期也发布了一个超大规模对话问答模型 PLATO-XL,该模型参数达到 110 亿个,根据百度官方的说法,「这是目前全球最大的中英文对话生成模型」。

img

PLATO-XL 的应用场景是多轮对话,比如聊天机器人场景,可以更好实现类似普通聊天或基于某项任务的对话,当然,就像微软或其他语言模型一样,百度的模型也没办法解决偏见的问题。

Google。先看两个对 Google 来说的好消息:

  • DeepMind 盈利:CNBC 称该公司 2020 年盈利达到 5960 万美元,但似乎主要收入还是来自 Google 体系里的公司;
  • 大客户:快餐连锁巨头 Wendy 成为 Google Cloud 客户,双方的合作包括基于 AI 构建语音、计算机视觉软件等,合同金额未透露;

Google 研究者上周分享对城市交通信号灯的研究,研究者利用 AI 技术在以色列特拉维夫优化信号灯切换时间,在降低车辆能耗与等待时间上取得不错的成绩,下一个测试地点是巴西的里约热内卢。

AWS。随着 Cloudflare 上月正式推出对标 S3 的产品 R2,越来越多的云计算产业观察者以及客户,开始关注 S3 的成本, Twitter 上有一个讨论热烈的帖子,值得一看。

由于 AWS 的影响力持续扩大,一旦出现故障,造成的损失不可限量,有一位开发者统计了近几年 AWS 宕机事件及其影响,非常推荐一看。

AI Insider Monthly

「AI Insider Monthly」来自于付费邮件通讯产品「AI Insider」,付费会员每周都会收到一封专属会员邮件,内容包括 AI 领域最新产业变革与前沿技术的深度解析,欢迎试读、订阅。

本期为 2021 年 7 月和 8 月合刊,将关注以下议题:

  • 焦点:如何认识机器人;
  • 未来驾驶:百度汽车机器人的背后、自动驾驶的安全性到底如何?
  • 云计算:市场数据、巨头财报以及几个值得关注的产业趋势;
  • 基础研究:DeepMind 新算法、脑机接口领域新进展;
  • 业界:巨头押注元宇宙、商汤科技 IPO、面部识别政策与产业争论;
  • 资源:中俄 AI 合作、印尼 AI 产业发展、AI 伦理探讨视频、NLP 过去与未来;
  • 芯片:英伟达收购 ARM 进展、从 AI 芯片到 AI 设计芯片的产业趋势;

本期内容还提供了 PDF 版本,欢迎下载:

国家·政策

五角大楼前官员谈中美 AI 竞争。Nicolas Chaillan 是美国国防部软件部门前主管,在和 FT 的交流中,Nicolas Chaillan 表示中国的 AI 能力已经超过了美国,其领先优势已是定局,竞赛「已结束」,未来 15 到 20 年中国将持续领先。

Nicolas Chaillan 更进一步指出,美国很多网络安全系统都是「幼儿园水平」,而很多美国 AI 技术强大的公司(比如 Google)不愿意与五角大楼合作是重要原因。

值得注意的是,微软、亚马逊并没有完全放弃与军方的合作,以此前 Google 退出军方的无人机图像项目 Project Maven 为例,微软和亚马逊先后在 2019 和 2020 年成为军方的技术服务商,各自获得 3000 万和 2000 万的合同。

两个将 AI 应用在警察部门的尝试。澳大利亚昆士兰州警察部门推出一项近乎于电影《少数派报告》的项目:通过海量的数据挖掘,「提前」预测犯罪地点。

当地警方强调,该系统并不是要提前抓人,而是提前进行警力调配和部署,并且不会在报警之前采取任何行动。

新加坡上月推出了机器人警察助手,如下图所示,这是一个自动运行的车辆,顶部的相机会实时拍摄,其主要职责是在特定购物中心或热门广场,寻找所谓「不受欢迎的行为」,比如「在禁烟场所抽烟」或者乱停车等。

img

欧盟议会通过决议,呼吁全面禁止公共场所的面部识别,欧洲议会以 377 票赞成、248 票反对、62 票弃权的结果通过了决议,决议还呼吁禁止使用私人面部识别数据库,并表示基于行为数据的预测性警务活动也应该被取缔。

在今年 4 月欧盟公布的 AI 监管草案里,对面部识别等生物识别技术的监管规定是「原则上禁止」,你可以在这里查看该法案。

以上就是本期「AI Insider」的全部内容,再次感谢您的支持,有任何问题或建议,欢迎写邮件给我:zhaosaipo@gmail.com