中国新一轮半导体热潮、AMD 确认收购 Xilinx、Google 展示超大规模语音模型

Issue #068 2020-10-28

📢 Editor’s Note

中美技术对抗的背景下，「芯片/半导体」频繁成为科技/时政新闻、自媒体平台上的热词，这些密集的新闻、快速增长的企业，折射出的到底是一个机会/机遇还是一个巨大泡沫，现在还是未知数，本期「AI Insider」将提供几个观察维度，从历史经验、行业现实、企业分布等，帮你建立关于芯片/半导体的行业认知。

AMD 收购 Xilinx 的传闻已确定，本期会提供几个分析角度，从产品线融合到中美关系大背景，充分认识到这笔收购的行业意义；另一方面，英伟达 AI 推理芯片再创记录，所谓 AI 推理的「临界点」已来？挑战英伟达的最大难点在哪里？

上周开始，中美科技公司进入到密集的财报发布周期，疫情之下，微软、英特尔、SAP 三大传统 IT 公司财报表现也各不相同，本期会做一些系统梳理。

本期还将关注 Google 展示的语音超大规模模型，它展示出一种可能：通过超大规模参数的模型以及巨大的算力，有望在语音、文本与图像领域实现新的技术突破。在这个背景下，围绕机器学习的「安迪比尔定律」正在悄然形成……

焦点：中国新一轮半导体热潮

中美技术对抗的背景下，芯片/半导体成为频繁出现在科技新闻、时政新闻以及自媒体平台上的热词，每一条消息似乎都有众多解读空间，比如：

2020 年 10 月 14 日，第三届全球集成电路企业家大会在上海举行；
2020 年 10 月 22 日，南京集成电路大学成立，这是中国首个芯片大学；
2020 年 10 月 26 日，工信部表示，积极考虑将 5G、集成电路、生物医药等重点领域纳入「十四五」国家专项规划；
2020 年 10 月 27 日，上海自贸区临港新片区「东方芯港」集成电路综合性产业基地正式启动，目标打造国内第一的芯片制造高地；

与之遥相呼应的，还有 2020 年中国注册成为半导体的公司数量变化，下图是 FT 根据企查查的数据整理而成。

这些密集的新闻、快速增长的企业，折射出的到底是一个机会/机遇还是一个巨大泡沫，现在还是未知数。

本周出版的《中国新闻周刊》聚焦在各地此前建设的半导体项目烂尾潮。早在 2014 年，首批 1300 亿元的国家大基金投入到半导体领域，但在过去几年的时间里，一大批烂尾项目相继浮上水面，比如：

位于武汉市东西湖的弘芯项目；
位于陕西西咸新区号称要建设国内首个柔性半导体服务制造基地的陕西坤同半导体项目；
今年 6 月，南京德科玛因资金不足进入破产清算及资产移交程序；

这些项目烂尾的很大一部分原因是资金链的断裂，更进一步去看，过去几年，各地政府对于半导体相关产业的热衷，也加剧了市场的虚火，大量低水平的重复建设、产业发展变成了投资变现，无论是技术研发、知识产权还是人才培养，过去几年的发展几乎可以忽略不计。

也是在本周，德勤给出了一份亚太半导体市场分析报告，相对客观地勾勒出目前中国所处的产业位置，重点关注以下这些数字：

其一，中国大陆半导体产业在全球主要国家/地区的营收占比不足 5%。

其二，亚洲地区前十大半导体公司，只有两家中国大陆公司入围，这两家公司也是大家熟悉的（华为）海思和中芯国际。

其三，围绕半导体产业链的多个环节，中国大陆有一定优势，但和其他亚洲国家/地区一样，缺乏产业链上游的知识产权、材料与设备的技术能力，这个领域属于荷兰与美国。

你可以在德勤官网免费获取这份 32 页的分析报告。

同样是围绕半导体产业链，这篇文章系统梳理了每个环节上的中国公司以及行业位置，提供非常详细的产业分类和公司发展信息，虽然呈现方式略显传统，但还是推荐一读。

正如德勤报告所指，中国在半导体产业链上需要其他国家/地区的企业和技术，因此非常有必要了解当下中美技术对抗，特别是美国针对中国半导体技术出口的限制，乔治城大学安全与新兴技术研究中心的这份报告详细整理了美国的相关技术出口限制措施。

与过往的半导体热潮不同，此次中国半导体行业发展的每一个细节，都被放在了中美技术对抗的聚光灯下，被全球各个媒体/智库分析解读，或也将成为各地政府重要的「政治任务」。在这样的背景下，从决策者到从业者，都应该尊重产业发展规律，结合当下的产业与市场特点，沉下心去做研发，才能真正实现转「危」为「机」。

财报季·微软·SAP·英特尔

上周开始，中美科技巨头即将迎来一个密集的财报发布时间段，本周的「AI Insider」，我们先来看看微软、SAP、英特尔的最新一季的财报。

微软。微软财报在周三凌晨发布 2021 财年第一季度财报，该季度营收 372 亿美元，同比增长 12%，营业利润 158.76亿美元，同比增长 25%。

三大核心部门的营收如下：

智能云业务：129.9 亿美元，同比增长 20%；
生产力与业务流程业务：123.2 亿美元，同比增长 11%；
其他个人计算业务：118.5 亿美元，同比增长 6%；

智能云业务中的 Azure 公共云营收增长 48%，高于上一季度 47% 的增幅，但由于微软从未透露过 Azure 的业务比重，目前很难计算出微软在公有云业务的营收规模。

考虑到本周亚马逊、Google 也会相继发布财报，我将在下周的「AI Insider」里，结合三家公司的云计算业务财报数字，进一步分析疫情之下的云计算产业格局。

英特尔。上周四英特尔的财报令市场非常失望，几个核心数字：

三季度营收 183.3 亿美元，同比下降 4%；
净利润 47 亿美元，同比下降 26%；
数据中心集团营收 59.1 亿美元，同比下降 7%；
个人计算集团（出售面向 PC 市场处理器）的营收为 98.5 亿美元，同比增加 1%；

英特尔表示，疫情影响数据中心业务的发展，同时该公司的物联网、内存业务也被疫情所拖累，比如物联网的营收同比下滑 33%。

与此同时，尽管疫情放大市场对于 PC 的需求，进而也带动了英特尔处理器业务，但正如华尔街分析师 Patrick Moorhead 所言，疫情期间的 PC 需求向中低端的教育市场转移，这一定程度上影响了英特尔的利润率。

SAP。作为欧洲最大的软件公司，SAP 上周的财报同样令市场失望，这家位于德国的公司披露的财报显示，2020 财年第三季度营收 77.6 亿美元，同比下滑 4%，营业利润下滑 1%，尽管云计算业务有大约 10% 的增长，但软件业务的营收下滑明显，两者相加后的营收依然下降 2%。

根据 SAP 提供的信息，疫情是该公司营收下滑的主要原因，主要表现在疫情引发的经济不确定性，使得包括企业、政府在内的 SAP 潜在客户非常谨慎地对待 IT 领域的投资，财报公布后，SAP 股价暴跌 20%，下图来自 bloomberg。

更令市场担心的是，SAP 表示，鉴于上一季度的业务疲软以及接下来的市场不确定性，SAP 下调了全年的营收与利润预期。

行业·巨头

AMD 确认收购 Xilinx，收购金额 350 亿美元。这个消息传闻已久，AMD 官方确认了该传闻，其官方新闻稿表示，整个收购将以股票的形式完成，预计在 2021 年年底完成交易。

我在此前的「AI Insider」会员通讯里讨论过这个收购的潜在价值，利用这笔收购，AMD 可以快速进入 AI 芯片（侧重数据中心）、5G 领域的踏板，特别是在数据中心领域，从而形成与英特尔和英伟达一致的产品组合。

但外界还是不看好这笔收购。我也曾谈到 Xilinx 的数据中心业务规模太小，无法直接帮助 AMD 对抗英特尔和英伟达；第一财经援引业内人士的话表示，即便以 Xilinx 的 FPGA 业务来看，AMD 能否较好实现「FPGA 配套的软件开发工具或者套件」都是一件困难的事情，几年前英特尔收购 FPGA 行业第二大公司 Altera 之后的整合效果并不好。研究机构 Moor 的分析师 Patrick Moorhead 也告诉 FT，AMD 需要花费大量时间和努力才能形成真正的业务协同。

另一个值得关注的领域，Xilinx 在 5G 领域的客户包括华为，但在美国的制裁下，Xilinx 和 AMD 都无法与这个大客户做生意。

微软投资 10 亿美元在台湾建设数据中心。这笔投资发生在中美关系以及台海关系持续紧张的阶段耐人寻味，微软表示，该数据中心将承载 Azure 云业务，并在未来四年创造 3 万个就业岗位。上月，Google 刚刚宣布会在台湾建设第三座数据中心。

英伟达 AI 芯片再创纪录。在 MLPerf 最新的 AI 推理芯片测试「MLPerf Inference v0.7」里，英伟达再次创造了记录，今年 5 月发布的 A100 GPU 完全碾压了英特尔的 CPU，其中云端推理性能达到英特尔的 237 倍。

这项测试包括数据中心、边缘两大部分，提供视觉、语音、语言、推荐等多个测试项，完整的测试结果详见这里。

英伟达加速计算副总裁 Ian Buck 将其看作是一个 AI 推理市场的「临界点」，即利用 GPU ，可以完全满足企业对于云端 AI 推理的需求。

英伟达在 AI 芯片的强势也成为上周开始的「Linley Fall Processor 2020」会议的议题之一，这是一年一度芯片领域的行业会议，今年受疫情影响以在线会议的方式举行，包括 Google、英特尔在内的巨头以及大批创业公司都参加了这次会议。与会者讨论了当下 AI 芯片的现状以及英伟达的优势，下面这张幻灯片很值得一看，对于英伟达的追赶者来说，软件是一个非常大的挑战。

IBM 新 AI 模型在预测老年痴呆症上表现优异。整个 AI 模型基于对病人语言认知测试的结果分析进行预测，其准确率为 71%，高于目前标准临床 59% 的准确率，而且 IBM AI 模型对于病人的测试时间也更短。

开源·阿里云·Google 语音模型

阿里云开源面向 NLP 场景的迁移学习框架 EasyTransfer。这个框架旨在解决自然语言场景中「知识迁移」的开发和部署难题，包括预训练模型架构、多样化场景以及一站式开发部署三大难题。

EasyTransfer 的相关介绍可参见这里，该项目已经托管在Github。

Google 近期的两个机器学习模型。其中「Multilingual T5」是一个超大规模跨语言的文本 transformer 模型，这个模型在一个支持 101 种语言的数据集上进行预训练，目前拥有 130 亿参数，在多个测试基准种有较好的表现。该模型已经托管在 Github。

「Multilingual T5」依然遵循「模型越大越智能」的行业规律，这个规律不仅在自然语言、图像领域不断被验证，Google 还想将其应用到语音领域，上周，Google 介绍一个名为「Conformer」的超大规模语音模型，根据这篇论文介绍的部分细节，该模型在语音测试的单词错误率环节仅有 1.4% 错误率，整个模型的参数高达 10 亿个，研究者使用 3 万多个小时的音频数据进行预训练，整个预训练过程持续 4 天，借助 512 个 Google Cloud 的 TPU V3 超强算力完成。

这个模型还有诸多值得优化的地方，但的确展示出一种可能：通过超大规模的参数以及巨大的算力，有望在语音、文本与图像领域实现新的技术突破。

但即便是最具代表性的文本超大规模模型 GPT-3，其「智能」也不是所谓的「强人工智能」，而是一种探索「强人工智能」的方法。更重要的是，超大规模的模型与巨大算力的需求，凸显出机器学习领域开始被「安迪比尔规律」左右，一如当年 PC 时代的英特尔处理器与微软操作系统之间的互动一样，机器学习的硬件突破，特别是计算能力的突破，很快就被更大规模的模型所消耗，从而推动计算硬件进入下一个发展周期。

但显而易见的分裂也在这个领域出现：一方面学术领域热衷超大规模机器学习模型的研发，另一方面，工业领域的机器学习应用，却在不断探索模型缩小、剪切的可能性，所谓「Too big to deploy」就是这个道理。

斯坦福大学的机器学习模型可以实现对 Deepfake 视频 80% 的检测成功率。这个模型通过识别说话人的嘴形与所说的声音进行匹配检测，从而找到细微的不同，你可以在这里查看这项研究。

但正如该项目研究者所言，随着 Deepfake 技术的持续提升，检测技术将长期处于追赶的阶段，我们应该通过「非技术的方式」，比如培养一定的媒体素养来识别这些虚假视频或图像。

以上就是本期「AI Insider」的全部内容，再次感谢您的支持，有任何问题或建议，欢迎写邮件给我：zhaosaipo@gmail.com

这封邮件是 Dailyio 的付费邮件，但我欢迎您将这封邮件转发给您身边关注或从事 AI 与云计算的朋友。并希望您向更多人推荐「AI Insider」。

您可以更新邮箱信息或者取消订阅。