Issue #095 2021-06-10

📢 Editor’s Note

投资公司 a16z 上月发表的一篇质疑云计算的分析文章极具讨论价值,这篇文章像极了皇帝穿着「新衣」上街,只有一个「小孩儿」提出问题的情形,它试图指出一种可能:公司,特别是创业公司,不要被云计算的低成本入门产品所迷惑,稍有不慎,云计算成本就会吞噬公司的利润。本期「AI Insider」我会结合自己对行业的理解,提供几个思考角度。

本期还将关注:

  • 巨头:蚂蚁与腾讯的数据库、阿里云与腾讯云的海外市场布局、微软收购获批;
  • 政策:五角大楼 AI 预算、北约计划成立军事 AI 投资基金;
  • 芯片:Google 展示芯片设计的加速方法、中国监管部门审核英伟达 ARM 收购、小米芯片重组;
  • 基础研究:中国超大规模语言模型亮相、工业级面部识别的难度;

感谢订阅「AI Insider」,以下是详细内容👇。

焦点·洞察

让我们来谈谈云计算的成本

作为长期跟踪云计算发展的观察者,过去几年我会深刻感受到越来越多的行业开始接受云计算的技术与商业模式,而在另一个维度上,不管是美国的 AWS、Azure 还是国内的阿里云、腾讯云、华为云,云服务的营收都在持续上涨,也成为支撑各自公司营收以及股价(或者未来增长)的重要部门。

特别是疫情期间,全球主要国家的数字化转型速度加快,大量工作流迁移到线上,企业开始重度使用云服务,整个世界也被迁移到了「云上」。

可以毫不夸张地说,2021 年,已经没有人质疑云计算带给企业的价值。

但没有质疑,或许是最应该警惕的时刻,正是在这样的背景下,投资公司 a16z 上月发表的一篇质疑云计算的分析文章才有了讨论价值,这篇文章像极了皇帝穿着「新衣」上街,只有一个「小孩儿」提出问题的情形,它试图指出一种可能:公司,特别是创业公司,不要被云计算的低成本入门产品所迷惑,稍有不慎,云计算成本就会吞噬公司的利润

接下来结合我对行业的理解,提供几个思考角度。

其一,云计算并不代表低价。云计算的本质是计算资源的解绑与重新分配,云计算公司将传统意义上只存在于某个服务器上的计算、存储、网络能力单独「抽离」出来,随着抽离的资源越多,形成了一个类似「资源池」的虚拟存在,然后通过软件的调度,根据不同用户的采购需求,实现计算资源的再分配。

这个过程里,所谓的云计算低价,只是展示了最低限度的计算资源费用,一如某些购物网站会将零配件与主要产品的价格混合在一起,并通过低价吸引客户。在云的模式里,低价所代表的是几乎最低限度的 CPU、最小容量的硬盘以及俗称「小水管」的网络传输能力,(比如 1M 带宽),而对企业来说,这些低价的产品几乎就是一堆玩具,根本不能支撑起其基本的业务,因此会花更多钱去采购更贵的云产品。

由于企业的需求不同,目前没有权威的统计显示企业在传统 IT 采购与云计算采购中的费用对比,不久前,亚马逊创始人贝佐斯在写给股东的年度信件提出一个数字,企业采用 AWS 云服务获得成本节约为 190 亿美元,但这个数字过于笼统且具有极强的 PR 属性,所以也并不可信。

其二,云计算带给客户的价值是灵活。Instagram 的早期成长离不开使用 AWS 提供的弹性扩展能力,很长一段时间里,阿里云都支撑了微博因为某个明星出轨/婚变而导致的流量暴涨,这些国内外的案例也被云计算公司不断加工、包装,形成了云服务如此灵活的宣传话术。

与此同时,云计算的灵活还表现在企业能够根据自己的需求不断调整使用云服务的方式,如果你或你所在的企业使用过 AWS 的服务,一定会对 AWS 计费方式之复杂而感到震惊,在「简单云服务」与「复杂计费模式」之间有着巨大的理解和认知鸿沟,由此也形成了一个新行业:帮助企业客户优化 AWS 或其他云服务账单。

通过分析 AWS 以及其他云服务的账单,企业能够相对清晰地了解到云服务的真正成本,这对于很多 SaaS 类公司来说至关重要,行业里一个非常知名的案例,也是 a16z 这篇文章所提及的案例,就是网络存储公司 Dropbox。

和很多 2010 年代的互联网创业公司一样,Dropbox 一开始就使用 AWS,简单来说,这个时期的 Dropbox,就是一个帮助用户将数据更好/更快存储到 AWS 的产品,而随着 Dropbox 用户数量的不断增长,数据存储、管理的成本直线上升,2016 年,Dropbox 公开表示将搭建自己的数据中心,并逐步将此前存储在 AWS 的数据迁移到自建的数据中心。

此举引发外界广泛关注,虽然我们可以判断出这种迁移一定是基于成本的考虑,但并不清楚具体数字,直到 2017 年 Dropbox 上市,在其提交的 S-1 文件里,Dropbox 展示放弃 AWS 带来的巨大优势,两年累计的成本节约高达 7500 万美元

img

正如 a16z 两位分析师所言,Dropbox 的案例既具有代表性,又不具备通用性,不同行业、不同规模的企业,其是否使用云计算与成本节约之间并没有直接的因果关系,不能一概而论,事实上,Dropbox 现在也还在使用 AWS 的一些服务,但这个案例展示了一种可能性:企业需要考虑云计算的真正成本,时刻需要关注自己的利润是否被这些云计算公司吃掉了。

其三,对于云计算公司来说,新的挑战也带来新的机遇。很长一段时间里,AWS、阿里云都是公有云的忠实拥趸,像极了各自母公司的电商主营业务,公有云平台为企业提供了一系列云计算的产品选择,企业客户只需动一动鼠标,就能快速使用这些云服务。

但在最近三年里,企业对于云计算的需求变得更多元化,公有云的标准化、一站式选择已经无法覆盖企业的多元化需求,再加上复杂的成本计算方式、对云服务商锁定的担忧以及数据隐私的考量,企业在私有云、混合云、多云等产品方面的需求变得越来越多。

由此我们也看到了市场的一些新变化,一方面,AWS、阿里云等公司加速在非公有云产品上的开发力度,从 AWS 的 EKS Anywhere 到阿里云不久前推出的飞天本地 Region,这些产品无不在进一步丰富企业的选择,帮助企业构建更灵活的工作流。另一方面,国内主要云计算公司高举云原生的大旗,也是从技术和产品层面进一步提升云服务的使用效率,进而降低云计算的成本,这是未来一年都值得关注的趋势。

最后还需要再强调一下:上云依然是企业数字化转型的关键路径,通过上云完成 IT 架构、业务流程与成本模式的优化与升级,而在上云的过程之中,必须时刻关注云计算成本与利润的关系,苹果可以一个季度在 AWS 花费 3000 万美元,但苹果一个季度的净利润高达 200+ 亿美元,你的企业呢?

政策·国家

美国国防部计划在 AI 领域投入 8.74 亿美元。根据国防部新的预算草案,从下个财年(2022 年 10 月起),五角大楼希望在 AI 领域投资 8.74 亿美元,支撑该机构 600 多个 AI 相关项目,进一步增强美军的作战能力,这笔预算金额要比今年增加 50%。

美国参议院通过一项前沿技术投资法案美联社的报道指出,这项法案的核心是向美国商务部拨款 500 亿美元,旨在推动包括 AI、半导体在内的前沿技术研发,从而应对来自中国的竞争。

北约计划成立一个科技孵化中心,投资 AI 在军事领域的应用FT 称,该计划将组建一个由各个成员国自愿出资的投资基金,通过这个基金,投资一些 AI 创业公司,鼓励他们将 AI 技术和产品应用到军事领域,这项计划将在下周的北约峰会上做进一步讨论。

德国外长警告 AI 军备竞赛已经开始。DW 称,德国外长 Heiko Maas 在该媒体最新一部纪录片「Future Wars — and How to Prevent Them」做了这番表态,并强调国际社会必须看到新的武器正在出现,需要各国缔结相关条约,感兴趣的朋友可以在这里观看这部 46 分钟的纪录片。

AI Insider Monthly

「AI Insider Monthly」以月度总结的形式,展现过去四周全球 AI、云、自动驾驶等领域的产业变化,通过分析行业事件与梳理技术趋势,勾勒出人类迈向数字化的若干方向与线索。

5 月份的「AI Insider Monthly」,将关注以下议题:

  • 巨头·行业大会:阿里云财报与线下峰会、Google I/O 大会、微软开发者大会;
  • 行业·趋势:企业软件的四个趋势、机器学习与环境、腾讯云架构调整、芯片领域新趋势;
  • 未来驾驶:交易(融资)、观点与新进展;
  • 资源·观点: 三份 AI 相关的调查报告、一组 AI 相关图书推荐等;

本期内容还提供了 PDF 版本,欢迎下载:

巨头·行业

蚂蚁。蚂蚁的分布式数据库 OceanBase 更新至 3.0,根据官方新闻稿,新版本已同时具备事务处理和数据分析能力,并已升级为一款支持 HTAP混合负载的企业级分布式数据库,和之前的版本相比,事务处理性能提升 50%,数据分析性能提升 10 倍。

OceanBase 的目标是成为中国金融机构数字化转型的首选,随着核心软件国产化进程加快,数据库领域的竞争也会日益激烈,根据蚂蚁集团透露的信息,目前 OceanBase 已经在包括中国工商银行、山东移动、福建移动、数字江西、中国石化、中华财险、人保健康、浙商证券等在内的多家金融、电信机构落地。

上月,OceanBase 在数据分析型基准测试(TPC-H)中以 1526 万 QphH 的性能总分排名 30000GB 第一,针对该测试,OceanBase 团队成员分享了自己的心得以及对数据库未来的看法,值得一读。

img

OceanBase 的核心代码已经开源,你可以在 Github 上查看相关代码。

值得一提的是,目前腾讯云也在布局金融领域的数据库产品,其自研的数据库产品 TDSQL 在富途、安心财险、和泰人寿等金融机构中应用,未来也会成为 OceanBase 的重要竞争对手。

华为云。华为云接连不断的调整或许将落下帷幕,多家媒体称,余承东已不再担任华为云 CEO,华为云业务目前的两位负责人是徐直军和张平安,前者任董事长,后者出任 CEO。

过去半年时间,华为云业务从组织架构到人事都进行了多次调整,其中的关键人物就是余承东,作为华为内部炙手可热的高管,余承东过去几年带来华为消费者业务取得诸多令人瞩目的成绩,而在美国多项技术封锁之下,他在今年先后成为 Cloud&AI BG 总裁、华为云 CEO,并且还以华为云 CEO 的身份上台发布了多款产品。

我在今年 4 月的一封邮件通讯里谈到,余承东出任 Cloud&AI BG 总裁的目的是解决原来 Cloud&AI BG 的利益博弈,最终实现「友好分家」,并推动张平安实现华为内部消费云与企业云的协同。

如今再去看,华为云业务组织架构已经调整完毕,云业务与传统 IT 业务分离,张平安将成为华为云业务发展的重要推手,现在的一个问题是,华为如何实现消费者业务的云与企业业务的云协同?

本质上说,消费云与企业云是两个完全不同的业务,行业里几乎没有哪家公司会推进两种云业务的协同,即便是同时拥有两种云业务的微软,面向消费者的云业务放在了「生产力与业务流程」部门,而企业云业务归于「智能云服务」部门,华为如何整合、协同两种不同云业务之间的关系,值得长期关注。

腾讯。上周腾讯宣布,泰国曼谷、德国法兰克福、日本东京以及中国香港的四个数据中心开服,不同数据中心里还有多个可用区域选择,根据腾讯官方提供的数据,目前腾讯云拥有 66 个全球可用区,覆盖 27 个地理区域。

阿里云。本周阿里云也宣布了其海外市场新进展,一方面,阿里云将在印尼和菲律宾新增两个数据中心,其中印尼的数据中心已经在 5 月底投入使用,而菲律宾的首座数据中心将在今年年底开通。另一方面,阿里云还将在当地投入 60 亿元人民币用于基础设施建设以及人才培养。

Google。Google 上周与美国连锁医院 HCA 签署一份多年的合作协议,双方将基于患者病例开发医疗算法,目前 HCA 在全美 21 个州拥有 2000 个诊所,根据合作协议,HCA 将使用 Google 数据中心(也就是 Google 云服务)来存储和分析数据,并和 Google 工程师合作共同研发算法。

微软。微软此前斥资 197 亿美元收购 AI 语音公司 Nuance 已经获得美国反垄断监管部门的许可,这笔收购也是微软自 2016 年 260 亿美元收购 LinkedIn 之后的最大一笔收购,此前我也在会员通讯里提及,利用这笔收购,微软一方面将继续优化企业市场(如 Teams)的语音交互功能,另一方面,呼叫中心的巨大市场诱惑,或许会成为微软下一个攻克的重要市场。

Voicebot AI 发现,微软为必应搜索配备新的 AI 聊天机器人,该机器人基于微软 Bot 开发框架,其作用与 Google 助理类似,如下图所示,当我在必应国际版搜索 Google 时,右上角会出现一个聊天窗口,但目前这个机器人还比较「傻」,无法正常与用户沟通。

img

苹果。本周开幕的 2021 WWDC 上,苹果展示了其各个平台的最新操作系统,目前这些系统还处于测试阶段,并将于今年秋天陆续发布正式版。

机器学习依然是此次大会的重要方面,iOS/iPadOS 15 的一系列新特性都离不开机器学习的功劳,比如实时识别拍照时文字信息的 Live Text、通过分析照片信息生成相应歌曲推荐的相册回忆功能等等。

与此同时,苹果进一步强调,所有这些机器学习都是发生在设备端,这意味着几点:其一,由于计算发生在本地,能够最大限度保护用户隐私;其二,本地计算能力的高低与苹果 A 系列处理的性能息息相关,新设备与旧设备的计算效率也会出现差异,这也会成为促使用户更换设备的一大动力;其三,相比于其他通过云端实现的 AI 能力,苹果采用本地计算能够极大降低延迟,带来更快的人机交互。

芯片·业界

Google 最新论文展示如何利用强化学习设计芯片。这是 Google 一直在探索的领域,即通过算法优化硬件特别是芯片的设计,此前,我曾在「AI Insider」里介绍过 Google AI 负责人 Jeff Dean 的一篇非常通俗的论文,聚焦在深度学习如何影响计算架构与芯片设计,Jeff Dean 提供了一个认识深度学习、计算架构与芯片的认知框架,不需要太多技术背景,便能理解其发展方向,你可以在这里查看该论文。

回到 Google 的这个新论文,研究者们瞄准的是芯片设计图制作过程中的复杂问题,引入强化学习的思路,结果显示,可以在六个小时内完成芯片设计的关键指标设计,这是一个巨大的突破,并且该论文还表示,将在接下来的 Google 自研 TPU 的设计过程中采用该方法。

这篇论文已经发表在 Nature 网站,感兴趣的朋友可以通过 Nature 的这个网址免费查看。

英伟达请求中国监管部门审核 ARM 收购事宜FT 援引消息人士的话称,英伟达在几周前提出了这一申请,预计最长审核时间为 18 个月,此前英伟达曾表示,希望在 2022 年 3 月完成对 ARM 的收购。

小米芯片团队重组。「半导体行业观察」从多方信源获悉,小米目前正在招募新的团队,重新布局芯片领域,包括与相关 IP 供应商谈判以及扩大招聘。

不过,该媒体也强调,小米的终极目的虽然是做手机芯片,但第一颗芯片或许会从周边入手。

车载芯片公司地平线或将在年内 IPO。这家公司聚焦在汽车领域的 AI 计算,已经设计并制造了多款车载 AI 芯片,英特尔投资、高瓴资本和云锋基金是其主要的投资方,该公司在今年 2 月完成一笔 3.5 亿美元的融资,这也是其第三笔 C 轮融资,C 轮融资合计高达 9 亿美元。

基础研究·语言模型

中国超大规模语言模型。以 GPT-3 为代表的超大规模语言模型正在成为新的潮流,上周,来自北京的智源人工智能研究院发布新版超大规模智能模型「悟道 2.0」,这是该机构 3 月份发布 1.0 版本后的新升级,根据官方新闻稿,悟空 2.0 模型的参数规模达到 1.75 万亿,是 GPT-3 的 10 倍,也是目前中国首个、全球最大的万亿级模型。

img

悟空 2.0 模型的训练数据量高达 4.9 TB,包括 1.3TB 中文文本数据、2.5TB 中文图文数据、1.2TB 英文文本数据。

如此规模的参数以及庞大的训练数据,其在多项测试中的成绩也不错,下图是官方披露的数字。

img

公开资料显示,北京智源人工智能研究院成立于 2018 年 11 月,成立的背景是「落实『北京智源行动计划』的重要举措……由北京市科委和海淀区政府于2018年11月推动成立的新型研发机构」。

该机构设置理事会、管理团队、学术委员会等多个机构,其中理事会成员包括原微软亚太研发集团 CTO 张宏江、百度 CTO 王海峰、小米技术委员会主席崔宝秋、原华为诺亚方舟实验室主任李航(现已加入字节跳动)等多位企业级高管,而学术委员会成员包括中科院院士张钹、美国加州大学伯克利分校计算机教授 Michael Jordan 等。

从上述人员配置可以看出,这是有关部门最喜欢的「产学研」架构,目标也是贯通人工智能从实验室到产业落地的方方面面。

回到悟道 2.0 超大规模模型的话题上,一如 GPT-3 一样,如何将如此大规模的语言模型融入到各个产业,是一个不亚于模型研发的难题,官方消息是,目前已经与新华社、小米、美团等 22 家科技公司签约。更进一步去看,相比于 OpenAI 所面临的产业与舆论环境,悟道 2.0 以及智源人工智能研究院无需担心资金问题,也不用关心语言模型中的偏见争议。

韩国也在近期披露了自己的「GPT-3」模型,韩国最大搜索公司 Naver 发布了一个名为 HyperCLOVA 的语言模型,拥有 2040 亿参数,采用韩语作为训练数据。

未来一段时间,不同国家、不同语言的超大规模语言模型的「竞赛」还在持续,这种算力、数据层面的「肉搏」能否带来人工智能的真正突破还无从知晓。

大规模面部识别的难度。我们常常听到面部识别技术有多么强大,但很多时候的数据都是在实验室环境里,现实场景里,包括面部识别在内的各种 AI 技术都面临新的挑战。

一份由阿里巴巴、中国科技大学等机构研究者撰写的论文,既提供了一个开展大规模面部识别的有效方法,也从一个侧面展现了面部识别在现实场景中的难度,其最大困难还是庞大的数据集以及巨大的计算量,由此带来也是高昂成本,感兴趣的朋友可以在这里查看该论文。

以上就是本期「AI Insider」的全部内容,再次感谢您的支持,有任何问题或建议,欢迎写邮件给我:zhaosaipo@gmail.com

Email Marketing Powered by Mailchimp