☕️ Editor’s Note

今天是 2023 年 7 月 5 日,您正在阅读的是第 173 期 AI Insider。

本期首先聚焦大模型市场的融资情况,两笔巨额融资的背后有哪些显著特点,这些特点又将如何影响这个市场的发展,本期会提供几个思考方向。

微软发布 Azure OpenAI 服务更新、Azure 营收规模遭受质疑以及云服务商面临的地缘政治压力等,也是本期讨论的议题。

与此同时,本期还将关注英伟达面临 AMD 的芯片挑战、AI 创业公司对数据的贪婪、围绕 AI 监管的不同声音等。

接下来,欢迎和我一起复盘近期围绕计算与智能的关键产业事件。

大模型·市场

过去一周,大模型市场依然充满了「金钱」的味道。先看两笔巨额融资:

  • 大模型服务商 Inflection 获得 13 亿美元融资,距离该公司推出自己的聊天对话产品 Pi 刚刚过去了两个月;
  • 文本转图像创业公司 Runway 宣布以 1.41 亿美元完成 C+轮融资;

这两笔投资极具市场代表性。其一,一如我在之前几期 AI Insider 里所言,「寻找下一个 OpenAI」会成为资本市场的一个重要投资方向,此前 Cohere、Anthropic 等明星创业公司,以及这次获得 13 亿美元融资的 Inflection,都在这个赛道上。

img

Inflection 最近刚刚发布了自己的大模型产品 Inflection 1,根据官网介绍,这是一个可媲美甚至超越 GPT-3.5 的基础大模型。这家公司也表示,未来将继续推出比肩 GPT-4 的基础大模型。

其二,来自科技巨头公司的支持成为目前众多创业公司的资金来源,仔细去看这两笔投资的投资方:

  • Inflection:微软、英伟达;
  • RunWay:Google、英伟达、Salesforce;

这些科技巨头对于生成式 AI 公司的投资,并不像传统 VC 那样仅仅开出支票、派高管加入董事会这么简单,常常会将自身的业务与创业公司进行绑定,比较有代表性的就是微软此前投资 OpenAI,在真金白银之外,还为 OpenAI 提供了 Azure 云服务上的算力支持。

类似地,在 Inflection 公司发展的过程里,英伟达的作用功不可没。福布斯的报道称,英伟达和 CoreWeave 合作,为 Inflection 公司开发了适用于大模型训练的 H100 GPU 计算集群,并在近期完成了相关测试,能够大幅缩短训练 GPT-3 参数规模的大模型时间。

通过与这些提供算力(芯片服务商)、云服务的科技巨头合作,创业公司技能大幅减少创建基础模型的时间,还能利用海量的云上资源,快速部署、上线自己的产品;而在科技巨头的「算盘」里,押注一个新赛道或许比赌注一家创业公司更有战略意义,比如英伟达的投资策略,与其说是追求从创业公司获得回报率,倒不如说是在构建一个个 GPU 能力展示的「样板间」,在不断推动市场火热的同时,最终让包括 A100、H100 在内的一众芯片卖得更好。

其三,大额融资或收购的交易才刚刚开始。Box 公司创始人 Aaron Levie 在 Databricks 公司以 13 亿美元收购生成式 AI 创业公司 MosaicML 时说了一个词:这是一笔「instagram 并购」。

这意味着,随着生成式 AI 技术的快速迭代与应用场景的扩大,市场会出现越来越多的并购交易,通过收购,一家公司可快速获取创业公司的人才、技术以及潜在客户资源,从而加速公司战略的转移。

更进一步来看,当下这个阶段还处在大模型或其他生成式 AI 发展的早期阶段,接下来,无论是训练出更高效的模型,还是像 OpenAI 那样发布面向 C 端的产品,抑或是推出基于 SaaS 的 API 服务,所有这些都需要巨额的资金支持。而在大型科技创业公司(比如 Databricks)并购 AI 创业公司、科技巨头投资 AI 公司的影响下,我们有理由相信会有更多的传统的资本会加入其中,比如不甘寂寞的软银,一起将这个市场做大(泡沫吹爆)。

来看一组近期值得关注的融资/并购案例:

  • 美团以 20.65 亿人民币收购 AI 创业公司「光年之外」,这笔交易在商业层面可谈的东西很少,更多还是两家公司所有者、股东们的一次「内部交易」;
  • 医疗影像技术创业公司 Flywheel 完成 5400 万美元的 D 轮融资,英伟达的投资部门也参与了此次投资;

另外对于中国大模型的市场,科技部在一份《中国人工智能大模型地图研究报告》里给出了几个线索

  • 据不完全统计,截至目前,参数在 10 亿规模以上的大模型已发布了 79 个;
  • 中国已有 14 个省区市在开展大模型研发,主要集中在北京和广东,其中北京 38 个、广东 20 个;
  • 中国有超过半数的大模型实现开源,北京、广东、上海三地在开源数量和开源影响力方面均居国内前三,高校及科研机构是开源主力。

这个市场接下来的惨烈程度会超过很多人的想象。

大模型·巨头

微软。微软上周发布 Azure OpenAI 服务的更新,支持了此前 OpenAI 发布的 GPT-35-Turbo 模型新版本以及全新的 GPT-35-Turbo-16k 版本等。

对于绝大多数中国用户来说,付费使用 OpenAI API 的门槛很高,相比而言,借助微软 Azure 使用 OpenAI API 不失为一个不错的替代选择,付费非常方便,直接绑定信用卡(支持银联)即可,而且价格和 OpenAI 完全一样。

与此同时,微软也披露了客户在使用 Azure 模型服务时的数据隐私政策,几个要点:

  • 微软永远不会将客户的数据用于训练 OpenAI 的模型,也不会提供给第三方;
  • 微软不会将客户训练模型的数据用于改善微软产品;

不过还要提醒两点:

  • 微软有权对客户提交的提示词进行审核,包括机器和人工审核;
  • 微软会将客户生成的数据保存 30 天,然后再删除,客户也可以申请微软及时删除;

对微软而言,近期还有一个报道引发市场关注,付费媒体 Information 援引一份法庭文件显示,在 2022 年 6 月期间,微软 Azure 业务营收为 340 亿美元,同期 AWS 的营收是 720 亿美元

长期以来,微软一直不披露 Azure 公有云业务的营收规模,而是将 Azure 和其他云相关的业务——包括 Windows 服务器业务、数据库业务等——整合组成一个名为「智能云」的业务部门,上一季度营收 220.8 亿美元,同比增长 16%。

img

外界对于 Azure 营收规模和市场占有率有不同的看法,一般都会以 AWS 作为基点,以 80% 左右的比例计算 Azure 的市场份额或营收,比如咨询公司 Synergy 最新的数据显示,AWS 在全球云基础设施服务市场占据 32% 的市场份额,位居第二的 Azure 为 23%,但在这份文件里,Azure 的营收只有 AWS 47% 的样子,的确很出人意料。

目前微软尚未就此做出回应。但对于资本市场而言,他们可以忽视微软过往在云计算领域的地位,因为在面向生成式 AI 的赛道,微软以及 Azure 的确拥有不小的先发优势,通过整合 OpenAI 各类模型到 Azure 认知产品体系里,微软构建起了一个独家渠道,如果企业希望以符合企业级产品需求的方式使用 OpenAI 的各类大模型,Azure 是目前唯一且最好的选择。

从这个角度去看,接下来两个季度微软的财报数字非常值得期待,这不仅是微软再一次全面押注 AI 的成绩展示,也是一份 OpenAI 各类模型落地企业级市场的成绩单。

与此同时,在大模型领域,摆在 AWS 和 Azure 的另一个挑战是地缘政治的影响。WSJ 本周继续报道了美国政府正在酝酿的一项云服务限售令。一旦这项行政命令被通过,AWS 和 Azure 必须首先得到美国商务部同意,才能为中国客户提供高端 GPU——比如英伟达 A100——计算实例。

这项正在酝酿的行政命令被认为是美国芯片限售令的升级版,但此举也势必影响到 AWS 和 Azure 的在华业务,两家公司在华都拥有一定的客户群体。而更重要的是,中国大模型市场正处于爆发阶段,「缺卡」但不缺钱的现状迫使各个创业公司寻找一切可替代方案,基于云服务获取 GPU 算力的灵活性俨然成为共识,由此带来可能是双输的结果。

沿着 AI 芯片的议题,上周被 Databricks 收购的生成式 AI 创业公司 MosaicML 发布了一份芯片性能测试,该公司选择 AMD 和英伟达上一代旗舰芯片 MI250 和 A100 作为测试对象,这两款芯片目前在市场上也处于供不应求状态。MosaicML 公司发现,AMD 的这款芯片可以达到英伟达 A00 80% 的性能。

这份测试结果其实也是对市场需求的精准回应,在 ChatGPT 为代表的大模型浪潮下,英伟达——这个「镇上唯一的卖铲人」——成为资本市场、各大公司追逐的对象,英伟达市值已经稳稳进入「1 万亿美元俱乐部」,而巨大的芯片需求还需要时间进行消化,市场上急需一些可能的替代品或挑战者,AMD 成为最有可能的一家公司。

结合 MosaicML 的测试来看,软件层面的进步成为 AMD 芯片性能提升的关键,这也凸显出 AI 芯片的竞争正在从硬件全面转向软件与生态

关注一组科技巨头最近的动向:

  • 阿里云与西门子达成战略合作协议,双方将在大模型领域展开合作,「通义大模型」将在西门子的 Xcelerator 平台进行落地实践;
  • 华为云和天眼查合作发布了基于大语言模型的「天眼妹」可信商业助理,产品已完成内部测试,预计将在本月底向客户提供有限试用;
  • OpenAI 上周正式宣布将在伦敦设立办公室,并已开始新员工招聘,首批四个职位包括安全工程师和与政府进行沟通的负责人等;
  • IBM 上周以 46 亿美元的价格收购 Vista 公司的 Apptio 平台,这笔收购将帮助 IBM 完善其在混合云业务的布局,并且可以获得 Apptio 上的重要客户。

大模型·争议

伊隆·马斯克上周批评人工智能公司对 Twitter 数据「过度爬取」导致这家社交媒体不得不「限制包括付费用户在内的所有人访问」,这个说法当然不可能是事情的全部——有媒体披露 Twitter 因为未完成从 Google Cloud 的数据迁移,导致访问压力巨大,因此需要限制用户范围。无论真相是哪一种,也从另一个侧面展现出当下这批 AI 公司对于数据的「贪婪」。

只有将海量、优质的数据「喂给」大模型,才有可能训练出一个可用的模型服务,这已然成为行业共识。而 ChatGPT 等大模型的快速走红,极大刺激了各类大小 AI 公司对数据的爬取行为——无论合法或非法,由此也掀起了一场不大不小的「蝴蝶效应」,比如 Twitter、Reddit 大幅提升 API 调用价格,不仅赚了这些 AI 公司的钱,也客观上「杀死」了一个存在多年的第三方应用生态,大量基于上述公司 API 的第三方应用只能关门大吉。

其次,对于包括 OpenAI 在内的各类大模型公司,在抓取互联网上的海量数据进行模型训练时,是否侵犯到发表这些言论的用户的权利?这构成了近期一项对 OpenAI 集体诉讼的争论点,其判决结果势必会对产业发展产生巨大影响。

上周,大约 150 欧洲公司——包括西门子、喜力、空客——联合发表一份公开信,抗议欧盟 AI 监管方案可能导致损害欧洲企业的竞争力。关于这份公开信的内容我不做过多评价,此举更多还是一场关于政策走向的公开游说行为,也凸显出 AI 监管政策的复杂性,有序发展与抑制创新之间的距离,可能非常短

接着谈监管,《财富》记者 Jeremy Kahn 在一封邮件通讯里谈到微软对于欧洲 AI 监管机构的游说。借助欧洲媒体,微软总裁 Brad Smith 希望借鉴航空业监管的模式构建起 AI 监管模式,同时,Brad Smith 还使用汽车驾照、发动机等隐喻类比大模型,Jeremy Kahn 这段话是对政治游说的最好总结(由 GPT-4 翻译):

政治斗争取决于叙事方式的胜负。若能讲述比对手更好的故事,很可能会获胜。构建框架至关重要,这意味着选择正确的隐喻或类比可能至关重要

以上就是本期「AI Insider」的全部内容,再次感谢您的支持,有任何问题或建议,欢迎写邮件给我:zhaosaipo@gmail.com 

这封邮件是 Dailyio ProPremium 的专属内容,但我欢迎您将这封邮件转发给您身边关注或从事 AI 与云计算的朋友。


更新您的邮箱信息
查看网页版
点击这里退订