欢迎访问开云官网登录入口kaiyun官网

体育游戏app平台生成式AI成为一大高涨-欢迎访问开云官网登录入口kaiyun官网


发布日期:2024-10-13 06:22    点击次数:86

体育游戏app平台生成式AI成为一大高涨-欢迎访问开云官网登录入口kaiyun官网

本文由半导体产业纵横(ID:ICVIEWS)编译自eetimes

英伟达的竞争敌手不是AMD,而是谷歌和亚马逊。

自Open AI发布ChatGPT以来,生成式AI成为一大高涨,英伟达的GPU动作AI芯片运行流行。关系词,在GPU的坐褥中,存在两个瓶颈:台积电的CoWoS和高带宽内存(HBM),导致GPU在内行规模内短少。

在这些GPU中,H100的需求量尤其大,其价钱飙升至4万好意思元,激发了所谓的英伟达“GPU狂热”。

在这种情况下,台积电将产能翻倍,SK海力士等DRAM厂商增多了HBM产量,导致“H100”的交货时代从52周裁汰至20周。那么,英伟达的“GPU狂热”会完了吗?

在这篇著述中,咱们将盘考英伟达的“GPU狂热”是否行将完了。先说论断,揣度即使到2024年,ChatGPT级AI竖立和运营所需的高端AI业绩器也只须3.9%的出货量。因此,谷歌、亚马逊、微软等云业绩提供商(CSP)的需求似乎根底无法得到得志。总之,到面前为止,英伟达 的“GPU狂热”仅仅一个运行,全面的生成式 AI 高涨行将驾临。

底下,咱们先通俗追忆一下英伟达 GPU的两大瓶颈。

两个英伟达 GPU 瓶颈

在英伟达 GPU的坐褥中,代工场台积电崇拜扫数前、中、后制程。这里,中间工序是指分别坐褥GPU、CPU、HBM等芯片,并将其甩掉在从12英寸硅片切下的方形基板上的工序。这种基板称为硅中介层(图 1)。

图 1 2.5D 到 3D 中出现的中级工艺,举例 英伟达 GPU

另外,台积电竖立的英伟达 GPU封装称为CoWoS(Chip on Wafer on Substrate),但两个瓶颈是硅中介层容量和HBM(图2),情况如下。

图2 CoWoS结构和英伟达 GPU上的两个瓶颈

CoWoS 于 2011 年竖立,但而后,跟着 GPU 性能的提升,GPU 芯片的尺寸不断增大,GPU 中装配的 HBM 数目也随之增多(图 3)。效劳,硅中介层逐年变大,而从单个晶圆上可赢得的中介层数目却与之成反比减少。

图 3 Interposer 面积和 HBM 数目跟着每一代的增多而增多

此外,GPU中装配的HBM数目增多,HBM里面堆叠的DRAM芯片数目也增多。此外,DRAM每两年就会微型化一次,HBM表率每两年更新一次以提升性能。因此,顶端 HBM 供不应求。

在这种情况下,台积电将其硅中介层产能从2023年夏令前后的每月15,000片翻倍至本年夏令前后的每月跨越30,000片。此外,三星电子和好意思光科技已赢得英伟达认证,并运行供应顶端 HBM,此前由 SK 海力士主导。

受上述影响,需求量最高的英伟达 H100的交货时代从52周大幅裁汰至20周。那么,AI业绩器的出货量因此增多了若干呢?

两类AI业绩器的界说

左证DIGITIMES Research发布的《内行年度业绩器出货量,2023-2024》(Servers Report Database, 2024)清晰,AI业绩器有两种类型:

配备两个或多个AI加快器但未配备HBM的系统称为“通用AI业绩器”。配备至少四个配备HBM的AI加快器的系统被称为“高端AI业绩器”。

这里的AI加快器是指为加快AI诳骗,颠倒是神经收集和机器学习而瞎想的稀奇硬件,典型的例子便是英伟达的GPU。此外,ChatGPT级别的生成式AI的竖立和运行需要大王人高端AI业绩器,而不是通用AI业绩器。

那么,通用AI业绩器和高端AI业绩器的出货量分别是若干?

通用AI业绩器和高端AI业绩器出货量

图4清晰了2022年至2023年通用AI业绩器和高端AI业绩器的出货量。揣度2022年通用AI业绩器出货量为34.4万台,2023年出货量为47万台,2024年出货量为72.5万台。

图4 通用AI业绩器和高端AI业绩器出货量(2022-2024)

同期,ChatGPT级生成式AI竖立和运营所需的高端AI业绩器揣度2022年出货3.4万台,2023年出货20万台,2024年出货56.4万台。

那么,高端AI业绩器的出货量能否得志好意思国CSP的需求呢?

图5清晰了业绩器、通用AI业绩器和高端AI业绩器的出货数目。从业绩器全体来看,不管是通用东谈主工智能业绩器照旧高端东谈主工智能业绩器,出货量王人相称少。

图5 业绩器、通用AI业绩器、高端AI业绩器出货量

当我研讨竖立和运行 ChatGPT 级别的生成式 AI 需要若干高端 AI 业绩器时,我愈加失望。

ChatGPT级别生成AI所需的高端AI业绩器

据报谈,ChatGPT 的竖立和运营需要 30,000 台英伟达 DGX H100 高端 AI 业绩器(图 6)。

图6 运行ChatGPT需要若干高端AI业绩器?

英伟达 DGX H100配备了八颗H100芯片,每颗芯片的价钱已飙升至4万好意思元,使得系统总价达到46万好意思元。换句话说,生成 ChatGPT 级别的 AI 需要投资 30,000 台 x 460,000 好意思元 = 138 亿好意思元。

我合计寰球上充斥着生成式东谈主工智能系统,但内容上依然构建了若干 ChatGPT 类生成式东谈主工智能?

图7 业绩器出货量、高端AI业绩器出货量、ChatGPT级生成AI系统数目

由于2022年高端AI业绩器出货量为3.4万台,因此只可构建一套ChatGPT级AI系统(这恰是ChatGPT)。次年,即2023年,高端AI业绩器出货量达到20万台,因此不错构建6到7个ChatGPT级AI系统。由于揣度2024年将出货56.4万台高端AI业绩器,因此将有可能构建18至19个ChatGPT级AI系统。

不外,上述估算假定ChatGPT级AI不错用3万台高端AI业绩器“英伟达 DGX H100”构建。关系词,由于一代 AI 可能变得愈加复杂,在这种情况下可能需要跨越 30,000 个 英伟达 DGX H100。总而言之,好意思国通讯业绩提供商不太可能对现时高端东谈主工智能业绩器的出货量感到景观。

面前,咱们来望望每个最终用户(举例好意思国的 CSP)领有若干台高端 AI 业绩器。

最终用户的高端东谈主工智能业绩器数目

图 8清晰了最终用户的高端 AI 业绩器数目。2023年,领有OpenAI的微软领有最多的高端AI业绩器数目,为6.3万台,但到2024年,谷歌将卓越微软,领有最多的高端AI业绩器。

2024 年排行前五的分别是谷歌,以 162,000 台(5 个系统)排行第一,微软以 90,000 台(3 个系统)排行第二,超微以 68,000 台(2 个系统)排行第三,亚马逊67,000台(2个系统)排行第四。终末是Meta,以46,000台(1个系统)排行第五(括号中的数字是ChatGPT类生成AI不错构建的系统数目)。由此可见,好意思国前五名光热发电企业附近了约80%的份额。

接下来咱们望望AI加快器出货的高端AI业绩器数目(图9)。果不其然,英伟达的GPU是AI加快器使用最多的,2024年将达到33.6万台。关系词,令东谈主骇怪的是,第二受迎接的公司不是AMD,而是谷歌。

图9 按东谈主工智能加快器离别的高端东谈主工智能业绩器(2023-2024)

谷歌竖立了我方的张量惩处单位(TPU)动作东谈主工智能加快器。到2024年,搭载该TPU的高端AI业绩器数目将达到13.8万台。这里,从图8咱们知谈,谷歌到2024年将领有16.2万台高端AI业绩器。因此,揣度有 138,000 台配备了 Google 自家的 TPU,其余 24,000 台配备了 英伟达 的 GPU。换句话说,关于英伟达来说,谷歌既是客户,亦然可怕的敌东谈主。

另外,淌若咱们再看一下2024年的出货量,排行第三的AMD有4.5万台,排行第四的亚马逊则以4万台紧随自后。亚马逊还在竖立 AWS Trainium 动作东谈主工智能加快器。淌若再等等,AMD可能会被亚马逊卓越。

总而言之,面前,英伟达 的 AI 加快器出货量最多,但谷歌和亚马逊正在成为其强有劲的竞争敌手。英伟达的竞争敌手不是惩处器制造商AMD,而是好意思国谷歌和亚马逊。

全面的生成式东谈主工智能高涨行将到来

让咱们总结一下到面前为止的一切。左证 DIGITIMES Research 的一份弘扬,揣度到 2024 年,大概竖立和运行 ChatGPT 级生成式 AI 的高端 AI 业绩器出货量仅占扫数业绩器的 3.9%。东谈主们合计这个出货量根底无法得志CSP的需求。

也便是说,英伟达从2023年到2024年的“GPU狂热”仅仅一个运行。因此,未来可能会出现全面的生成式东谈主工智能高涨。让咱们鄙人面展示其基础。

图 10清晰了半导体行业协会 (SIA) 发布的按诳骗离别的半导体阛阓过甚未来预测。据SIA预测,2030年内行半导体阛阓限度将跨越1万亿好意思元。

图10 按诳骗离别的半导体出货量预测

截止 2030 年,最大的阛阓将是瞎想和数据存储。其中包括PC和业绩器(虽然还有高端AI业绩器),但由于PC出货量不太可能大幅增多,因此业绩器可能会占大多数。

有线通讯是指用于数据中心的半导体。这意味着到2030年,瞎想和数据存储(3300亿好意思元)+有线通讯(600亿好意思元)=合计3900亿好意思元将成为数据中心(包括PC)的半导体,成为内行最大的阛阓。

另一件值得关爱的事情是数据中心阛阓过甚远景,如图11所示。2022年ChatGPT发布后,数据中心阛阓揣度将稳步增长。数据中心由三个成分构成:收集基础次第、业绩器和存储,揣度从 2023 年到 2029 年,业绩器和存储将分别增多一倍傍边。

图11 数据中心阛阓瞻望

这么,业绩器具半导体(包括高端AI业绩器)将占据内行阛阓最大份额,数据中心阛阓也将扩大。

肖似终末一次。到面前为止体育游戏app平台,英伟达 的“GPU 狂热”还仅仅刚刚运行。全面的生成式东谈主工智能高涨行将到来。