
前沿资讯
1735036977更新
1
SemiAnalysis创始人兼首席分析师迪伦·帕特尔(Dylan Patel)加入了由硅谷著名投资人比尔·格利(Bill Gurley)和布拉德·格斯特纳(Brad Gerstner)共同主持的Bg2 Pod播客节目,在节目中,帕特尔认为,科技巨头仍然相信规模扩张是实现长期增长和维持竞争力的关键,他还预测,数据中心的投资和AI模型改进将继续推动行业发展至2025年。
SemiAnalysis是一家专注于半导体和人工智能行业的独立研究与分析公司,其服务覆盖了整个供应链,从半导体制造基础到尖端的AI模型、软件和基础设施。SemiAnalysis为超大规模数据中心、大型半导体私募股权公司和对冲基金等提供服务,帮助他们理解当前和预测数据中心的关键IT功率容量。
帕特尔表示,虽然外界有声音认为规模扩张已经走到尽头,但实际上,科技巨头们的行动证明了他们仍然相信规模扩张是实现长期增长和维持竞争力的关键。Meta正在路易斯安那州建造一个两吉瓦的数据中心,同样,亚马逊、谷歌和微软这些科技巨头也在积极建设多吉瓦级别的数据中心,并且不惜投入巨额资金购买光纤,以实现数据中心之间的高速连接。这些行为背后的逻辑是,通过将所有数据中心用超宽带宽连接起来,它们可以像一个单一的数据中心那样协同工作,从而在规模上取得优势。
这些公司之所以这么做,是因为他们认识到了规模的重要性,并且相信通过扩大规模可以获得竞争优势。通过连接数据中心,他们不仅能够提高数据处理能力,还能在人工智能和机器学习等领域实现更高效的资源利用。此外,随着人工智能和机器学习技术的发展,对计算能力的需求也在不断增长,这些公司通过建设大规模的数据中心,不仅能够满足当前的需求,还能够为未来的技术发展预留空间。这种前瞻性的投资策略,让这些公司能够在竞争激烈的市场中保持领先地位,同时也为它们提供了实验和部署新技术的平台。
在讨论全球AI工作负载在不同芯片的分布情况时,帕特尔指出,如果将谷歌的内部工作负载排除在外,那么全球超过98%的AI工作负载都是在英伟达的芯片上运行,如果考虑到谷歌的大规模内部工作负载,英伟达芯片在全球AI工作负载中的占比仍然高达70%。英伟达的芯片是全球AI工作负载的主流选择,无论是在公有云服务、企业内部部署还是研究实验室中。这种广泛的应用证明了英伟达在AI硬件加速领域的强大影响力和广泛的市场接受度。
帕特尔将英伟达的优势形象地比喻为“三头龙”,涵盖了英伟达在硬件、软件和网络三个关键领域的领先地位。英伟达在硬件方面的能力是其成功的核心,英伟达的芯片设计和制造技术使其在性能上超越了大多数竞争对手,它还不断推动技术的最前沿,快速地将新芯片从设计阶段推向市场。在软件方面,英伟达的软件生态系统,包括其CUDA平台和其他开发工具,为开发者提供了强大的支持,使得他们能够充分利用英伟达硬件的能力。这种软件上的优势不仅帮助英伟达巩固了其在市场中的地位,而且还提高了其硬件的易用性和灵活性。
至于网络,英伟达通过收购Mellanox显著增强了网络技术优势。英伟达的网络技术不仅提高了数据传输的速度和效率,还增强了其硬件在大规模部署中的协同工作能力。综合这三个领域,帕特尔认为英伟达构建了一个强大的竞争优势,这个优势是单一半导体公司难以复制的。英伟达在硬件上的创新、软件上的专业性以及网络技术上的领先地位,共同构成了其在市场上的三头龙优势,使其在AI和高性能计算领域保持领先。
在分析英伟达的竞争对手时,帕特尔首先提到了AMD。AMD在芯片方面表现出色,但缺乏软件领域的专业知识和投资。AMD没有自己的GPU集群来开发软件,这限制了他们在系统级设计上的能力和对软件的深入了解。微软和Meta在软件方面给予了AMD一定的帮助,但这并不足以使AMD与英伟达在时间线上保持同步。尽管如此,AMD还是获得了一些市场份额,尤其是在中国市场,不过他预测,AMD在下一年在AI领域的收入将会有所下降。
谷歌的TPU是另一个竞争对手,谷歌的TPU在单个芯片层面上可能并不那么令人印象深刻,但当它们被组合成一个系统时,谷歌的TPU就显得非常有竞争力。谷歌在网络和水冷技术方面的投入也比英伟达更早,这为他们的TPU提供了额外的优势。然而,谷歌的TPU在商业上的成功有限,部分原因是谷歌将其大部分软件保持内部使用,而且谷歌云的定价策略也不够灵活。
至于亚马逊的Trainium,其策略是提供高性价比的产品,Trainium在芯片的使用、内存和网络方面可能不如英伟达的GPU那么高效,但由于其成本效益高,对于某些应用来说仍然是一个不错的选择。亚马逊的Trainium在HBM内存容量和内存带宽方面提供了很好的性价比,使得它在某些情况下成为亚马逊云服务中的一个有吸引力的选择。
在讨论2025年和2026年的行业趋势时,帕特尔认为,如果AI模型继续改进,并且企业继续采用这些技术,那么数据中心的支出将会继续增长。如果模型改进放缓,或者企业采用率低于预期,那么行业增长将会受到影响。他强调,虽然存在不确定性,但目前的迹象表明,至少在2025年之前,数据中心的支出和AI模型的改进将会继续推动行业向前发展。