海外小作文袭扰AI信仰?GPU泡沫论甚嚣尘上 真相是……

admin admin
6
2024-10-15
  《科创板日报》10月14日讯日前,一则有关“2美元/小时出租H100:GPU泡沫破灭前夜”的报道引发国内市场高度关注。相关文章指出:英伟达H100GPU在2023年3月上市之后,因需求激增供不应求,其租赁价格从最初的每小时4.7美元一度飙升至每小时8美元以上。但今年以来,H100开始“供过...

  《科创板日报》10月14日讯 日前,一则有关“2美元/小时出租H100:GPU泡沫破灭前夜”的报道引发国内市场高度关注。相关文章指出:

海外小作文袭扰AI信仰?GPU泡沫论甚嚣尘上 真相是……

英伟达H100 GPU在2023年3月上市之后,因需求激增供不应求,其租赁价格从最初的每小时4.7美元一度飙升至每小时8美元以上。但今年以来,H100开始“供过于求”,每小时租赁价格降至2美元左右。

价格下跌是由于多方面因素导致:1)有些长期预订H100的公司完成模型训练之后,转售闲置未使用的算力;2)许多公司不再从头训练新模型,转而微调开放模型,算力需求大幅降低;3)专注构建大规模基础模型的新创公司数量大幅减少;4)H100的替代品出现,如AMD和英特尔GPU,等等。

  对这篇报道进行溯源后可以发现,海外主流媒体及主要科技媒体暂未进行相关报道,原报道标题为《$2 H100s: How the GPU Bubble Burst》(2美元H100:GPU泡沫是如何破灭的),来自于一个名为Latent Space的网站,原文作者为Eugene Cheah。

  根据网站介绍,Latent Space主要聚焦于AI,形式集内容讯息、博客、社区为一体,由swyx 及Alessio Fanelli共同主持,前者的社交平台账号并未给出具体身份自我介绍,后者则为早期风投公司Decibel VC的合伙人和CTO。

  原文作者Eugene Cheah,则为初创公司Featherless.Ai的CEO。

  据Cheah在“GPU泡沫”一文原文末尾介绍,Featherless.Ai目前托管着全球最大的开源AI模型,“每月10美元起,可立即访问,无限制请求,价格固定;可通过无服务器方式即时推理,无需昂贵的专用 GPU”。

海外小作文袭扰AI信仰?GPU泡沫论甚嚣尘上 真相是……

  ▌H100租赁价格下跌 = GPU泡沫破灭?

  在“GPU泡沫”一文原文中有张配图,那是法国艺术家让-莱昂•热罗姆在1882年创作的油画《郁金香狂热》(Le Duel à la tulipe)。

  这幅画描绘了有记录以来历史上第一次投机泡沫——17世纪荷兰的“郁金香狂热”,郁金香价格在1634年持续攀升,并于1637年2月崩盘,投机者手中只剩下最初投资额的5%。

  三百多年前的投机泡沫会否再次上演?这个问题牵动着每一位AI投资者的神经,或许也是这一次“H100租赁价格下跌”一文在AI圈引发高度关注的原因。

  从算力租赁商Vast.ai网站报价可以看到,1x H100的一小时租赁报价确实已经在2~3美元区间内。

  但H100租赁价格下跌,真的能和“GPU泡沫破灭”画上等号吗?

海外小作文袭扰AI信仰?GPU泡沫论甚嚣尘上 真相是……

  一方面,从Eugene Cheah的文章来看,“H100价格下跌”可能用“分化”来形容更为合适——持续下降的主要集中在小规模集群的租赁价格,相较之下,大规模算力集群的价格则可能维持在较高水平。

  而这些大规模算力集群背后,多是诸如特斯拉、微软、OpenAI一类的科技巨头。Omidia数据显示,H100发布之后的那个2023年第三季度,其出货量达到65万张,其中仅Meta和微软就分别拿下了15万张,占比接近一半。

  另一方面,电子产品都有着更新迭代周期,GPU芯片同样如此。之前英伟达下一代GPU Blackwell系列传出设计存在缺陷,可能延迟出货。但摩根士丹利上周发布报告称,Blackwell的生产正在“按计划进行”,且未来12个月左右的供应已经售罄,这意味著现在下订单的客户要到2025年底才能收到货,“这将继续推动对现有Hopper架构产品的强劲短期需求”。

  H100租赁价格并非骤然暴跌,波动已有时日。从A100到H100,从H100到H200,再到未来的Blackwell,新品出世势必带来前代产品的没落,更妄论Blackwell算力成本有望比Hopper进一步降低。

  黄仁勋这位英伟达“掌舵人”也在日前现身说法。在接受Altimeter Capital采访时他强调,对英伟达的持续看涨与互联网泡沫顶峰时期围绕思科的狂热完全不同。英伟达正在“重塑计算”,未来将是“高度机器学习”的时代。

  “摩尔定律已经基本宣告终结”,他表示,为了提供必要的算力以跟上未来计算密集型软件的步伐,未来4~5年内,现有数据中心将需要价值约1万亿美元的GPU来实现升级。

  必须承认的是,“AI泡沫”论的警钟敲了又敲,“AI投资回报难达预期”的质疑声音一浪高过一浪,一边是OpenAI抱怨算力上线不及时不够用、英伟达新品售罄,另一边是算力租赁价格不断下降、还有公司“甩卖”GPU。

  但局部、短期的算力过剩或短缺,似乎已难以代表AI的全盘局面,对于供需两方、多空两边来回博弈的AI领域来说,在硬件端之外,或许亟待更多新故事。

其他相关 RELEVANT MATERIAL

华东重机溢价近70倍并购GPU芯片公司 后者员工合计20多人、评估值约2亿元

admin admin
1
2024-10-22
  每经记者赵李南  王晶    每经编辑张海妮      今年10月8日,华东重机(002685.SZ,股价6.13元,市值61.77亿元)公告,其已经完成对厦门锐信图芯科技有限公司(以下简称锐信图芯)的收购,后者被纳入合并报表范围。  华东重机之所以会并购锐信图芯,主要看重后者的GPU......

英伟达GPU平替方案获大单!亚马逊与Databricks签署AI芯片协议

admin admin
8
2024-10-16
  据报道,亚马逊已与Snowflake的竞争对手Databricks签署了一项为期五年的协议,允许这家数据仓库公司使用亚马逊的TrainiumAI芯片。  此次合作主要围绕亚马逊的TrainiumAI芯片展开,该芯片为希望定制或构建人工智能模型的公司提供了英伟达GPU之外的一种更便宜的替代品......

AMD发布新GPU加速卡Instinct MI325X:八卡2TB HBM3E、FP8性能超每秒2亿亿次

admin admin
6
2024-10-11
快科技10月11日美国旧金山现场报道:在AdvancingAI2024大会上,AMD正式发布了新款GPU加速卡“InstinctMI325X”。它在大获成功的MI300X基础上再进一步,主要是增强了HBM内存部分。【硬件规格、性能篇】MI325X配备了多达256GBHBM3E......

AMD举办Advancing AI 2024大会:企业级CPU、GPU大更新 加速AI布局

admin admin
8
2024-10-11
  新浪数码苏航发自美国旧金山    美国旧金山时间10月10日,半导体公司AMD举办“AdvancingAI2024”活动,发布了一系列企业相关的产品,其中包括InstinctMI325XGPU加速器、第五代AMDEPYC服务器处理器,以及RyzenAIPRO300系列处理器等......

超微电脑盘前续涨超3% 公司称每季交付超10万块GPU

admin admin
9
2024-10-08
格隆汇10月8日|昨日大涨近16%的超微电脑(SMCI.US)盘前继续涨超3%。消息上,公司周一发布声明称,由于大型AI工厂建设工程的强烈需求,每季交付带有液化冷却产品(DLC)功能的图像处理器(GPU)数量超过10万块。作为英伟达的核心盟友之一,超微电脑宣布,其新的液冷解决方案将帮助人工智能厂商更......

AI芯片利好!超微电脑称目前一季出货超10万新液冷方案相关GPU,盘中涨近18%

admin admin
9
2024-10-08
  转自:华尔街见闻  超微称,最近为一些有史以来最大的AI工厂以及云服务商部署了超过10万拥有其液体冷却解决方案的GPU,股价此后创七个月最大盘中涨幅。评论称,若这类GPU的均价和英伟达3万美元的芯片相当,可能意味着数十亿美元订单。  一则公司公告带来利好,引爆了热门人工智能(AI)概念股......
年度爆文