据该银行表示,AI仍然对宏观经济不确定性保持韧性,美国主要科技公司重申了资本支出(capex)计划,并强调计算需求继续超过供应。
瑞银认为,推理——即运行AI模型生成答案的过程——将成为未来AI计算需求的主要驱动力,超过训练。
由于智能代理AI和推理能力的发展,我们需要的计算量轻松比去年同期预计的多出100倍,Nvidia(NASDAQ:NVDA)首席执行官黄仁勋在瑞银的一份报告中表示。
该银行呼应了这一观点,指出思维链(Chain of Thought,CoT)推理等更复杂方法的出现是计算强度增长的关键来源。
在其预测中,瑞银列出了四类生成式AI用例:聊天机器人、企业AI、智能代理AI和物理AI。
像ChatGPT这样的聊天机器人的计算需求预计将从2024年的10 exaFLOP/s增长到2030年的200 exaFLOP/s。
对于欺诈检测和合同摘要等企业应用,推理需求预计将增长得更快——在同一时期从15增长到440 exaFLOP/s。
最显著的增长预计来自智能代理AI,包括自主客户支持和工作流自动化。瑞银估计,到2030年,这一领域的需求可能攀升至14 zettaFLOP/s,这将是与今天的需求相比的巨大飞跃,我们估计目前的需求在数百exaFLOP/s范围内,该公司在报告中表示。
物理AI,包括机器人和自动驾驶汽车,随着其发展到复制人类认知的某些方面,最终可能需要yottaFLOP/s范围的计算能力。
目前安装的GPU计算能力估计约为4,000 exaFLOP/s(加上Google(NASDAQ:GOOGL)的张量处理单元(TPUs)后达到5,000),但瑞银指出,其中大部分仍未被充分利用。
GPU内存瓶颈等限制意味着实际使用率通常低于名义潜力,这使得当前基础设施不太可能满足未来需求,尤其是智能代理和物理AI的需求。
推理通常受到GPU内存的限制,这意味着芯片能够提供的实际FLOP/s远低于其理论最大值——内存限制导致芯片运行时仅达到其名义FLOP/s的25%左右,报告解释道。
即使有这些限制,可用容量可能足以满足当前聊天机器人的需求,但远低于智能代理和物理AI所需的水平,后者将需要不同数量级的计算能力,报告补充道。
总的来说,瑞银得出结论,推理在AI采用中的扩大作用,加上不断增长的硬件需求,支持继续投资AI基础设施。
对于投资者,该银行认为与我们的’AI’和’电力与资源’选择相关的股票出现任何回调都是具有吸引力的入场点。