
上周,谷歌在官网上展示的AI内存压缩技术“TurboQuant”,宣称可将大语言模型(LLM)推理中的缓存内存占用压缩至六分之一,并在英伟达H100 GPU上实现最高8倍的性能加速。市场或将其解读为AI对内存的需求将出现下降。 其次,供需关系发生变动,消费级产品的市场供给回升。 “内存市场此前经历了前所未有的供需失衡。”基础云数据中心服务商——上海沐高网络科技有限公司技术负责人卞峥嵘向上证报记
当前文章:http://0ll1g.k5v.cc/jtsf/h0p2.htm
发布时间:01:32:07

