华为苏黎世实验室开源新技术,让大模型可在消费级GPU上运行
16 天前 8 阅读来源:TechNode
AI 智能摘要
以下为 AI 对原文的中文摘要,完整内容请点击下方「查看原文」
华为苏黎世计算系统实验室发布开源量化方法SINQ,可将大型语言模型内存需求降低70%,使原需A100等企业级GPU的工作负载能在RTX 4090等消费级显卡运行,精度接近数据校准方法,已在GitHub和Hugging Face免费商用。
这篇文章对你有帮助吗?
觉得有用?分享给更多人
留言 · 0 条
暂无留言,来说两句吧
