首页 > AI教程资讯

速递|2.15亿美金豪赌AI瘦身术!Multiverse压缩LLM尺寸95%,让Llama在树莓派上狂奔

文章来源:万象ai发布时间:2025-07-30 14:00:39

图片来源:Multiverse Computing

西班牙初创公司Multiverse Computing 于 6 月 12 日宣布 ,凭借其名为"CompactifAI"的技术优势,已完成1.89亿欧元(约合2.15亿美元)的巨额B轮融资。

本轮B轮融资由Bullhound Capital领投,该机构曾投资过Spotify、Revolut、Delivery Hero、Avito和Discord等企业。参与此轮融资的还包括惠普科技风投(HP Tech Ventures)、SETT、Forgepoint Capital International、CDP Venture Capital、Santander Climate VC、东芝(Toshiba)以及巴斯克风险投资集团(Capital Riesgo de Euskadi - Grupo SPR)。

Multiverse公司表示,其拥有160项专利和全球100家客户,包括西班牙电力公司Iberdrola、博世集团(Bosch)和加拿大银行(Bank of Canada)。通过此轮融资,该公司迄今已筹集约2.5亿美元资金。

CompactifAI是一种受量子计算启发的压缩技术,该公司表示该技术能将LLMs的尺寸缩减高达95%,同时不影响模型性能。

具体而言,Multiverse提供知名开源LLMs的压缩版本——主要是小型模型——如Llama 4 Scout、Llama 3.3 70B、Llama 3.1 8B和Mistral Small 3.1。

该公司计划很快发布DeepSeek R1的压缩版本,并表示正在开发更多开源和推理模型。OpenAI等公司的专有模型不受支持。这些被公司称为"瘦身版"的模型可通过亚马逊云服务获取,或授权用于本地部署。

该公司表示其模型速度比未压缩版本快4到12倍,推理成本可降低50%至80%。例如Multiverse称 ,其Llama 4 Scout Slim版在AWS上每百万token成本为10美分,而原版Llama 4 Scout需14美分。

Multiverse宣称其部分模型可被压缩得极其小巧且节能,甚至能在个人电脑、手机、汽车、无人机上运行,连DIY爱好者最爱的微型电脑树莓派(Raspberry Pi)也能驾驭。(我们不禁想象那些充满创意的树莓派圣诞灯饰屋,如今升级成了搭载LLM驱动的互动式会说话的圣诞老人。)

Multiverse背后有着强大的技术支撑。其联合创始人兼首席技术官Román Orús是西班牙圣塞巴斯蒂安多诺斯蒂亚国际物理中心的教授,以张量网络领域的开创性研究闻名(注意不要与谷歌旗下所有冠名"Tensor"的AI项目混淆)。

张量网络是一种模拟量子计算机、但能在普通计算机上运行的计算工具。如今其主要用途之一便是压缩深度学习模型。

另一位联合创始人兼CEO 的Enrique Lizaso Olmos同样拥有多个数学学位,曾任大学教授。其职业生涯大部分时间投身银行业,最为人熟知的身份是西班牙Unnim Banc银行前副首席执行官。