文章来源:08ai导航网发布时间:2025-08-18 14:43:56
8月15日消息,今天,谷歌推出史上最小Gemma3开源模型,一个拥有2.7亿个参数的轻量级模型,底层设计以特定任务微调为目标,具备强大的指令跟踪和文本能力。
在指令执行能力测试中,如IFEval基准测试所示,Gemma3270M超越了尺寸更大的Qwen2.50.5BInstruct,与Llama3.21B能力比肩。
Gemma3270M在一些特定任务上能达到甚至超越大模型的能力。该模型的尺寸和性能使其非常适合离线、基于网页的创意任务。比如谷歌公布了一个案例,其用Gemma3270M驱动一款使用Transformers.js的睡前故事生成器网页应用,通过简单的勾选就可以生成精彩的睡前故事。
Gemma3270M的核心能力如下:
1、轻量而强大的架构。该模型共有2.7亿个参数,由于词汇量庞大,嵌入参数有1.7亿个,Transformer模块参数有1亿个。得益于256k个token的庞大词汇量,该模型能够处理特定和稀有的token,使其成为可在特定领域和语言中进一步微调的优质基础模型。
2、极致能效。该模型的一大优势在于低功耗,其在Pixel9ProSoC上进行的内部测试表明,INT4量化模型在25次对话中仅消耗0.75%的电量,使其成为谷歌最节能的Gemma模型。
3、指令遵循。该模型同步发布了指令微调版本与预训练检查点(checkpoint)。虽然该模型并非为复杂的对话用例而设计,但其基础指令遵循能力出色,可“开箱即用”地响应通用指令。
4、可用于生产的量化。模型提供量化感知训练(Quantization-AwareTrained,QAT)检查点,支持以INT4精度运行,且性能损失极小,这对于在资源受限设备(如手机、边缘设备)上部署至关重要。
换句话说,如果用户有一个高容量、定义明确的任务,在成本上需要精打细算,又需要快速迭代和部署,或是有保护隐私的需求,他都适合选择Gemma3270M。
HuggingFace地址:https://huggingface.co/collections/google/gemma-3-release-67c6c6f89c4f76621268bb6d
此前,谷歌Gemma开源模型加速迭代:先是适用于单云和桌面加速器的Gemma3和Gemma3QAT发布,随后是将强大实时多模态AI直接引入边缘设备的Gemma3n推出,本次Gemma3270M的推出填补了轻量模型版块。
轻量化模型正在打破参数迷信。大模型领域长期存在“参数规模决定性能”的固有认知,Gemma3270M展现出小模型遵循指令的能力以及微调后的威力。从轻量而强大的模型入手,用户可以构建精简、快速且运行成本显著降低的生产系统。
本文来自微信公众号“”(ID:zhidxcom),作者:李水青,经授权发布。
相关攻略 更多
最新资讯 更多
仅0.27B参数,谷歌开源史上最小Gemma 3,手机能跑,25次对话耗电不到1%
更新时间:2025-08-18
谷歌版小钢炮开源,0.27B大模型,4个注意力头,专为终端而生
更新时间:2025-08-18
史上最大AI基建:OpenAI将豪掷数万亿美元,打造“AI宇宙工厂”
更新时间:2025-08-18
2025世界人形机器人运动会“场景赛”首金出炉,天轶2.0包揽物料整理冠、亚军
更新时间:2025-08-18
首届机器人运动会,是比谁摔得更有观众缘
更新时间:2025-08-18
当AI比我们更聪明:李飞飞和Hinton给出截然相反的生存指南
更新时间:2025-08-18
有望代表未来旅行票务平台趋势:谷歌推出利用自然语言“AI订机票”FlightDeals功能
更新时间:2025-08-18
都想交付,谁真交付?一个问题三个问号
更新时间:2025-08-18
奥特曼神秘晚宴讲话曝出!OpenAI的CEO或将是个AI,Chrome我也想买
更新时间:2025-08-18
谷歌开源Gemma家族最轻量模型Gemma3270M:2.7亿参数可灵活用于手机平板端侧及Web环境
更新时间:2025-08-18