文章来源:万象ai发布时间:2025-08-05 15:47:44
字节跳动开源了一个口碑还不错的模型——BAGEL (ByteDance Agnostic Generation and Empathetic Language model), 一个统一多模态基础模型。啥叫“统一”?一个模型就能同时理解和生成文本、图像、视频!
前几天部署测试了下,总体感觉,本地跑多模态大模型的希望之光!毕竟可以像4o一样模型对话来编辑图片。但是呢,效果时好时坏,有时非常好,有时惨不忍睹。 不过,像图片、视频这一类的产品、模型,体验跟使用的人也关系比较大~
今天做了一个简单的小教程,给家人们分享一下。
BAGEL-7B-MoT版本总参数140亿,实际干活的活跃参数70亿。满血版运行起来大概占用30G的显存。
统一大模型对咱们的优势是,一个模型可以同时对比Qwen2.5的图片理解能力、SD3,Flux的图片生成能力、Gemini的图片编辑能力。
体验Demo在这里:https://huggingface.co/spaces/ByteDance-Seed/BAGEL
模型地址在这里:https://huggingface.co/ByteDance-Seed/BAGEL-7B-MoT
这里简单贴2个例子,最后介绍下如何安装使用把。
转换风格,不在话下!
图片编辑也还不错。
安装依赖
git clone https://github.com/bytedance-seed/BAGEL.git
cd BAGEL
pip install -r requirements.txt
把模型下载下来
from huggingface_hub import snapshot_download
save_dir = "/path/to/save/BAGEL-7B-MoT"
repo_id = "ByteDance-Seed/BAGEL-7B-MoT"
cache_dir = save_dir + "/cache"
snapshot_download(cache_dir=cache_dir,
local_dir=save_dir,
repo_id=repo_id,
local_dir_use_symlinks=False,
resume_download=True,
allow_patterns=["*.json", "*.safetensors", "*.bin", "*.py", "*.md", "*.txt"],)
这个代码直接命令行输python,之后执行。
然后python -u app.py即可启动webui,会自动跳转打开,然后就可以自己测试玩了。
相关攻略 更多
最新资讯 更多
字节开源了一个了不得的模型!
更新时间:2025-08-05
专治AI生图「人脸崩坏」,8倍速碾压GPT!新版FLUX.1多方位刷新SOTA
更新时间:2025-08-05
600亿AI算力龙头,冲刺港交所
更新时间:2025-08-05
Perplexity将Agent接入搜索,一个框解决你所有需求,实现了百度16年前的框计算概念?
更新时间:2025-08-05
AI医疗战火升级!Agent爆发,大三甲争相引入,医疗系统新一轮变革!
更新时间:2025-08-05
速递|a16z计划以53亿美金估值投资一款AI笔记软件
更新时间:2025-08-05
Claude4核心成员:2027年,AI将自动化几乎所有白领工作|万字对谈
更新时间:2025-08-05
AI+生物知识图谱,加速功效成分开发
更新时间:2025-08-05
250美元起售,还开源,HuggingFace发布史上最亲民人形机器人
更新时间:2025-08-05
阿里通义灵码上线,国服三大玩家集结AI编程,围剿美国Cursor,打得过吗?
更新时间:2025-08-05