文章来源:万象ai发布时间:2025-03-07 10:11:09
这边GPT4.5刚发布,这边DeepSeek开源周进入到第五天开源的项目,最后一天的开源项目是:3FS(Fire-Flyer File System)。
3FS(Fire-Flyer File System)是DeepSeek自研的高性能分布式文件系统,专为解决ai训练和推理工作负载的挑战而设计。

高性能:
利用现代SSD和RDMA网络,提供高吞吐量和低延迟的数据访问。
结合数千个SSD的吞吐量和数百个存储节点的网络带宽,使应用能够以无关地域的方式访问存储资源。
强一致性:
通过实现链式复制与分配查询(CRAQ),确保强一致性,使得应用代码更简洁且易于推理。
文件接口:
采用无状态元数据服务,背后支持事务型键值存储(如FoundationDB)。
熟悉的文件接口,无需学习新的存储API。
多样化工作负载支持:
数据准备:将数据分析管道的输出组织成层次化目录结构,有效管理大量中间输出。
数据加载器:通过支持跨计算节点随机访问训练样本,消除预读取或数据洗牌的需求。
检查点:支持大规模训练的高吞吐量并行检查点。
推理KV缓存:提供一种基于成本效益的替代方案,替代DRAM缓存,提供更高吞吐量并大大提高容量。
存算分离:
数据存储服务与计算节点分离,专门用于存储模型训练需要用到的样本数据。
每个存储服务节点有16张各15TB的SSD硬盘和2张高速网卡,读取性能强劲,网络带宽强大,读写带宽:7.0TB/秒。
自研通信工具:
如hfreduce,优化多卡并行通信,替代英伟达的NCCL,减少PCIe流量和计算开销。
专用数据格式FFRecord:
通过合并多个小文件,减少了训练时打开大量小文件的开销。
通过样本文件的偏移量提升随机批量读取性能。
AI训练和推理:
3FS专为AI训练和推理工作负载设计,能够显著提升这些任务的效率。
通过高性能和强一致性,3FS支持大规模模型训练和高吞吐量推理。
数据准备和加载:
3FS的数据准备和加载器功能使得处理大量数据变得更加高效,减少了预读取和数据洗牌的需求。
检查点和推理缓存:
3FS支持高吞吐量的并行检查点,确保训练过程的稳定性和容错性。
推理KV缓存提供了基于成本效益的替代方案,提高了推理吞吐量和容量。
安装和配置:
3FS可以通过GitHub上的开源项目进行安装和配置。
数据格式转换:
使用FFRecord格式进行数据存储和加载,需要将样本数据转换成FFRecord格式。
提供了FFRecord转换工具,方便用户进行数据格式转换。
与PyTorch集成:
3FS适配了PyTorch的Dataset和Dataloader接口,可以非常方便地加载数据并发起训练。
GitHub项目地址:https://github.com/deepseek-ai/3FS
第一天:FlashMLA,针对NVIDIA Hopper GPU的高效解码内核,优化了多头潜在注意力(MLA)的性能,显著提升了AI工具在内容创作中的响应速度。
第二天:DeepeEP,首个用于混合专家模型(MoE)训练和推理的开源通信库,优化了大规模分布式训练的通信效率,降低了延迟。
第三天:DeepGEMM,支持稠密和MoE模型的FP8计算库,专为NVIDIA Hopper架构GPU设计,显著提高了计算效率和硬件利用率。
第四天:DualPipe,一种双向流水线并行算法,旨在优化V3/R1模型训练中的计算和通信重叠。EPLB,一个专家并行负载均衡器,专门用于解决大规模AI模型中专家并行任务的负载不均衡问题。
上一篇: 文生图模型Ideogram 2A:更快的生成速度和更低的成本
Ideogram 2a是什么?Ideogram 2a是Ideogram团队推出的最新一代AI文生图模型,专注于提供快速、高性价比的图像生成服务,特别适用于平面设计。
下一篇: FLUX 全生态讲解丨Lora与Controlnet工作流搭建丨玩FLUX看这篇就够了!
本次视频主要介绍了FLUX生态系统的各个方面,包括模型的安装和使用方法,FLUX的功能,工作流的搭建,以及Lora和ControlNet的整合。视频通过详细的讲解和示例,展示了FLUX在图像生成和处理方面的多样性和高效性。观众评论反映了对视频内容的认可,认为视频帮助他们更好地理解和应用FLUX的技术。
相关攻略 更多
OpenAI底层AGI技术被曝光!前研究主管豪言:从此再无新范式
爆款AI视频越来越多,但本质我觉得跟炒股没区别。
Cursor+Claude的SVG图片生成功能,强到离谱,强烈建议写PPT没思路的时候买个会员
超20万人使用!最强开源浏览器Workflow插件【内置3300+模版】效率又起飞了~
营销获客AI公司Clay,花7年找到PMF后,快速实现10倍增长的秘密
5天连发5个王炸!MiniMax这波发布周把OpenAI都整懵了|MiniMax发布周回顾
AI应用行业全景洞察丨中国丨2025年5月丨万字诚作丨Xsignal
数字疗法AI医疗独角兽SwordHealth再融4000万,估值冲至40亿美元背后的战略棋局
最新资讯 更多
OpenAI底层AGI技术被曝光!前研究主管豪言:从此再无新范式
更新时间:2025-07-25
爆款AI视频越来越多,但本质我觉得跟炒股没区别。
更新时间:2025-07-25
Cursor+Claude的SVG图片生成功能,强到离谱,强烈建议写PPT没思路的时候买个会员
更新时间:2025-07-25
超20万人使用!最强开源浏览器Workflow插件【内置3300+模版】效率又起飞了~
更新时间:2025-07-25
营销获客AI公司Clay,花7年找到PMF后,快速实现10倍增长的秘密
更新时间:2025-07-25
5天连发5个王炸!MiniMax这波发布周把OpenAI都整懵了|MiniMax发布周回顾
更新时间:2025-07-25
AI应用行业全景洞察丨中国丨2025年5月丨万字诚作丨Xsignal
更新时间:2025-07-25
数字疗法AI医疗独角兽SwordHealth再融4000万,估值冲至40亿美元背后的战略棋局
更新时间:2025-07-25
宁德时代领投,「银河通用」完成超10亿元新一轮融资
更新时间:2025-07-25
【译】万字长文解读:生成式AI的21个设计模式、示例及应用策略
更新时间:2025-07-25