文章来源:08ai导航网发布时间:2025-08-07 16:47:49
8月6日消息,OpenAI当地时间昨日以Apache2.0许可证的形式推出了两款gpt-oss系列开放推理模型,其中参数规模较小的gpt-oss-20b模型可在仅配备16GB内存的边缘设备上运行、参数更多的gpt-oss-120b则能在单个80GBGPU上高效运行。
AMD与高通均宣布旗下硬件支持gpt-oss系列开放模型,具体是AMD锐龙AIMax+395处理器支持gpt-oss-120b、AMDRadeonRX907016GB显卡支持gpt-oss-20b、高通旗舰骁龙平台支持gpt-oss-20b。
AMD宣称锐龙AIMax+395是全球首款能运行gpt-oss-120b模型的消费级AIPC处理器:采用GGML框架转换的MXFP4格式gpt-oss-120b大约需要61GB显存,而"StrixHalo"平台在128GB统一内存下支持将96GB分配给GPU,轻松满足这一需求。
锐龙AIMax+395在gpt-oss-120b上有30Token/s的输出速率,同时支持该模型的MCP模型上下文协议实现。
而RadeonRX907016GB显卡则能在gpt-oss-20b上实现出色的首Token输出时间(TTFT)和每秒Token输出数量表现。
高通表示根据早期测试gpt-oss-20b可在端侧实现出色思维链推理表现,开发者可通过HuggingFace和Ollama等热门平台在搭载骁龙芯片的设备上访问gpt-oss-20b模型并充分发挥其功能。
相关攻略 更多
最新资讯 更多
AMD、高通宣布旗下硬件支持OpenAIgpt-oss开放推理模型
更新时间:2025-08-07
都说这个地级市,宜居宜业宜AI
更新时间:2025-08-07
摩尔线程:MUSA成功适配llama.cpp,直通全球AI生态圈
更新时间:2025-08-07
突破AI行业高质量数据缺乏的瓶颈,Surge AI营收超10亿美元
更新时间:2025-08-07
AMD二季度收入77亿美元,美国对华芯片禁令导致数据中心营收不及预期
更新时间:2025-08-07
思科确认数据泄露:黑客利用AI语音钓鱼攻破防线
更新时间:2025-08-07
智元机器人A股朋友圈扩容:上纬新材股价暴涨15倍后跌停,蓝思科技交付整机数百台
更新时间:2025-08-07
在这场中美AI竞赛中,我们的互联网大厂正在迅速边缘化
更新时间:2025-08-07
OpenAI以1美元价格向美国政府提供ChatGPT企业版服务
更新时间:2025-08-07
美国不甘落后!启动ATOM计划:直指中国“千问”开源AI领先地位
更新时间:2025-08-07