ChatGPT / AI新闻聚合
6 小时前
DeepSeek V4 Flash 可以在 128GB 的 M3 Max 运行,还是 1M 上下文
via
掘金人工智能本月最热
(author: 恋猫de小郭)
Telegraph
DeepSeek V4 Flash 可以在 128GB 的 M3 Max 运行,还是 1M 上下文
最近 Redis 创始人 Antirez 开源了一个项目 ds4,用几千行纯 C 代码把 1M 上下文的 「DeepSeek V4 Flash MoE 模型」,在一台 128GB 内存的 M3 Max MacBook Pro 上完整跑通,同时还能稳定支持 coding agent 循环。 这里的重点是, ds4 不是一个简单的量化操作,而是用「不对称优化」配合「硬件特性深度绑定」来突破「长上下文必须吃掉巨量 GPU/内存”」的限制。 ds4 其实不是通用推理引擎(不像 llama.cpp 或 vLLM),它是专门为…
Home
Tags
免费GPT聊天
Best AI API中转2.8折起
Best AI 服务状态
电报频道
Powered by
BroadcastChannel
&
Sepia
Copyright © 2025 BESTAI. All rights reserved.
BEST AI API中转 - OpenAI DeepSeek Claude Gemini Grok MidJourney API 2.8折起
admin@oaibest.com