本次消息最初由 X 平台用户 @legit_api 爆料:DeepSeek 正在与至少一家推理服务商展开保密级别的内部测试,该模型对外代号为 「Sealion-lite」(海狮轻量版),对应产品序列即为 DeepSeek V4 Lite。
值得注意的是,DeepSeek 以往发布模型向来"悄咪咪上线、不打招呼"——V3.2 几乎毫无预热就突然出现在用户面前。而这次专门引入第三方推理商做 NDA 保密测试,在该公司历史上相对罕见,某种程度上预示着 V4 Lite 的能力已经达到"不得不谨慎对待"的量级。
核心参数解析:两项硬核升级,一步跨代1. 上下文窗口:从 128K 飞跃至 100 万 Token这是最直观的数字冲击。DeepSeek V3.2 的上下文窗口为 128,000 tokens,而 V4 Lite 直接拉升至 1,000,000 tokens(100 万 tokens),相当于整整扩大了近 8 倍。

▲ DeepSeek V4 的 1M Token 上下文:一次性"吃下"整个代码仓库不是梦(图源:WaveSpeed.ai)
100 万 tokens 意味着什么?粗略换算下来,约等于一次性处理 750 本中等篇幅小说、一个中大型 GitHub 代码仓库、或数小时的完整对话记录——AI 在"记性"这件事上,正在以肉眼可见的速度向人类靠拢。
早在今年 2 月 11 日,DeepSeek 曾悄然将生产环境模型的上下文窗口从 128K 升级至 100 万 tokens,社区测试显示其在满额 100 万 token 长度的"大海捞针"检索任务中,准确率超过 60%。而 V4 Lite 将从架构层面原生支持这一规格,而非临时扩容打补丁。
2. 原生多模态:不是"外挂视觉",是"骨子里就能看图"相比上下文的数字跃迁,原生多模态的意义更具革命性。
DeepSeek 的整个 V3 系列,清一色是纯文本模型。此前能看图的"DeepSeek-VL"属于独立模型线,和 V3 系列是两套不同架构。而 V4 Lite 据报道将文本与视觉理解从预训练阶段就统一融合,视觉能力不再是"外挂插件",而是大模型的内置器官。
这一点的重要性在于:原生多模态的文图对齐能力通常远优于拼接方案,模型能更精准地理解"图里在说什么",也能更连贯地生成"符合语义的图像内容"。Gemini 3.1 Pro 和 GPT-5 的实践已经证明,原生多模态是关闭图文性能差距的根本路径。
如果 DeepSeek 真的在开源权重模型中实现这一点,将是中国 AI 实验室在前沿多模态领域的重大突破。
实测曝光:54 行代码画出 Xbox 手柄,碾压竞品在多模态和代码生成能力方面,已有一批早期演示悄然流传。测试人员用 V4 Lite 生成了 「骑自行车的鹈鹕」 和 「Xbox 360 手柄」 的 SVG 图像代码:
•Xbox 360 手柄:仅用 54 行 SVG 代码完成,结构层次清晰,细节准确
•鹈鹕骑自行车:仅用 42 行 SVG 代码,多元素场景构图自然流畅
根据内部对比评估,这两项输出在代码精简度、逻辑组织和视觉还原度上均优于 DeepSeek V3.2、Claude Opus 4.6 以及 Gemini 3.1。

▲ 社区测试截图:DeepSeek 上下文窗口升级为 1M tokens 的第一手记录(图源:Reddit r/LocalLLaMA)
SVG 测试并非全面评估,但它暗示了更深层的能力跃升:空间推理能力与结构化输出能力的同步提升,这两者恰好是多模态任务中至关重要的底层能力。
技术参数对比一览规格项DeepSeek V3.2DeepSeek V4 Lite(泄露)上下文窗口128K tokens100 万 tokens(原生)多模态支持❌ 纯文本✅ 原生多模态参数规模(估算)~6850 亿(MoE)~2000 亿(未确认)SVG 代码生成基准水平超越 V3.2 / Claude Opus 4.6 / Gemini 3.1发布状态已上线NDA 保密测试中
📌 注:V4 Lite 约 2000 亿参数的估算来自 36kr 消息,未经官方确认。相比之下,传闻中的完整版 V4 参数量可能突破 1 万亿。
冷静一下:哪些事还不确定?DeepSeek 官方目前对 V4 Lite 保持完全沉默,"sealion-lite"代号也未出现在任何官方文档或代码仓库中。需要特别说明:
•SVG 是窄测试项,不能代表推理、多步骤编程等核心能力的全貌;
•参数量约 2000 亿仍属猜测,"轻量版"意味着某处有取舍,取舍在哪里尚不明朗;
•CNBC 已发出警告:DeepSeek 一旦正式发布新模型,可能触发类似 V3 发布时纳斯达克 3% 单日跌幅的市场反应,华尔街正屏息以待。
AITOP100小编写在最后:DeepSeek 的剧本,总是比想象的更快回顾规律不难发现:DeepSeek 惯用的打法是"悄悄憋大招、突然震全场"。每一次,都是外界刚刚消化完上一代模型,下一代就已经悄悄跑完内测了。
这次的 V4 Lite,百万 Token 长上下文 + 原生多模态两张牌同时打出,若后续全面测试能验证泄露说法,它将成为 2026 年迄今最具冲击力的开源模型发布——不仅对 OpenAI、Anthropic、Google 构成直接威胁,也将为整个开源 AI 生态注入强心剂。
海狮入海,浪花几何?我们拭目以待。
AITOP100-AI资讯频道将持续关注AI行业新闻资讯消息,带来最新AI内容讯息。
想了解AITOP100平台其它版块的内容,请点击下方超链接查看
AI创作大赛 | AI活动 | AI工具集 | AI资讯专区 | AI小说
AITOP100平台官方交流社群二维码:

