DeepSeek「海狮」出没！V4 Lite百万Token上下文 + 原生多模态，AI圈又要地震了？

本次消息最初由 X 平台用户 @legit_api 爆料：DeepSeek 正在与至少一家推理服务商展开保密级别的内部测试，该模型对外代号为「Sealion-lite」（海狮轻量版），对应产品序列即为 DeepSeek V4 Lite。

值得注意的是，DeepSeek 以往发布模型向来"悄咪咪上线、不打招呼"——V3.2 几乎毫无预热就突然出现在用户面前。而这次专门引入第三方推理商做 NDA 保密测试，在该公司历史上相对罕见，某种程度上预示着 V4 Lite 的能力已经达到"不得不谨慎对待"的量级。

核心参数解析：两项硬核升级，一步跨代1. 上下文窗口：从 128K 飞跃至 100 万 Token

这是最直观的数字冲击。DeepSeek V3.2 的上下文窗口为 128,000 tokens，而 V4 Lite 直接拉升至 1,000,000 tokens（100 万 tokens），相当于整整扩大了近 8 倍。

▲ DeepSeek V4 的 1M Token 上下文：一次性"吃下"整个代码仓库不是梦（图源：WaveSpeed.ai）

100 万 tokens 意味着什么？粗略换算下来，约等于一次性处理 750 本中等篇幅小说、一个中大型 GitHub 代码仓库、或数小时的完整对话记录——AI 在"记性"这件事上，正在以肉眼可见的速度向人类靠拢。

早在今年 2 月 11 日，DeepSeek 曾悄然将生产环境模型的上下文窗口从 128K 升级至 100 万 tokens，社区测试显示其在满额 100 万 token 长度的"大海捞针"检索任务中，准确率超过 60%。而 V4 Lite 将从架构层面原生支持这一规格，而非临时扩容打补丁。

2. 原生多模态：不是"外挂视觉"，是"骨子里就能看图"

相比上下文的数字跃迁，原生多模态的意义更具革命性。

DeepSeek 的整个 V3 系列，清一色是纯文本模型。此前能看图的"DeepSeek-VL"属于独立模型线，和 V3 系列是两套不同架构。而 V4 Lite 据报道将文本与视觉理解从预训练阶段就统一融合，视觉能力不再是"外挂插件"，而是大模型的内置器官。

这一点的重要性在于：原生多模态的文图对齐能力通常远优于拼接方案，模型能更精准地理解"图里在说什么"，也能更连贯地生成"符合语义的图像内容"。Gemini 3.1 Pro 和 GPT-5 的实践已经证明，原生多模态是关闭图文性能差距的根本路径。

如果 DeepSeek 真的在开源权重模型中实现这一点，将是中国 AI 实验室在前沿多模态领域的重大突破。

实测曝光：54 行代码画出 Xbox 手柄，碾压竞品

在多模态和代码生成能力方面，已有一批早期演示悄然流传。测试人员用 V4 Lite 生成了「骑自行车的鹈鹕」和「Xbox 360 手柄」的 SVG 图像代码：

•Xbox 360 手柄：仅用 54 行 SVG 代码完成，结构层次清晰，细节准确

•鹈鹕骑自行车：仅用 42 行 SVG 代码，多元素场景构图自然流畅

根据内部对比评估，这两项输出在代码精简度、逻辑组织和视觉还原度上均优于 DeepSeek V3.2、Claude Opus 4.6 以及 Gemini 3.1。

▲ 社区测试截图：DeepSeek 上下文窗口升级为 1M tokens 的第一手记录（图源：Reddit r/LocalLLaMA）

SVG 测试并非全面评估，但它暗示了更深层的能力跃升：空间推理能力与结构化输出能力的同步提升，这两者恰好是多模态任务中至关重要的底层能力。

技术参数对比一览

规格项DeepSeek V3.2DeepSeek V4 Lite（泄露）上下文窗口128K tokens100 万 tokens（原生）多模态支持❌ 纯文本✅ 原生多模态参数规模（估算）~6850 亿（MoE）~2000 亿（未确认）SVG 代码生成基准水平超越 V3.2 / Claude Opus 4.6 / Gemini 3.1发布状态已上线NDA 保密测试中

📌 注：V4 Lite 约 2000 亿参数的估算来自 36kr 消息，未经官方确认。相比之下，传闻中的完整版 V4 参数量可能突破 1 万亿。

冷静一下：哪些事还不确定？

DeepSeek 官方目前对 V4 Lite 保持完全沉默，"sealion-lite"代号也未出现在任何官方文档或代码仓库中。需要特别说明：

•SVG 是窄测试项，不能代表推理、多步骤编程等核心能力的全貌；

•参数量约 2000 亿仍属猜测，"轻量版"意味着某处有取舍，取舍在哪里尚不明朗；

•CNBC 已发出警告：DeepSeek 一旦正式发布新模型，可能触发类似 V3 发布时纳斯达克 3% 单日跌幅的市场反应，华尔街正屏息以待。

AITOP100小编写在最后：DeepSeek 的剧本，总是比想象的更快

回顾规律不难发现：DeepSeek 惯用的打法是"悄悄憋大招、突然震全场"。每一次，都是外界刚刚消化完上一代模型，下一代就已经悄悄跑完内测了。

这次的 V4 Lite，百万 Token 长上下文 + 原生多模态两张牌同时打出，若后续全面测试能验证泄露说法，它将成为 2026 年迄今最具冲击力的开源模型发布——不仅对 OpenAI、Anthropic、Google 构成直接威胁，也将为整个开源 AI 生态注入强心剂。

海狮入海，浪花几何？我们拭目以待。

AITOP100-AI资讯频道将持续关注AI行业新闻资讯消息，带来最新AI内容讯息。

想了解AITOP100平台其它版块的内容，请点击下方超链接查看

AI创作大赛 | AI活动 | AI工具集 | AI资讯专区 | AI小说

AITOP100平台官方交流社群二维码：

云霞资讯网

DeepSeek「海狮」出没！V4 Lite百万Token上下文 + 原生多模态，AI圈又要地震了？

热门分类