晚上的千问3.5才是王炸。通过架构创新,"混合注意力+极致稀疏MoE",Qwen3.5速度10倍提升、成本90%下降。 意味着让800亿参数大模型能在消费级硬件上运行。(GPT4级别的代码能在一台MacBook跑) 另外,DeepSeek V4基准测试泄露,疑似明天发布,在SWE-bench Verified上取得了惊人的83.7%,超过了Claude Opus 4.5(80.9%)和GPT-5.2(80%)。 2月的AI模型大战,带来的是?缺算力?上游材料涨价?

晚上的千问3.5才是王炸。通过架构创新,"混合注意力+极致稀疏MoE",Qwen3.5速度10倍提升、成本90%下降。 意味着让800亿参数大模型能在消费级硬件上运行。(GPT4级别的代码能在一台MacBook跑) 另外,DeepSeek V4基准测试泄露,疑似明天发布,在SWE-bench Verified上取得了惊人的83.7%,超过了Claude Opus 4.5(80.9%)和GPT-5.2(80%)。 2月的AI模型大战,带来的是?缺算力?上游材料涨价?
