标签: deepseek
DeepSeek新「模型」浮出水面
2025年1月20日晚间时间,当DeepSeek-R1满周岁之际,代码库里悄悄浮出了一个陌生的名字:"MODEL1。这个此前从未公开亮相的模型标识符,在DeepSeek更新的FlashMLA代码中被发现了多达28处引用,跨越114个文件。这套藏在代码层面的...
DeepSeek新模型MODEL1曝光,性能将超越V3.2?
就在大家忙着抢春节车票时,DeepSeek的GitHub仓库悄悄更新了114个代码文件。眼尖的开发者发现,28处出现了神秘的"MODEL1"标识,这个从未公开的模型代号瞬间引爆技术圈。从代码对比来看,MODEL1和现在的V3.2像是两个完全不同的...
DeepSeek新模型MODEL1曝光,三大技术突破提前解密
想了解DeepSeek下一代AI模型的真实实力?GitHub代码库的意外更新泄露了关键线索。在FlashMLA优化库的114个文件中,28处代码明确标注着与现有V3.2架构完全平行的"MODEL1"标识,这个神秘代号背后藏着三项颠覆性技术革新。KV缓存...
曝DeepSeek新模型Model1:疑似“高效推理模型”
直播吧1月21日讯DeepSeek于官方GitHub仓库更新了一系列FlashMLA代码,在这些更新中,一个名为“Model1”的模型引起了广泛关注。据悉,目前这个还很神秘的Model1不仅出现在了代码与注释中,甚至还有与DeepSeek-V3.2并驾齐驱的...
DeepSeek一周年:从爆红到深耕,中国AI的破局之路
2025年1月27日,DeepSeek横空出世,以黑马之姿在全球AI领域掀起巨浪。大洋彼岸下载量超越ChatGPT,上线首周累计下载量超1.1亿次,周活跃用户规模最高近9700万,这些数据见证了它的爆红。如今,DeepSeek迎来一周年,它究竟怎么...
DeepSeek新模型曝光:将具备更强的写代码能力!
DeepSeek V4新模型近期悄然曝光,核心亮点直指写代码能力的跨越式提升。这场升级绝非行业常见的参数堆砌噱头,而是精准瞄准开发者实际痛点的迭代,跳出“参数越高越强”的内卷怪圈,把重心放在代码落地效率与实用适配性上,...
机器人将再度上春晚,能否迎来它的“deepseek 时刻”
蛇年春晚的华丽演出,是否就意味着机器人迎来了颠覆性的“DeepSeek时刻”?答案是:我们听见了响亮的脚步声,春天就在门外,但门还没完全推开。说曙光就在不远处,是因为我们已经看到了惊人的进步。机器人现在能跳舞、能空翻、...
租了8张H100,他成功复现了DeepSeek的mHC,结果比官方报告更炸裂
元旦期间,DeepSeek 发布的 mHC 震撼了整个 AI 社区。简单来说,DeepSeek 提出的 mHC 通过将传统 Transformer 的单一残差流扩展为多流并行架构,并利用 Sinkhorn-Knopp 算法将连接矩阵约束在双拟随机矩阵流形上,成功解决了超...
DeepSeek近几日把硅谷那帮精英搞得坐立难安,结果马斯克跟着就补了一刀狠的。
DeepSeek近几日把硅谷那帮精英搞得坐立难安,结果马斯克跟着就补了一刀狠的。老马这话说的太透了:“东方大国根本不是在崛起,人家那是恢复出厂设置!”这话听着扎心却全是事实。想想1750年那会儿,咱们工业产值占了全球32.8%,那时候欧洲加起来都不够咱打的。再加上历史上那300项重大发明,咱一家就占了173项,这份家底确实厚实。现在的DeepSeek不就是最好的例子吗?不到200人的团队,用这点经费硬是跟GPT掰手腕,还差点把桌子掀了。说白了,这就不是什么逆袭剧本。马斯克也就是看清了这一点:聪明人还是那波聪明人,咱们不过是拿回属于自己的位置罢了。大家对此有什么看法?欢迎讨论留言
【DeepSeek梁文锋戳破中美AI差距真相:不是差两年,是地基与装修的区别】
【DeepSeek梁文锋戳破中美AI差距真相:不是差两年,是地基与装修的区别】DeepSeek公司创始人梁文锋在2025年12月接受《暗涌》专访时的一番话,戳破了很多人对中美AI差距的误解。面对“中美AI只差一两年”的说法,他直言这是外行话,“真实的差距是原创和模仿之差,如果这个不改变,中国永远只能是追随者”。这话精准点透了核心:美国搭建了AI的底层地基与框架,从Transformer架构到顶尖算力芯片,从原创算法到基础模型的底层逻辑,都是自主构建;我们更多是在这个基础上“装修”——优化应用场景、降低训练成本、适配本土需求,却没触及最核心的原创突破。梁文锋在采访中透露,国内最好的模型在结构和训练动力学上,与国外先进水平仍有两代差距,要多消耗4倍算力才能达到同等效果。这和多位行业专家的判断不谋而合:中美AI核心差距3-5代、8-10年,短期追赶难以抹平。但承认差距≠自暴自弃,中国早已找到“另辟蹊径”的破局之路,两大优势尤为突出。一是应用落地能力全球领先。就像互联网发端于美国,却在中国绽放出最丰富生态一样,AI领域也在重演这一逻辑。DeepSeek的R1模型开源后,不仅登顶中美苹果应用商店免费榜,还被非洲开发者用来搭建农业病害诊断系统;北大团队基于它开发的“AI数学教练”,让学生解题效率提升40%;义乌商家靠AI用10分钟生成多语种带货视频,把小商品卖到全球。从政务智能响应到工业降本增效,我们把技术转化为实际价值的能力,放眼全球都难逢对手。二是我国在能源方面的优势成为关键底气。马斯克早有预判:中国AI若想超越美国,能源可能是核心变量。AI训练需要海量算力,而算力的背后是电力支撑——中国在清洁能源、基础设施建设上的积淀,为大模型研发提供低成本、高稳定的能源保障。就像DeepSeek用2048张性能受限的H800芯片,通过技术优化把V3模型训练成本压到美国同类模型的二十分之一,背后离不开能源与效率的双重支撑。更值得我国国人骄傲的是,我们已开始向原创突破发力。梁文锋团队不仅发表技术论文突破GPU内存限制,还开源了MLA架构,成为首个登上《自然》年度十大科学人物的中国AI研究者,让硅谷都为之侧目。美国强在“地基扎实”,我们胜在“落地生根+能源托底”。AI的终极价值要回归产业、服务生活,而中国有超大规模市场、完整产业链和旺盛需求,这些都是将优势转化为胜势的底气。与其纠结于在别人的赛道上追赶,不如在应用创新、能源赋能乃至我国具有优势的其它新赛道上跑出加速度!你觉得中国AI赶超美国,还有哪些关键突破口?欢迎在评论区聊聊~
从DSA到Engram,一年来DeepSeek层层勾勒V4架构创新
春节临近,DeepSeek-V4的猜测正在AI圈子里发酵。但与其纠结发布日期,不如回溯这家中国AI实验室过去一年留下的技术线索。从DSA到Engram,从mHC到Janus Pro,这些看似晦涩的缩写词,正在拼凑出一幅清晰的画面:当美国同行用更多...
DeepSeek放大招!百万年薪“抢人”AI江湖再掀风暴
2026年开年,AI圈最炸裂的消息莫过于 DeepSeek 的“抢人大战”—这家以技术狂飙著称的AI独角兽,正以 百万年薪、零经验门槛、全球顶尖资源 为筹码,掀起一场席卷全球的人才争夺战。从应届生到顶尖科学家,从算法工程师到产品...
DeepSeek联合北大提出Engram记忆机制,革新大模型架构
2026年1月12日深夜,DeepSeek团队联合北京大学发布了一篇署名创始人梁文锋的重磅论文,提出名为“Engram”的条件记忆机制,通过“查算分离”架构打破大模型传统范式,引发行业对下一代AI技术路线的高度聚焦。一、核心创新:...
梁文锋署名DeepSeek新论文,“突破GPU内存限制”
[文/观察者网熊超然]1月12日晚间,中国人工智能(AI)初创公司DeepSeek创始人梁文锋与北京大学研究人员共同署名发表了一篇技术论文,提出了一种新的模型训练技术。他们表示,该技术可以通过绕过图形处理单元(GPU)内存限制,...
DeepSeek-OCR是长文本理解未来方向?中科院VTCBench给出答案
DeepSeek-OCR 的视觉文本压缩(VTC)技术通过将文本编码为视觉 Token,实现高达 10 倍的压缩率,大幅降低大模型处理长文本的成本。但是,视觉语言模型能否理解压缩后的高密度信息?中科院自动化所等推出 VTCBench 基准测试,...
一年后,DeepSeek-R1的每token成本降到了原来的1/32
DeepSeek-R1是在2025年1月20日发布的开源推理大模型,它拥有6710亿参数、单Token激活参数为370亿,并采用了MoE架构,训练效率得到了显著提升。R1在去年的推出震动了全球AI领域,其高效率的模型架构、训练方法、工程优化和蒸馏...
Deepseek表示,新方法可以更高效、更便宜地训练人工智能。据报道,
Deepseek表示,新方法可以更高效、更便宜地训练人工智能。据报道,中国人工智能公司Deepseek推出了一种新的训练方法——流形约束超连接(mHC),这将使更高效、更低成本地训练大型语言模型成为可能。该方法是所谓的HyperConnections的进一步发展,最初由Bytedance于2024年开发。反过来,这项技术建立在微软亚洲研究院的经典ResNet架构之上。Deepseek表示,由于在基础设施层面进行了特定的优化,mHC在不增加计算成本的情况下提供了更稳定和可扩展的训练。研究人员已经在多达270亿个参数的模型上测试了这项技术,并取得了积极的结果。这种新方法可能是Deepseek下一个大型机型发布的预演。AI多模态搜索ai个性化训练
这就是赤裸裸的现实:1.在1月份中国DeepSeek开源逆袭;2.在3
这就是赤裸裸的现实:1.在1月份中国DeepSeek开源逆袭;2.在3月份AIAgent元年开启;3.在4月份国产大模型登顶;5.在6-7月份,全球算力争霸+国产算力破局;6.在8-12月份,头部模型终极迭代+民用爆发。AI发展如此迅猛,作为个人也应相时而动,提升水平,加强竞争力,否则就会落伍。新年伊始定方向、补能力、落行动、避误区。国家发改委最近联合多部门,推出了一系列重磅举措,全力支持国企、民企等各类企业深耕“人工智能+”领域,为人工智能发展注入强劲动力。这些举措聚焦六大关键方向。在政策支撑上,出台技术、应用、安全等领域的政策指引与标准,在“两重”建设中扶持国产算力、模型发展,并推动国企向民企开放战略级、高收益、民生类场景。技术赋能方面,促成AI企业与行业龙头协同攻关核心技术,建开源平台共享大模型与数据集,通过开源评价激励机制降低技术门槛。为破解算力数据难题,推算力云服务普惠化,开放公共财政资助的版权数据,探索数据成本补偿与收益分成模式。同时,加大资金扶持,持续发放“人工智能券”,补贴企业算力使用成本,助力研发投入。另外,强化项目支持,鼓励民企参与AI应用中试基地建设,在教育、医疗等领域开展试点示范。还降低综合门槛,建国家AI应用基地提供“算力-数据-模型”一站式服务,依托超大规模市场开放应用场景,创新消费补贴推动智能终端赋能千行百业。
2025中国人工智能前十强企业:1️⃣. DeepSeek2️⃣. 华为
2025中国人工智能前十强企业:1️⃣.DeepSeek2️⃣.华为3️⃣.阿里巴巴4️⃣.字节跳动5️⃣.腾讯6️⃣.大疆创新7️⃣.蚂蚁集团8️⃣.金山集团9️⃣.百度🔟.宇树科技探寻人工智能中国——近年来科技浪潮奔涌向前,AI恰似一颗新星,照亮人类前行之路。关于它究竟是工具还是伙伴、会取代人类还是助力人类,讨论声从未停歇。在我看来,答案十分明确——AI既是得心应手的工具,也是亲密无间的伙伴,它只负责助力发展,从不会想着取代人类。在医疗领域,它是本领过硬的“神医”。快速解析海量医学影像,精准揪出早期病变。就拿癌症筛查来说,比人工看片更快更准,帮患者抓住黄金治疗期。工业场景里,它是技艺精湛的“工匠”。精准把控生产流程、优化参数。智能机器人干重复活又快又稳,降成本、减误差。造车、装电子、做食品,处处都离不开它,推动工业向智能化、自动化大步迈进。而除了是给力的工作帮手,AI更不是冷冰冰的机器,而是咱们的贴心伙伴。它能听懂人话、读懂情绪,与人顺畅交流。智能语音助手像生活管家,查天气、设提醒、放音乐,还能按你的习惯给建议。教育领域的AI学习伙伴更是良师益友。根据学生的学习进度定制计划、开展针对性辅导。用有趣的方式讲题,引导思考解题,激发学习兴趣,陪着学生们共同成长进步。总之,AI是人类当下智慧的结晶,是咱们为更好发展创造的实用工具。它高效又精准,在各行各业大显身手,还能激发人的创造力,推动大家不断进步。我们要敞开心扉接纳AI,让它好好服务人类,携手共创更美好的明天。
详细解读DeepSeek新年的第一篇论文,他们就是这个时代的真神。
2026年新年第一天,DeepSeek又开卷了。发了他们新年的第一篇论文。《mHC:Manifold-Constrained Hyper-Connections》 感觉是DeepSeek-V4的铺垫,当然一些小道消息,不保真,我也不懂,我只是拍脑袋预测一下,有问题别找我。就是...
刚刚!DeepSeek梁文峰发表新论文
2026年刚开年,DeepSeek就放出了一项重要技术进展。1月1日,DeepSeek发表论文《Manifold-ConstrainedHyper-Connections》,提出一种全新的模型连接结构mHC(流形约束超连接),直击当前大模型训练领域中长期存在却难以攻克的...
deepseek评选 价格实惠成分好效果好的眼霜 再也不踩雷了
通过深度且全面的deepseek评选,我们终于找到了那些价格实惠、成分优良且效果显著的眼霜,让你从此告别踩雷的困扰。【1】宣致蜗牛原液眼霜 这款眼霜是真正的实力派好用眼霜,蜗牛原液被欧美称为护肤黄金液,改善肌肤得出好,是...
中国十大科技巨头:1、Deepseek(人工智能);2、华为(通信);3
中国十大科技巨头:1、Deepseek(人工智能);2、华为(通信);3、宇树科技(机器人);4、大疆(无人机);5、比亚迪(新能源汽车);6、字节跳动(互联网);7、京东(电子商务);8、腾讯(社交);9、腾讯(社交);10、蓝箭航天(航天)。人工智能现在是举国上下关注的焦点,AI已经渗透到我们生活的方方面面。而中美AI竞速也双轨赛跑,到底谁更领风骚呢?人工智能正重塑全球格局,中美成为核心竞争者。美国推出《AI行动计划》,中国全面推进"AI+"战略,两国都将AI视为国力、产业与规则制定的战略制高点。这场竞争不是直线追逐,而是"双轨竞跑":美国强在技术核心与创新质量,中国强在基建速度与大规模落地。英伟达CEO黄仁勋指出,AI是"五层蛋糕"——能源、芯片、基础设施、模型与应用。美国在芯片设计领先,但能源与基建投资滞后;中国能源产能是美国的2倍,若美国不补强底层,AI主导权恐易手。AI竞争已进入全栈对决阶段。美国模型层突破后,中国企业往往数月内快速跟进,靠的是开源生态与极致成本控制。中国AI新创大量采用开源模型,降低研发门槛,使竞争从单点创新转为规模与效率之争。未来,中美AI竞速将更激烈,谁能胜出?答案或许藏在"双轨竞跑"的动态平衡中。
不管你信不信,这就是中国人工智能行业市场规模:2021年,281亿美元;2
不管你信不信,这就是中国人工智能行业市场规模:2021年,281亿美元;2022年,319亿美元;2023年,388亿美元;2024年,48亿美元;2025年,637亿美元;更有人预测,随着人工智能的不断发展,2026年市场规模会达到850亿美元,2027年更会突破1000亿!2025年,中国AI技术迎来里程碑式突破,DeepSeek开源大模型以"普惠AI"理念重塑全球格局。1月发布的DeepSeek-R1以超90%的成本优势碾压国际竞品,输入输出token定价仅0.55/2.19美元/百万,让AI服务从"奢侈品"变为"日用品"。更惊人的是技术突破:557万美元训练成本实现Llama3405B级性能,混合专家架构(MoE)和多头潜在注意力机制(MLA)让计算资源需求断崖式下降。12月发布的V3.2系列在数学推理领域表现惊艳,V3.2-Speciale版在数学奥赛模拟中夺金,小学数学题正确率高达99.5%。开源策略更引发全球开发者狂欢,460万社区成员共同推动AI民主化,企业估值突破万亿跻身全球独角兽六强。清华大学KVCache.AI团队更进一步,用单张24G显卡即可本地运行671B大模型,预处理速度提升28倍,让"每个人都能拥有自己的AI"成为现实。
海光信息:公司产品已全面适配DeepSeek
证券日报网讯12月30日,海光信息在互动平台回答投资者提问时表示,DCU系列产品是公司面向高性能计算、人工...凭借卓越的性能表现与生态兼容性获得客户广泛认可,新一代产品深算四号研发进展顺利,公司产品已全面适配DeepSeek。
韧性、DeepSeek、初代同事…2025年,年轻人都在聊什么?
本次发布的“2025年度青年十大热词”由上海市青少年研究中心旗下的热词监测AI实验室经过候选词抓取比选、热度指数计算,综合推选和投票结果形成,分别是:韧性、具身智能、DeepSeek、情绪消费、主理人、爱你老己、从从容容...
当我问Deepseek:30+女性,2026年的出路在哪里?
这个夜晚,林薇认真地问了人工智能Deepseek一个问题:“请为30+女性规划2026年的职业出路,需要满足:能兼顾家庭、有成长空间、不过度依赖年轻体力、能建立可持续的个人价值。得到的回答长达三千字,而其中反复出现的关键词,...
新型塔式液冷服务器在合肥发布 算力可支撑DeepSeek稳定运行
近日,位于合肥高新区的安徽百信信息技术有限公司推出了新型塔式液冷服务器,能稳定运行DeepSeek大模型推理任务,为中国AI发展提供高效可靠的算力底座。服务器运行中,机箱内的发热元件会发出很大热量。风冷是传统的服务器...
AI“天才少女”罗福莉出手了!小米AI比DeepSeek还猛?
在小米“人车家全生态合作伙伴大会”上,原DeepSeek核心成员、被业内冠以“天才少女”之名的罗福莉,完成了加入小米后的首次公开亮相。没有冗长的铺垫,这位自带技术光环的科学家直接甩出年度王炸—3090亿参数的MiMo-V2-Flash...
你的AI助手刚刚过时了!DeepSeek V3.2这些新功能,重新定义生产力
DeepSeek V3.2震撼发布!开源AI的推理革命,普通人也能用的“最强大脑” “这个数据分析报告明天就要交,我对着Excel表格熬到凌晨三点还是理不清头绪.” “孩子的一道奥数题,全家人都被难住了,解题思路完全卡壳.” 如果你也...
DeepSeek+剪映制作电影解说,半小时搞定原创!
今天就分享如何利用 DeepSeek+剪映,半个多小时就能制作出一条原创的电影解说视频。电影解说不管在哪个短视频平台,一直都有人在做,而且流量一直居高不下,是 中视频伙伴计划 和流量分成非常高的红海赛道。在没有AI之前,制作...
2025社群运营三大常用AI工具:DeepSeek写文案、豆包做设计,群洞察查数据
2025年社群运营,AI工具好像已成标配:用 DeepSeek快速生成朋友圈文案,借 豆包制作宣传海报和短视频。然而当管理者面对几十个微信群时,会发现这些工具只解决了“输出”问题,而群洞察则解决了更关键的“洞察”问题—知道该向...