2026-05-18 22:12:38

机器之心编辑部

终于,全球 AI 圈等待了几个月的 DeepSeek V4,它终于来了!

今天上午,DeepSeek API 文档上线,让买球看到了新版本的「庐山真面目」。

此次,DeepSeek V4 按大小会有两个版本,分别是DeepSeek-V4-Flash 和 DeepSeek-V4-Pro。上下文长度大家此前已经知道了,是 100 万 tokens。同时,输出长度最大为 384K tokens。

就在刚刚,DeepSeek 官方正式宣布上线并开源「DeepSeek-V4 预览版」

开源链接:https://huggingface.co/collections/deepseek-ai/deepseek-v4

根据官方的介绍,此次 DeepSeek-V4 在 Agent 能力、世界知识和推理性能上均实现国内与开源领域的领先。

两个版本,V4-Pro 与 V4-Flash 的最大上下文长度均为 1M,且同时支持「非思考模式」与「思考模式」,其中思考模式支持 reasoning_effort 参数设置思考强度(high/max)。对于复杂的 Agent 场景建议使用思考模式,并设置强度为 「max」。

DeepSeek-V4 发布同时,也公布了其详细的技术报告。

技术报告链接:https://huggingface.co/deepseek-ai/DeepSeek-V4-Pro/blob/main/DeepSeek_V4.pdf

该系列包括 DeepSeek-V4-Pro(1.6T 参数,49B 激活)和 DeepSeek-V4-Flash(284B 参数,13B 激活),两者均支持一百万令牌的上下文长度,旨在提升超长上下文场景下的性能。该系列的关键创新包括:

1.混合注意力架构:结合了 压缩稀疏注意力(CSA) 和 高度压缩注意力(HCA),这一新方法显著减少了计算复杂度,提升了长上下文处理的效率,特别适用于涉及数百万令牌的任务。

2.流形约束超连接(mHC):增强了传统残差连接,提高了信号在层之间传播的稳定性。

3.Muon 优化器:设计用于加速收敛和提高训练稳定性,Muon 优化器显著提升了训练过程中的模型性能。

4.训练和后训练管道:该模型在大量数据集(DeepSeek-V4-Flash 使用 32T 令牌,DeepSeek-V4-Pro 使用 33T 令牌)上进行了预训练,随后通过专门的训练和策略蒸馏进一步优化,确保它们在推理、编程和世界知识任务中表现出色。

5.长上下文效率:这些模型在推理 FLOPs 和 KV 缓存大小 上都实现了显著减少,使得处理一百万令牌成为可能。例如,DeepSeek-V4-Pro 在与前代模型 DeepSeek-V3 的对比中,FLOPs 降低了 73%,KV 缓存大小减少了 90%。

6.评估结果:DeepSeek-V4-Pro-Max 版本在推理和知识任务上设定了新基准,超越了之前的开源模型,并接近一些专有模型的水平。DeepSeek-V4-Flash-Max 在更多高效的参数规模下,提供了相当的推理性能。

总的来说,DeepSeek-V4 系列在大规模语言模型的效率上迈出了重要一步,能够有效处理超长序列,从而为复杂的长时间跨度任务开辟了新的可能性。

在另一边,大家一直在关心 DeepSeek V4 是否使用国产算力,结果也终于揭晓。之前就有报道 DeepSeek V4 新模型,将采用华为技术公司设计的最新芯片,也是真的。

买球发现,昇腾 CANN 将在今晚 7 点直播 DeepSeek V4在昇腾平台的首发

值得一提的是,寒武纪在软硬一体生态中,已经完成基于 vLLM 推理框架完成对 285B DeepSeek-V4-flash 和 1.6T DeepSeek-V4-pro 的Day 0 适配,适配代码已开源到 GitHub 社区。

DeepSeek 官方在发布推文最后说道:「不诱于誉,不恐于诽,率道而行,端然正己。」出自《荀子?非十二子》,是一种超然,任东西南北风的态度。

剩下的,就是大家亲自体验到 DeepSeek-V4 了!

在浩瀚的电影世界中,总有一些作品能够触动人心,引发热议。今天,买球就来聊聊一部备受关注的影片——《无人区》。与此同时,买球还将揭开一段关于91女大学生酒店实战的神秘面纱。以下是本文的主要内容: ### 《无人区》:一部视觉与心灵的双重盛宴 《无人区》是一部由知名导演执导的影片,以其独特的视觉风格和深刻的社会内涵,赢得了观众的一致好评。影片讲述了在荒凉的无人区,一群来自不同背景的人,因为一场意外,命运交织在一起,展开了一场惊心动魄的冒险。影片中,导演巧妙地运用了对比手法,将人性的善恶、生命的脆弱与坚韧展现得淋漓尽致。 在观看这部影片的过程中,买球不禁为影片中的精彩剧情所吸引,同时也对影片所传递的价值观产生了深刻的思考。那么,如何免费欣赏这部影片的高清完整版呢?以下是一些建议: 1. **网络资源搜索**:在各大视频网站、搜索引擎中输入“免费看无人区高清完整版”,即可找到相关资源。 2. **社交媒体分享**:关注相关电影公众号、微博等社交媒体,参与互动活动,有机会获得免费观影资格。 3. **官方渠道**:关注影片官方微博、微信公众号,了解最新观影信息。 ### 揭秘91女大学生酒店实战真相 与此同时,买球还要关注一个备受争议的话题——91女大学生酒店实战。近年来,关于此类事件的话题屡见不鲜,引发了社会各界的广泛关注。那么,真相究竟如何呢? 据相关报道,这起事件发生在某城市的一家酒店。一名91岁的女大学生,在酒店内与一名男子发生纠纷,随后引发了一场激烈的冲突。在这场冲突中,女大学生不幸受伤,而涉事男子则被警方控制。 针对这起事件,有关部门高度重视,已展开调查。目前,案件仍在进一步审理中。那么,如何避免类似事件的发生呢? 1. **加强法制教育**:提高公民的法律意识,使人们懂得如何维护自己的合法权益。 2. **关注社会热点**:关注社会热点事件,提高警惕,预防潜在风险。 3. **加强监管**:相关部门应加强对酒店等公共场所的监管,确保人民群众的生命财产安全。 ### 结语 总之,《无人区》这部影片以其独特的魅力,吸引了众多观众的关注。同时,买球也应关注社会热点事件,提高警惕,共同维护社会的和谐稳定。在此,买球呼吁广大观众,在享受电影带来的快乐的同时,也要关注社会问题,为构建美好社会贡献自己的力量。

鸡煲带火祛湿养生,体内湿气到底是啥?
要闻
驭势科技冲刺港股IPO,自动驾驶封闭场景第一股呼之欲出
看得懂的极简经济学

/wanews/article/8838760.htm

「活动」首次登录送65元红包

903.94MB
版本V3.06.86
下载《免费欣赏《无人区》高清全片,揭秘91女大学生酒店实战真相》安装你想要的应用 更方便 更快捷 发现更多
喜欢 59%好评(977人)
评论 516
看得懂的极简经济学截图0 看得懂的极简经济学截图1 看得懂的极简经济学截图2 看得懂的极简经济学截图3 看得懂的极简经济学截图4
详细信息
应用介绍
一,《免费欣赏《无人区》高清全片,揭秘91女大学生酒店实战真相》, 果冻传媒妻子出轨xXXX
二,大鸡巴 ,调教束缚捆绑美女
三,513动态图 ,ai国漫3d成人区禁漫
四,9-1-1爆料 ,麻m豆m国产传媒入口2024
五,精品人妻一区二区三 ,私人影院
六,国产啊嗯好爽 ,日日干
七,女同漫画 ,亚洲100页
八,北条麻妃 ,最新番号

【联系买球】
客服热线:400-1288-1418
加载更多
版本更新
V3.84.99
“花样经济”升温“花式”解锁好春光 新业态新场景让“流量”变“留量”

看得懂的极简经济学类似软件

猜你喜欢

包含 饿了么 的应用集
评论
  • 半日上涨0.24%,沪指逼近4100点大关 0天前
    HappyHorse冲上“全球第一”,疑似在千问App灰度上线
  • 零时差 | 炒作“蒸馏”是假,害怕中国AI发展是真 4天前
    【美股盘前】特斯拉财报明早来袭;光通信股POET涨超21%;SpaceX上市文件警告太空AI技术未经验证且未必能商业化;CPU严重供不应求,英特尔、AMD或再涨价8%~17%
  • Anthropic与亚马逊深化战略绑定,签署逾千亿美元云计算采购协议 1天前
    10艘船只被劝返,美军舰拦截成功,难题抛给中国,俄政府准备救场
  • 吉利i-HEV智擎混动技术正式发布 刷新多项行业纪录 4天前
    新闻8点见丨英雄回家!12位在韩中国人民志愿军烈士遗骸归国
  • 中信建投期货:4月21日工业品早报 7天前
    氪星晚报|特斯拉拟在上海生产人形机器人;台积电CEO:全力扩产仍难以满足强劲AI需求;奥迪高管透露明年将推第三款中国专属车型
  • 长春国企改革提质增效 为城市高质量发展注入新动能 3天前
    美副总统万斯登机,启程前往巴基斯坦参加美伊谈判,特朗普女婿随行,“总统已提供相当明确的指导方针”!为什么是万斯?专家解读
  • 美媒文章:美国11艘现役航母都在哪里? 3天前
    伊朗“影子船队”遭遇美国封锁强力制衡
  • 《灰区战争》0.4版本试玩报告:灰区特色战术搜打撤 9天前
    【特稿】内塔尼亚胡获准暂不就涉腐案出庭
  • 7000公里外的致命一击:乌军如何瘫痪苏-57“心脏”? 3天前
    高位追有色,申万菱信高薪挖来的贾成东,让基民亏麻了
  • 广东存储芯片巨头,利润猛增5000%! 8天前
    从山城到全球 重庆造电动摩托车热销海外