5月28日,DeepSeek官方宣布其R1模型已完成小版本试升级,用户可通过官方网页、APP或小程序进行测试。此次升级保持了原有的API接口和使用方式,确保用户无需调整现有设置即可体验新版本。
本次升级主要涉及四个方面的优化。首先,在响应质量上,模型在复杂推理、多步骤计算、长文理解与生成等方面表现更优,数学和编程等专业性输出也更加可靠。其次,响应速度有小幅提升,尤其在处理超长文本时,延迟降低了约10%到20%。此外,对话稳定性增强,上下文记忆能力更稳定,减少了在超长对话中出现遗忘或跑偏的情况。最后,API和接口的兼容性保持不变,用户无需修改现有集成即可无缝使用新版本。
关于此次“试升级”,DeepSeek解释称,这是一次灰度发布,部分用户可优先体验。官方将收集反馈,确保稳定性后再进行全面推送。目前,用户通过官方App、网页或小程序打开“深度思考”模式,很可能已经用上升级后的版本。
  
  
另一方面,关于下一代R2模型的发布时间,此前曾有传闻称其将于3月17日发布,但DeepSeek官方已辟谣,称该消息不实。目前,R2模型的具体发布时间仍未确定。
  
MiniMax推出全球首款混合架构开源模型M1 能否实现弯道超车
上海人工智能独角兽企业MiniMax近日发布了自主研发的MiniMax-M1系列模型,这一突破性产品被官方称为"全球首个开源的大规模混合架构推理模型"。该模型在处理百万Token级长文本方面取得重大突破,成为当前上下文最长的推理模型。M1模...
每日经济新闻|2025-06-18 12:00
  
9秒完成上海中考作文"相互成全",你能得几分?
6月14日,上海中考语文科目考试结束后,备受关注的作文题目"相互成全"正式公布。题目要求考生根据《现代汉语词典》对"成全"的解释,以"相互成全"为题完成一篇600字左右的文章。解放日报·上观新闻记者第一时间邀请本地AI参与同题作文创作,测试...
2025-06-16 19:00
  
2025高考数学AI对决:国产双雄登顶,海外巨头意外翻车
2025年高考结束后,数学科目的难度成为热议话题。《每日经济新闻》记者选取全国新课标数学I卷作为考题,对包括DeepSeek-R1、腾讯混元T1、OpenAI的o3、谷歌Gemini 2.5 Pro和xAI的Grok3在内的十款AI推理大模...
2025-06-13 13:20
  
苹果WWDC前质疑AI模型"假思考",测试方法引争议
近日,苹果机器学习研究中心发布了一篇题为《思考的幻象:通过问题复杂性的视角理解推理模型的优势与局限》的论文,引发了AI领域的广泛讨论。该论文由谷歌大脑联合创始人Samy Bengio等研究人员共同撰写,对当前主流AI模型的推理能力提出了质疑...
每日经济新闻|2025-06-11 13:48
  
阿里云领投硅基流动A轮融资 半年完成两轮融资 开源大模型推动业务爆发
近日,AI初创企业硅基流动(SiliconFlow)宣布完成数亿元人民币A轮融资。本轮融资由阿里云领投,创新工场等老股东超额跟投,华兴资本担任独家财务顾问。硅基流动创始人袁进辉表示,随着阿里巴巴通义千问Qwen、DeepSeek等开源大模型...
每日经济新闻|2025-06-11 11:16
  
苹果WWDC亮点:Siri升级仍需等待,开发者可抢先体验AI模型;Neuralink联手Grok,脑机芯片助渐冻症患者重获"声音"
这篇报道涵盖了近期科技领域的重要动态,主要聚焦于人工智能和前沿技术的突破性进展。苹果公司在WWDC开发者大会上发布了多项创新举措,包括全新设计的"液态玻璃"界面和以年份命名的软件版本。值得注意的是,苹果向开发者开放了基础模型,展示了其在AI...
每日经济新闻|2025-06-10 12:32
  
美团酒旅战略升级:低调布局转向主动出击
美团近日首次公开了其在旅游AI领域的最新进展,推出国内首个面向酒店商家的AI工具"美团既白"。这款工具将从高效获客、长效经营和重塑服务三个维度,帮助酒店从业者实现从经验决策到数据决策的转变,提升客户入住体验。一直以来,美团在AI领域的布局都...
每日经济新闻|2025-06-07 13:56
  
AI盛会再掀热潮,具身智能成新焦点
第七届北京智源大会于6月6日正式开幕,这场被誉为"AI春晚"的盛会再次成为行业焦点。与往年不同,今年的主角从大语言模型转向了具身智能和机器人2.0领域。宇树机器人、天工机器人等企业带来的展示吸引了众多观众围观,现场气氛热烈。大会反映出AI产...
每日经济新闻|2025-06-07 12:48
  
华为昇腾鲲鹏联手,大模型训练效率飙升
这篇文章详细介绍了华为在MoE(混合专家)模型训练优化方面的技术突破。文章首先回顾了MoE模型的发展历程,从三十多年前加拿大提出的原始架构,到硅谷科技巨头的工程突破,再到如今中国企业的创新优化。华为提出的MoGE架构解决了传统MoE模型负载...
虎嗅APP|2025-06-06 11:24
  
医疗大模型热销背后:医院应用遇冷
2025年6月3日,国产大模型DeepSeek在医疗领域掀起热潮。短短三个多月,全国已有上千家医院完成该模型的本地化部署。医院普遍期待通过大模型提升预问诊、临床诊断、影像分析等环节的效率。例如上海华山医院接入后,患者排队时间减少40分钟,满...
第一财经资讯|2025-06-04 21:14
  
训练大模型,50%时间在空转?
这篇文章详细介绍了华为在混合专家(MoE)模型训练领域的技术突破。文章首先回顾了MoE模型的发展历程,从三十年前加拿大学者的理论奠基,到硅谷巨头的工程实践,再到如今中国科技企业的创新优化。华为提出的MoGE架构解决了传统MoE模型负载不均衡...
虎嗅APP|2025-06-04 18:56
  
蚂蚁集团数据安全总监杨小芳:AI安全与创新如何双赢
随着生成式人工智能技术的快速发展,AI在提升效率和创新应用方面展现出巨大潜力,但同时也带来了新的安全挑战。近期AI换脸诈骗、大模型失控等事件频发,引发了社会各界对技术滥用、隐私保护和伦理风险的广泛讨论。《每日经济新闻》记者专访了蚂蚁集团大模...
2025-06-04 14:00
本信息来自互联网,不代表导读网立场,如若转载,请注明出处:http://www.frfey.com/news/69218/

