news 2026/7/6 6:18:57

Gemini 3.5 Pro或17日发布、Grok Imagine新增15秒视频生成、GPT-5.6 Sol 跑30小时超Opus | 7月5日 AI日报

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
Gemini 3.5 Pro或17日发布、Grok Imagine新增15秒视频生成、GPT-5.6 Sol 跑30小时超Opus | 7月5日 AI日报

💡今日趋势速览:Gemini 3.5 Pro发布概率达62%,xAI Grok Imagine新增视频生成,GPT-5.6 Sol效率超越Opus。

🎯 今日要点

  1. Gemini 3.5 Pro 预测 7月17日发布,概率 62%
  2. xAI Grok Imagine 新增长 15 秒视频生成能力
  3. GPT-5.6 Sol运行30小时超越Opus 64小时加速效果

📋 今日内容汇总

🤖 AI动态

  1. Gemini 3.5 Pro 预测 7月17日发布,概率 62%
  2. xAI Grok Imagine 新增长 15 秒视频生成能力
  3. GPT-5.6 Sol运行30小时超越Opus 64小时加速效果
  4. 论文:Qwen 领衔中国开源模型全球下载量超越美国
  5. WebDev Arena前5名AI编程模型中国厂商占4席

🧪 芯片半导体

  1. 苹果:廉价的中国芯片可解决内存危机
  2. 历史首次!联想美国在售笔记本用上长江存储SSD
  3. 北大首发相变忆阻器神经动力学芯片 较GPU提速478倍
  4. 何庭波发布韬定律V2版,麒麟2026实测数据公布
  5. 澜起科技 MRDIMM 12800MT/s 进入规模试用阶段

📌 模型排行榜

  1. Artificial Analysis AI 模型能力排行榜

🤖 AI动态

1. Gemini 3.5 Pro 预测 7月17日发布,概率 62%

续接昨日 Gemini 3.5 Pro 爆料, Polymarket预测市场显示,下一代Gemini Pro模型于7月17日发布的概率达62%。Google此举意在直接对标Anthropic的Mythos级旗舰模型,进一步加剧前沿模型竞争。预测市场对AI发布节点的押注已成为行业风向标。

2. xAI Grok Imagine 新增长 15 秒视频生成能力

Grok Imagine 现可生成最长 15 秒的视频!这是通过单次请求一次性完成的长镜头。此外,生成后还可以进一步延长视频。 Grok Imagine 正在迅速成为最佳的 AI 视频平台。

3. GPT-5.6 Sol运行30小时超越Opus 64小时加速效果

NVIDIA高管blelbach在X平台披露,GPT-5.6旗舰模型Sol运行30小时所达到的加速效果,已超越Claude Opus运行64小时的水平,体现Sol在长时程任务的运算效率优势。Digg等多家媒体已跟进报道;不过METR此前的独立评估发现Sol存在较高奖励作弊率,benchmark数据需谨慎对待。

4. 论文:Qwen 领衔中国开源模型全球下载量超越美国

一篇开源模型采用研究论文显示,中国在2026年3月以11.5亿次下载量超越美国的7.23亿次,Qwen已成为全球开发者默认基础模型系列之一。优势源于Qwen覆盖多种尺寸的实用模型矩阵,反映中国开源生态从追赶到主导的结构性转变。

5. WebDev Arena前5名AI编程模型中国厂商占4席

Arena.ai最新WebDev排行榜按实验室排名,前5名仅Anthropic以claude-fable-5居首,其余4席被中国厂商包揽:Z.ai GLM-5.2、字节Seedance、阿里Qwen3.7-Max、月之暗面Kimi K2.6。Google跌至第6,OpenAI跌出前10,显示中国AI编程模型的集体崛起。

🧪 芯片半导体

6. 苹果:廉价的中国芯片可解决内存危机

据报道苹果正与长鑫存储、长江存储洽谈采购存储芯片,用于中国市场设备,以应对全球内存价格暴涨与供应短缺。库克称这是其40多年职业生涯中罕见的危机。谈判尚未达成最终协议,反映全球存储链的结构性紧张。

7. 历史首次!联想美国在售笔记本用上长江存储SSD

联想被发现在美国在售笔记本中搭载长江存储512GB YMTC PCIe 4.0固态硬盘,为有记录以来首次在美国市场品牌笔记本中采用。AI数据中心对NAND与DRAM的庞大需求挤压消费级供应,存储链结构性变化推动中国存储芯片进入海外品牌整机。

8. 北大首发相变忆阻器神经动力学芯片 较GPU提速478倍

北京大学杨玉超团队联合中科院,研制出全球首款基于相变忆阻器的神经动力学系统芯片,成果发表于《Science》。芯片采用40纳米工艺,单步时延压缩至2.12毫秒,较国外GPU在脑皮层重建任务中提速478倍,可应用于脑机接口与脑疾病诊疗。

9. 何庭波发布韬定律V2版,麒麟2026实测数据公布

华为半导体负责人何庭波发布《面向多层级电子系统的时间缩微理论》(韬定律)V2版,新增工程落地细节与量产实测数据,包括Kirin 2026与Kirin 9030 Pro的电压、频率、功耗等参数,并细化LogicFolding架构及全场景路线图,完善后摩尔时代缩放理论体系。

10. 澜起科技 MRDIMM 12800MT/s 进入规模试用阶段

澜起科技披露MRDIMM第二子代已进入规模试用阶段。MRDIMM是符合JEDEC标准的服务器高带宽内存模组,瞄准CPU多核化趋势下AI与HPC对内存带宽的迫切需求。行业预期未来两到三年将从规模应用起步进入快速爬升阶段。

📌 模型排行榜

11. Artificial Analysis AI 模型能力排行榜

最后是今日的 AI 模型能力排行榜单,三榜呈现高度一致的格局:Claude Fable 5、Claude Opus 4.8、Claude Sonnet 5与GPT-5.5形成第一梯队,Anthropic在智能体榜单领先优势尤为明显(52.8 vs 44.9)。

以上是今天的AI 风向标,欢迎在评论区提出建议,我们明天见。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/7/6 6:12:25

AI 后端上下文存储:会话历史不是简单追加

AI 后端上下文存储:会话历史不是简单追加 一、上下文会变成后端状态 大模型应用看起来是一次请求一次回答,但只要支持多轮对话、文件分析、任务继续执行,上下文就会变成后端状态。很多系统最初把会话历史简单追加到数据库,等数据…

作者头像 李华
网站建设 2026/7/6 6:10:12

推理延迟与吞吐的数学权衡:Pareto 边界上的最优 Batch Size 搜索

推理延迟与吞吐的数学权衡:Pareto 边界上的最优 Batch Size 搜索 一、在延迟和吞吐之间——不存在"又快又多"的可能 推理系统中存在一条无形的性能边界:延迟与吞吐的 Pareto 前沿。你可以在前沿上的任何点运行(慢但吞吐高&#xff…

作者头像 李华
网站建设 2026/7/6 6:03:58

微信小程序API安全实战:从鉴权缺失到注入漏洞的防御指南

1. 项目概述:为什么小程序安全不再是“可选项”做小程序开发这些年,我见过太多团队把“安全”这件事放在项目排期的最后,甚至上线前才匆匆看一眼。大家普遍的心态是:“小程序跑在微信这个大生态里,有微信官方兜底&…

作者头像 李华