进展超预期:AI Futures Project 显著提前 AGI 与自动化编程实现预测
AI Futures Project 发布 2026 年第一季度更新报告,受 Gemini 3、GPT-5.2 及 Claude Opus 4.6 等新模型表现超预期影响,研究人员显著提前了通用人工智能(AGI)与自动化编程(AC)的时间线预测。其中,自动化编程的实现中值预测已从 2029 年底提前至 2028 年中;而在所有认知任务中达到顶级专家水平的 AI(TED-AI)实现预测也整体提前了约 1.5 年。
报告分析显示,METR 编码时间水平的翻倍速度已从 5.5 个月缩短至 4 个月左右。此外,AI 编程工具在商业化进程中表现强劲,Claude Code 发布仅 9 个月,其年化收入已突破 25 亿美元。研究团队认为,代理化编码(Agentic Coding)的进展速度远超此前预期,行业内关于自动化 AI 研发即将实现的共识正在进一步增强。
AI Futures Project
🌸 在花频道|茶馆讨论|投稿通道
AI Futures Project 发布 2026 年第一季度更新报告,受 Gemini 3、GPT-5.2 及 Claude Opus 4.6 等新模型表现超预期影响,研究人员显著提前了通用人工智能(AGI)与自动化编程(AC)的时间线预测。其中,自动化编程的实现中值预测已从 2029 年底提前至 2028 年中;而在所有认知任务中达到顶级专家水平的 AI(TED-AI)实现预测也整体提前了约 1.5 年。
报告分析显示,METR 编码时间水平的翻倍速度已从 5.5 个月缩短至 4 个月左右。此外,AI 编程工具在商业化进程中表现强劲,Claude Code 发布仅 9 个月,其年化收入已突破 25 亿美元。研究团队认为,代理化编码(Agentic Coding)的进展速度远超此前预期,行业内关于自动化 AI 研发即将实现的共识正在进一步增强。
AI Futures Project
🌸 在花频道|茶馆讨论|投稿通道
👍121😭55❤9😁6🌭4👎2
《自然》调查:AI 虚假引用入侵学术界,2025 年逾 11 万篇论文受影响
《自然》杂志与 Grounded AI 的最新调查显示,生成式 AI 制造的“幻觉引用”正大规模污染学术文献。分析指出,2025 年全球约 700 万篇科研出版物中,估计有超过 11 万篇包含虚假参考文献。这些被称为“科学怪人(Frankenstein)”的引用往往由真实论文片段拼凑而成,具有极高的欺骗性,导致计算机科学等领域的虚假引用率从 2024 年的 0.3% 飙升至 2025 年的 2.6%。
目前,包括 Elsevier、Springer Nature 和 Wiley 在内的五大出版商均已受到波及,部分期刊在 2026 年 1 月甚至因虚假引用拒绝了高达 25% 的投稿。为应对这一趋势,出版商正紧急引入 AI 筛查工具,通过校验 DOI、标题及数据库匹配度来拦截问题稿件。专家警告,学术界正面临虚假文献“洪水”的冲击,这不仅增加了审稿难度,更严重威胁科研诚信。
Nature
🌸 在花频道|茶馆讨论|投稿通道
《自然》杂志与 Grounded AI 的最新调查显示,生成式 AI 制造的“幻觉引用”正大规模污染学术文献。分析指出,2025 年全球约 700 万篇科研出版物中,估计有超过 11 万篇包含虚假参考文献。这些被称为“科学怪人(Frankenstein)”的引用往往由真实论文片段拼凑而成,具有极高的欺骗性,导致计算机科学等领域的虚假引用率从 2024 年的 0.3% 飙升至 2025 年的 2.6%。
目前,包括 Elsevier、Springer Nature 和 Wiley 在内的五大出版商均已受到波及,部分期刊在 2026 年 1 月甚至因虚假引用拒绝了高达 25% 的投稿。为应对这一趋势,出版商正紧急引入 AI 筛查工具,通过校验 DOI、标题及数据库匹配度来拦截问题稿件。专家警告,学术界正面临虚假文献“洪水”的冲击,这不仅增加了审稿难度,更严重威胁科研诚信。
Nature
🌸 在花频道|茶馆讨论|投稿通道
4😁195😈36😱18❤10😢5🍾4💊4⚡2
索尼互动娱乐近日再次对 PlayStation Store 进行大规模清理,下架了包括 GoGame Console Publisher、VRCForge Studios 及 Welding Byte 在内的多家发行商及其全部作品。此次行动主要针对所谓的“换皮游戏”(Shovelware)、AI 生成的低质内容以及通过模仿热门独立游戏标题来误导用户的作品,涉及《耶稣模拟器》(Jesus Simulator)和《卡牌商店模拟器》仿制品等多个项目。
这已是索尼近期净化商店生态的系列行动之一。今年 1 月,索尼曾一次性下架某单一开发者超过 1,000 款游戏;近期还清除了拥有近 700 款作品的 Nostra Games 目录。尽管索尼在打击低质游戏方面表现激进,但部分受影响的发行商已表示将转战任天堂 eShop、Xbox 商店及 Steam 等平台继续发布此类作品。
Eurogamer | TheGamer
🌸 在花频道|茶馆讨论|投稿通道
Please open Telegram to view this post
VIEW IN TELEGRAM
👍213❤9🌭5👏3
《战地 6》音频团队为追求极致真实:实地射击车辆并摧毁集装箱以采集音效
《战地 6》音频团队近日透露,为了在游戏中实现极致真实的音效表现,开发人员在录音过程中采取了大量极端手段,包括从吊车上坠落汽车、射击真实车辆以及摧毁砖墙和集装箱。高级技术音效设计师 Goncalo Tavares 表示,团队坚持“现实优先”的原则,认为直接记录现实比后期模拟更能还原质感。为此,团队甚至跟随瑞典军队进行演习录音,并尝试将麦克风埋入地下或放置在建筑物内部,以捕捉振动和隔墙传导的真实听感。
在实地采集过程中,团队不仅录制了大量武器射击声,还曾因近距离捕捉子弹撞击声而导致录音设备损毁。对于坦克炮弹、火炮或火箭弹等难以实地安全采集的大型投射物音效,团队则会参考专业的付费音效库。这种对细节的追求旨在确保游戏中的每一次爆炸和环境破坏都能为玩家提供身临其境的听觉体验。
TechRadar
🌸 在花频道|茶馆讨论|投稿通道
《战地 6》音频团队近日透露,为了在游戏中实现极致真实的音效表现,开发人员在录音过程中采取了大量极端手段,包括从吊车上坠落汽车、射击真实车辆以及摧毁砖墙和集装箱。高级技术音效设计师 Goncalo Tavares 表示,团队坚持“现实优先”的原则,认为直接记录现实比后期模拟更能还原质感。为此,团队甚至跟随瑞典军队进行演习录音,并尝试将麦克风埋入地下或放置在建筑物内部,以捕捉振动和隔墙传导的真实听感。
在实地采集过程中,团队不仅录制了大量武器射击声,还曾因近距离捕捉子弹撞击声而导致录音设备损毁。对于坦克炮弹、火炮或火箭弹等难以实地安全采集的大型投射物音效,团队则会参考专业的付费音效库。这种对细节的追求旨在确保游戏中的每一次爆炸和环境破坏都能为玩家提供身临其境的听觉体验。
TechRadar
🌸 在花频道|茶馆讨论|投稿通道
3🤯377👍121🤣36🔥21❤15😁6🍾5👏4
科技圈🎗在花频道📮
受“氛围编程”(Vibe Coding)及 AI 工具普及影响,苹果 App Store 的应用提交量在 2026 年第一季度达到 235,800 个,同比增长 84%。研究机构 Sensor Tower 的数据显示,自 2025 年起提交量便持续攀升,全年总量接近 60 万个。
面对激增的审核压力,苹果表示已引入 AI 辅助人工审核,目前 90% 的申请能在 48 小时内完成,平均审核时间为 1.5 天。苹果正严厉打击部分 AI 编程类应用,防止其在绕过 App Store 审核机制的情况下在设备端直接生成并分发新应用,以维护平台的安全与生态质量。
AppleInsider
🌸 在花频道|茶馆讨论|投稿通道
Please open Telegram to view this post
VIEW IN TELEGRAM
😁188👎28💊12❤1👍1😈1
NASA 分享了 3 张在阿耳忒弥斯 II 月球任务期间由宇航员使用 iPhone 17 Pro Max 拍摄的照片。照片显示,指令长 Reid Wiseman 和任务专家 Christina Koch 通过猎户座飞船主舱窗回望地球;Flickr 数据显示,这些照片由 iPhone 17 Pro Max 前置摄像头于 4 月 2 日拍摄,当天是任务第 2 天。
NASA 今年 2 月宣布,iPhone 已完成长期在轨使用资格认证;报道提到,猎户座上的 4 名乘组成员都配备了 iPhone 17 Pro Max,用于拍摄个人照片和视频。阿耳忒弥斯 II 是 NASA 自 1972 年以来首次载人奔月任务,乘组预计将于周一抵达月球背面并刷新人类离地最远飞行纪录;飞船不会登月,计划于 4 月 10 日返回地球。
MacRumors
🌸 在花频道|茶馆讨论|投稿通道
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
1🤯287👍88❤70😁14🥱13🕊7❤🔥3🤩1
Anthropic 成长主管 Amol Avasare 日前分享,这家估值 3800 亿美元的 Claude 开发商正通过极度透明的沟通机制对抗大企业病。公司内部为每位员工(含 CEO Dario Amodei)设立公开的 Slack「笔记本」频道,打破部门间信息孤岛,鼓励跨层级直接交流。
Avasare 指出,公司文化明确鼓励员工直接挑战高层决策。在近期一场全公司大会后,有员工因不认同 Amodei 的观点,直接在其 Slack 频道留言质疑,引发大规模公开辩论。这种打破传统「指挥链」的做法,旨在防范群体迷思,确保涉及 AI 安全的高风险研究能获得基层及时反馈。
mashdigi
🌸 在花频道|茶馆讨论|投稿通道
Please open Telegram to view this post
VIEW IN TELEGRAM
🆒270😁57👍39🤣18❤12⚡6💯4🥰2
OpenAI 官方状态页显示,部分用户在访问 ChatGPT 网页版时可能会遇到回复内容为空的问题。目前 OpenAI 已确认该故障并将其列为“性能退化”状态,技术团队正在对受影响的服务组件进行调查。
16:35更新:官网提示已恢复正常。
OpenAI Status
🌸 在花频道|茶馆讨论|投稿通道
Please open Telegram to view this post
VIEW IN TELEGRAM
👎124😁39🤬9❤4👍2
科技圈🎗在花频道📮
Please open Telegram to view this post
VIEW IN TELEGRAM
🤯222🤣37👍21👎14🌭10❤7🤔6😁5
OpenAI 发布了一系列名为《智能时代的产业政策》的提案,旨在应对“超级智能”可能带来的社会变革。该公司认为,随着 AI 技术向超越人类能力的水平演进,现有的政策框架已不足以应对挑战。为此,OpenAI 计划于今年 5 月在华盛顿特区开设新办公室,并提供最高 100 万美元的 API 额度及 10 万美元现金资助,以启动关于 AI 政策的跨界讨论。
提案核心建议重构税收体系,对因自动化获利的企业征收更高税收,甚至对替代人工的系统征税。在保障民生方面,OpenAI 提议建立类似于主权财富基金的公共投资基金,定期向民众发放收益,并推行不随雇主变动的“便携式福利”及缩短工时等措施。此外,公司试图在政治立场上保持平衡,既支持加强电网建设以应对 AI 竞争,也主张在识别和遏制危险 AI 系统方面赋予政府更大的评估权。
OpenAI | The Wall Street Journal
🌸 在花频道|茶馆讨论|投稿通道
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔168👍65❤18👎13🤣8🫡5😁4😈1
科学家通过基因改造烟草合成五种天然致幻剂,产量最高提升 40 倍
以色列魏茨曼科学研究所等机构的研究人员在《科学进展》(Science Advances)发表成果,通过基因工程改造本氏烟草,使其能够合成包括 DMT、西洛西宾(致幻真菌成分)及 5-MeO-DMT(蟾蜍分泌物成分)在内的五种天然致幻类物质。该系统利用植物内源的色氨酸作为原料,实现了跨越植物、真菌和动物界的生物合成路径重组,并能产生非天然的卤化衍生物。
研究团队利用 AlphaFold3 预测蛋白质结构并进行定向突变,成功将 5-MeO-DMT 的产量提升了 40 倍。这一突破为抑郁症、焦虑症和创伤后应激障碍(PTSD)等精神疾病的药物开发提供了高效、可持续且“零残忍”的生产平台,有望解决传统提取方式导致的生态破坏和过度采挖问题。
Science Advances | Science
🌸 在花频道|茶馆讨论|投稿通道
以色列魏茨曼科学研究所等机构的研究人员在《科学进展》(Science Advances)发表成果,通过基因工程改造本氏烟草,使其能够合成包括 DMT、西洛西宾(致幻真菌成分)及 5-MeO-DMT(蟾蜍分泌物成分)在内的五种天然致幻类物质。该系统利用植物内源的色氨酸作为原料,实现了跨越植物、真菌和动物界的生物合成路径重组,并能产生非天然的卤化衍生物。
研究团队利用 AlphaFold3 预测蛋白质结构并进行定向突变,成功将 5-MeO-DMT 的产量提升了 40 倍。这一突破为抑郁症、焦虑症和创伤后应激障碍(PTSD)等精神疾病的药物开发提供了高效、可持续且“零残忍”的生产平台,有望解决传统提取方式导致的生态破坏和过度采挖问题。
Science Advances | Science
🌸 在花频道|茶馆讨论|投稿通道
😢182😱141😁26👎20🤯18👻15😨14👏12
我国钠离子电池取得重大突破
4 月 6 日,中国科学院物理研究所胡勇胜团队在《自然·能源》发表重磅成果:该团队成功开发出一种具有自保护功能的可聚合不燃电解质(PNE),全球首次在安时级钠离子电池中实现彻底阻断热失控。
该团队打破了“阻燃电解液等于安全”的传统认知,跳出单一防线,构建了“热稳定性-界面稳定性-物理隔离”三位一体的智能安全防护体系。当电池温度异常升高至 150°C 以上时,PNE 会自动由液态固化为致密屏障,犹如在电池内部筑起一道“智能防火墙”,彻底切断热失控的传播路径。
值得一提的是,这一突破并未牺牲电池的高性能表现,兼具极好的宽温性能和耐高压稳定。这一成果刷新了人们对电池安全的认知,为钠离子电池在电动汽车、大规模储能等领域的商业化落地奠定了坚实基础。
财联社 | Nature
🌸 在花频道|茶馆讨论|投稿通道
4 月 6 日,中国科学院物理研究所胡勇胜团队在《自然·能源》发表重磅成果:该团队成功开发出一种具有自保护功能的可聚合不燃电解质(PNE),全球首次在安时级钠离子电池中实现彻底阻断热失控。
该团队打破了“阻燃电解液等于安全”的传统认知,跳出单一防线,构建了“热稳定性-界面稳定性-物理隔离”三位一体的智能安全防护体系。当电池温度异常升高至 150°C 以上时,PNE 会自动由液态固化为致密屏障,犹如在电池内部筑起一道“智能防火墙”,彻底切断热失控的传播路径。
值得一提的是,这一突破并未牺牲电池的高性能表现,兼具极好的宽温性能和耐高压稳定。这一成果刷新了人们对电池安全的认知,为钠离子电池在电动汽车、大规模储能等领域的商业化落地奠定了坚实基础。
财联社 | Nature
🌸 在花频道|茶馆讨论|投稿通道
1👍523⚡57👎18❤17🤣16😱8👏7😍1
OpenAI、Anthropic 和 Google 罕见联手,遏制中国竞争对手蒸馏美国 AI 模型
OpenAI、Anthropic 和 Alphabet 旗下 Google 已开始罕见协作,通过 Frontier Model Forum 共享有关“对抗性蒸馏”的信息,试图遏制中国竞争对手未经授权提取美国前沿 AI 模型输出、复制其能力。美国 AI 公司认为,这类做法既可能以更低成本复制产品、分流客户,也可能带来国家安全风险。
OpenAI 已确认参与这一信息共享行动,并提到其近期提交给美国国会的备忘录,指称 DeepSeek 试图“搭便车”利用 OpenAI 和其他美国前沿实验室开发出的能力。报道同时称,这类共享目前仍较有限,相关公司对现有反垄断指引下哪些信息可以互通仍存疑,希望美国政府给出更明确边界。
Bloomberg
🌸 在花频道|茶馆讨论|投稿通道
OpenAI、Anthropic 和 Alphabet 旗下 Google 已开始罕见协作,通过 Frontier Model Forum 共享有关“对抗性蒸馏”的信息,试图遏制中国竞争对手未经授权提取美国前沿 AI 模型输出、复制其能力。美国 AI 公司认为,这类做法既可能以更低成本复制产品、分流客户,也可能带来国家安全风险。
OpenAI 已确认参与这一信息共享行动,并提到其近期提交给美国国会的备忘录,指称 DeepSeek 试图“搭便车”利用 OpenAI 和其他美国前沿实验室开发出的能力。报道同时称,这类共享目前仍较有限,相关公司对现有反垄断指引下哪些信息可以互通仍存疑,希望美国政府给出更明确边界。
Bloomberg
🌸 在花频道|茶馆讨论|投稿通道
😁349🤣162👍57👎43🥱6🙈4🎉2😐2
Linux 7.1 或终结 Intel 486 支持,内核开发者已着手移除相关代码
Linux 内核开发者已开始拆除对 Intel 486 处理器的支持,相关补丁预计并入 Linux 7.1。按现有补丁内容,CONFIG_M486SX、CONFIG_M486 和 CONFIG_MELAN 等 Kconfig 构建选项将被移除,这意味着用户今后可能无法再构建 i486 内核镜像。
补丁作者 Ingo Molnar 表示,x86-32 为支持这些古老 32 位 CPU 保留了复杂的硬件仿真兼容机制,而现代内核中实际使用者极少,这些兼容代码有时还会带来额外维护问题。Linus Torvalds 此前也称,继续支持 486 已“没有真正的理由”。报道同时提到,仍在 486 平台上运行现代 Linux 的用户,如需继续使用,可能需要转向现有的 Linux LTS 内核。
Tom's Hardware
🌸 在花频道|茶馆讨论|投稿通道
Linux 内核开发者已开始拆除对 Intel 486 处理器的支持,相关补丁预计并入 Linux 7.1。按现有补丁内容,CONFIG_M486SX、CONFIG_M486 和 CONFIG_MELAN 等 Kconfig 构建选项将被移除,这意味着用户今后可能无法再构建 i486 内核镜像。
补丁作者 Ingo Molnar 表示,x86-32 为支持这些古老 32 位 CPU 保留了复杂的硬件仿真兼容机制,而现代内核中实际使用者极少,这些兼容代码有时还会带来额外维护问题。Linus Torvalds 此前也称,继续支持 486 已“没有真正的理由”。报道同时提到,仍在 486 平台上运行现代 Linux 的用户,如需继续使用,可能需要转向现有的 Linux LTS 内核。
Tom's Hardware
🌸 在花频道|茶馆讨论|投稿通道
🫡198👍26🤯8❤2😁2
Anthropic 宣布与谷歌和博通签署新协议,获得多吉瓦级下一代 TPU 算力,预计自 2027 年起陆续上线,用于支撑 Claude 前沿模型训练和全球客户需求。新增算力中的绝大部分将部署在美国,这也是其在 2025 年 11 月提出 500 亿美元美国计算基础设施投资承诺后的又一次扩张。
Anthropic 称,这是公司迄今最大规模的算力承诺。其 2026 年收入年化运行率已超过 300 亿美元,高于 2025 年底约 90 亿美元;年化支出超过 100 万美元的企业客户数量也已从今年 2 月披露的 500 多家增至目前的 1,000 多家。公司同时表示,将继续同时使用 AWS Trainium、谷歌 TPU 和英伟达 GPU,亚马逊仍是其主要云服务提供商和训练合作伙伴。
Anthropic
🌸 在花频道|茶馆讨论|投稿通道
Please open Telegram to view this post
VIEW IN TELEGRAM
🥴78👍16❤11🤪5😁2😴2🔥1
苹果公司已根据网信办(CAC)的要求,从中国区 App Store 下架了由 Twitter 联合创始人 Jack Dorsey 开发的去中心化通讯应用 Bitchat。网信办指出,该应用违反了《具有舆论属性或社会动员能力的互联网信息服务安全评估规定》第三条,即具有影响公众舆论或动员用户能力的应用在上线或更新前需通过安全评估。
目前,Jack Dorsey 已在 X 平台确认该应用已在中国区 App Store 下架。
编辑补充:Bitchat 采用基于蓝牙的对等网络(P2P)技术,无需服务器或账户即可实现匿名通信,因此在网络受限地区受到关注。
Jack Dorsey X 平台
🌸 在花频道|茶馆讨论|投稿通道
Please open Telegram to view this post
VIEW IN TELEGRAM
👎372🤣137🌭37👍18🌚15🙊5⚡4🙉2
Cursor 称以“warp decode”重构 MoE 解码后,Blackwell GPU 小批量推理吞吐提升 1.84 倍
Cursor 公布一项名为“warp decode”的 MoE 推理方案,称其在 Blackwell GPU 的小批量自回归解码场景中,将计算组织方式从“围绕专家”改为“围绕输出”,把传统路径中 8 个阶段里的 5 个数据整理环节去掉,并将整个 MoE 计算层压缩为两个 kernel。按文中说法,这一做法适用于小批量 decode,不是对专家中心执行方式的通用替代;在 prefill 和大批量推理中,后者仍然更有优势。
Cursor 称,该方案在其内部推理系统、基于 NVIDIA B200 GPU 运行的 Qwen-3 风格模型测试中,吞吐提升 1.84 倍,且输出结果与完整 FP32 参考相比“接近程度”提升 1.4 倍;在 B = 32 时可持续达到 3.95 TB/s 带宽,约为其测得 6.8 TB/s 峰值的 58 %。文中还称,warp decode 通过取消中间激活量化、减少中间缓冲区和跨 warp 同步,提升了生成阶段性能与数值精度。
Cursor
🌸 在花频道|茶馆讨论|投稿通道
Cursor 公布一项名为“warp decode”的 MoE 推理方案,称其在 Blackwell GPU 的小批量自回归解码场景中,将计算组织方式从“围绕专家”改为“围绕输出”,把传统路径中 8 个阶段里的 5 个数据整理环节去掉,并将整个 MoE 计算层压缩为两个 kernel。按文中说法,这一做法适用于小批量 decode,不是对专家中心执行方式的通用替代;在 prefill 和大批量推理中,后者仍然更有优势。
Cursor 称,该方案在其内部推理系统、基于 NVIDIA B200 GPU 运行的 Qwen-3 风格模型测试中,吞吐提升 1.84 倍,且输出结果与完整 FP32 参考相比“接近程度”提升 1.4 倍;在 B = 32 时可持续达到 3.95 TB/s 带宽,约为其测得 6.8 TB/s 峰值的 58 %。文中还称,warp decode 通过取消中间激活量化、减少中间缓冲区和跨 warp 同步,提升了生成阶段性能与数值精度。
Cursor
🌸 在花频道|茶馆讨论|投稿通道
🐳77❤7👀7👍3👎2😁1