Solidot – Telegram

Solidot

41.3K subscribers

26.9K links

solidot.org 非官方 RSS 推送频道。如有侵权，立即删除。
→ Buy Ads: https://telega.io/c/solidot

Download Telegram

About

Blog

Apps

Platform

41.3K subscribers

OpenAI 被指控未经授权使用 O'Reilly 书籍训练 GPT-4o

2025-04-02 15:42 by 机械人生

AI Disclosures Project 发表的一篇论文认为，OpenAI 很可能未经授权使用 O'Reilly 书籍训练 GPT-4o 模型。AI Disclosures Project 由 O'Reilly Media CEO Tim O'Reilly 联合创办，它使用了名叫 DE-COP 的方法检测大语言模型训练数据中的版权内容。研究人员分析了 34 本 O'Reilly 书籍中的 13,962 个段落摘录，发现 GPT-4o “识别”的付费内容比 GPT-3.5 Turbo 等旧模型多得多。这项技术也被称为“成员推理攻击（membership inference attack）”，用于测试模型是否能可靠区分人类创作的文本和转述版本。

ssrc-static.s3.us-east-1.amazonaws.com/OpenAI-Training-Violations-OReillyBooks_Sruly-OReilly-Strauss_SSRC_04012025.pdf

#人工智能

3.7K views14:40

微软 CTO 预测五年内 95% 的代码由 AI 生成

2025-04-03 17:41 by 星空暗流

微软 CTO Kevin Scott 预测五年内 95% 的代码将由 AI 生成。他表示，AI 不会取代软件工程师，但会改变他们的角色。“这并不意味着 AI 在做软件工程工作……作者仍然是人类。” Scott 称开发者的工作将从直接编写代码转变为通过提示和指令指导 AI，“我们从输入大师（编程语言）转变为提示大师（AI 协调者）。”

/.:95% of Code Will Be AI-Generated Within Five Years, Microsoft CTO Says

#人工智能

3.8K views16:25

Meta 宣布最新模型 Llama 4 herd

2025-04-06 23:11 by 时间的地图

Meta 宣布了其最新的开放权重原生多模模型 Llama 4 Scout 和 Llama 4 Maverick。新模型使用了混合专家架构（mixture-of-experts）构建，每个有 170 亿活跃参数。Llama 4 Scout 有 16 个专家，适合单个 NVIDIA H100 GPU，提供了 1000 万上下文窗口，性能强于 Gemma 3、Gemini 2.0 Flash-Lite 和 Mistral 3.1。Llama 4 Maverick 有 128 个专家，在基准测试中超过 GPT-4o 和 Gemini 2.0 Flash，在 LMArena 的 ELO 得分为 1417，它适合单台 H100 主机。Meta 还训练了一个教师模型 Llama 4 Behemoth，它有 16 个专家和 2880 亿个活跃参数，在多项 STEM 测试中超过了 GPT-4.5、Claude Sonnet 3.7 和 Gemini 2.0 Pro，该模型仍然在训练中。最新模型通过 llama.com 和 Hugging Face 提供下载。

Meta AI- The Llama 4 herd: The beginning of a new era of natively multimodal AI innovation

#人工智能

4.3K views02:30

Midjourney 发布新模型 V7

2025-04-07 11:31 by 洛基启示录

Midjourney 在时隔一年多之后发布新模型 V7，目前以 alpha 形式提供给用户。V7 改进了图像生成，为手、手指、身体部位和“各种对象”提供了更高的连贯性和一致性，还能提供细节更丰富和逼真的纹理和材质。V7 还提供了新工具和工作流，其中之一是用于迭代和探索的 Draft Mode，费用只需一半但渲染速度提高十倍。V7 有两种模式——turbo 和 relax，其中 turbo 能更快生成最终图像，但费用提高了一倍；而 relax 生成图像的速度很慢，但费用也低。Midjourney 是最早广泛使用的 AI 图像生成工具之一。最初只通过 Discord 提供给用户，现在有了 Web 版本。

Midjourney：updates/v7-alpha

#人工智能

4.4K views07:40

多数美国公众不相信 AI 能改善他们的生活

2025-04-07 22:30 by 平行恋人

多数美国普通民众不相信 AI 能改善他们的生活，AI 专家则乐观得多。皮尤研究中心调查了 5410 普通民众和 1013 名 AI 专家对 AI 的态度。结果显示，56% 的 AI 专家相信 AI 将在未来 20 年对美国产生非常或相当积极的影响，在普通民众中间这一比例仅为 17%；76% 的专家认为 AI 将让他们个人受益而不是伤害他们。只有 11% 的民众对 AI 在日常生活中使用增加感到兴奋多于担忧，51% 更感到担忧，只有 24% 的民众认为 AI 能让他们受益，近半数民众认为 AI 会伤害他们。

Ars:Most Americans think AI won’t improve their lives, survey says
Pew Research Center:How the U.S. Public and AI Experts View Artificial Intelligence

#人工智能

3.6K views02:50

中美 AI 差距仅为 0.3%

2025-04-08 18:03 by 追光的孩子

根据斯坦福最新的 2025 年 AI 指数报告，中美顶级 AI 模型的性能差距已缩小到了 0.3%，而在 2023 年差距是 20%，中国模型正在快速追赶美国的领先地位。从行业主导企业来看，美国仍然领先于中国。在 2024 年 90% 的知名 AI 模型来自企业，美国以 40 个模型领先，中国有 15 个。更明显的一个趋势是如今大模型的性能已经趋同。在 2024 年，TOP1 和 TOP10 的模型的差距能有 12%，如今差距已经越来越小，锐减至 5%。

Stanford HAI The 2025 AI Index Report

澎湃:斯坦福2025 AI指数出炉！中美AI终极对决差距仅剩0.3%，DeepSeek领衔

#人工智能

3.6K views15:05

微软真的准备推出 Recall

2025-04-11 22:30 by 没有你的天堂

微软开始逐步向 Windows Insiders 推出 Recall 预览版，该功能会每隔数秒保存 Copilot Plus PC 上的屏幕截图，在本地创造可搜索数字记忆。此举可能表明微软真的准备向更多用户推出受争议的 Recall 功能了。微软原计划于去年 6 月与 Copilot Plus PC 一起推出 Recall，但由于隐私和安全方面的担忧，该功能推迟推出。微软之后计划于 10 月推出该功能，但为了提供“安全可靠的体验”，该计划也被推迟了。

/.:Microsoft is About To Launch Recall For Real This Time

#人工智能

4.0K views11:00

OpenAI API 可能要求客户验证身份

2025-04-14 14:58 by 空中城堡

根据 OpenAI 支持页面“API Organization Verification”，OpenAI 可能很快要求组织完成身份验证才能访问某些先进 AI 模型。验证需要 OpenAI API 所支持的国家政府签发的身份证件。OpenAI 表示一个身份证件每 90 天只能验证一个组织，而且不是所有组织都有资格进行验证。OpenAI 声称此举是为了减少 AI 的不安全使用。它的一个目的可能是防止 IP 盗窃。DeepSeek 此前被指使用 OpenAI API 训练了它的模型，这违反了 OpenAI 的政策。

OpenAI:API Organization Verification
Techcrunch:Access to future AI models in OpenAI’s API may require a verified ID

#人工智能

3.7K views09:35

美国主要 AI 公司六成其创始人有移民背景

2025-04-16 23:16 by 守卫者

Institute for Progress 分析了 Forbes AI 2025 名单中排名靠前的 AI 相关创业公司，在 42 家总部位于美国的 AI 创业公司中，六成或 25 家 AI 创业公司其创始人或联合创始人有移民背景。这些创始人来自 25 个国家，其中印度有 9 位，中国有 8 位，法国有 3 位，澳大利亚、英国、加拿大、以色列、罗马尼亚和智利各有两位。OpenAI 的联合创始人包括了南非的 Elon Musk 和俄罗斯的 Ilya Sutskever；Databricks 的联合创始人分别出生于伊朗、罗马尼亚和中国。研究凸显了移民对美国科技行业和整体经济的贡献。

/.:Immigrant Founders Are the Norm in Key US AI Firms: Study

#人工智能

4.3K views02:15

微软开发出超高效的能运行在 CPU 上的 AI 模型

2025-04-17 18:05 by 森林送信人

微软研究人员声称，他们开发出迄今为止规模最大的 1 位 AI 模型 bitnet。该模型命名为 BitNet b1.58 2B4T，采用 MIT 许可证发布，能在包括苹果 M2 处理器在内的各种 CPU 上运行。大模型是通过修改人工神经元之间的连接强度进行训练，连接强度以数学参数的形式储存。通过减少参数的精度研究人员能压缩网络，这一过程被称为量化，参数的位数能从 16 位减少到 8 或 4 位，研究人员正致力于将其推向极限——以 1 位精度储存参数。压缩能让模型在低端硬件上运行。bitnet 将权重量化为三个值：-1、0 和 1，其内存和计算效率远高于大多数模型。BitNet b1.58 2B4T 是首个拥有 20 亿个参数的 bitnet，测试中该模型在包括 GSM8K（小学水平数学题库）和 PIQA（测试物理常识推理能力）的测试中超过了 Meta 的 Llama 3.2 1B、Google 的 Gemma 3 1B 和阿里巴巴的 Qwen 2.5 1.5B。

www.solidot.org/story?sid=78323
arxiv.org/abs/2504.12285 BitNet b1.58 2B4T Technical Report
TC:Microsoft researchers say they’ve developed a hyper-efficient AI model that can run on CPUs

#人工智能

3.9K views10:55

OpenAI 新推理模型有更高的幻觉比例

2025-04-19 23:08 by 无敌号

根据内外部测试，OpenAI 最新推理模型 o3 和 o4-mini 比该公司之前的模型出现幻觉的概率更高。在 OpenAI 的 PersonQA 测试中，o3 出现幻觉的概率高达 33%，两倍于旧模型 o1（16%）和 o3-mini（14.8%）。o4-mini 更糟糕出现幻觉的概率高达 48%。斯坦福大学兼职教授 Kian Katanforoosh 指出他的团队发现 o3 常生成无效网址。OpenAI 表示需要更多研究去理解为什么随着推理模型规模的扩大，幻觉现象会加剧。

/.:OpenAI Puzzled as New Models Show Rising Hallucination Rates

#人工智能

4.3K views14:25

研究发现五成员工使用未批准的 AI 工具

2025-04-19 23:32 by 一九八四

Software AG 的一项研究发现有多达五成员工使用未批准的 AI 工具。今天的 AI 工具非常容易获得，而企业也日益鼓励员工使用 AI 工具提高工作效率。无论是总结会议记录、起草客户邮件、探索代码还是创建内容，企业员工正在快速普及 AI。即使企业出于安全担忧内部限制员工使用 AI 工具，他们也可以通过浏览器访问 AI 工具的 Web 版本。分析显示最流行的 AI 工具是 ChatGPT，还有部分员工会使用中国公司开发的 AI 工具如 DeepSeek、Baidu Chat 和 Qwen。

The AI Tightrope: Balancing Innovation and Exposure in the Enterprise
SecurityWeek: The Shadow AI Surge: Study Finds 50% of Workers Use Unapproved AI Tools

#人工智能

4.2K views14:25

Google Gemini 有 3.5 亿月活用户

2025-04-24 15:59 by 图书馆员与追寻鹅妈妈

根据正在进行中的 Google 反垄断诉讼披露的内部数据，截至今年 3 月 Google 的 AI 聊天机器人 Gemini 全球有 3.5 亿月活跃用户。Gemini 去年 10 月的日活用户仅为 900 万，但今年 3 月已经增加到了 3500 万。根据法庭文件，Google 估计 ChatGPT 的月活用户为 6 亿。ChatGPT 是目前最受欢迎的 AI 聊天机器人。

TechCrunch Google Gemini has 350M monthly users, reveals court hearing

#人工智能

3.9K views08:05

用户使用 AI 的需求发生了改变

2025-04-24 18:29 by 发条女孩

根据数据分析师 Marc Zao-Sanders 的分析，在 2024-2025 年 AI 使用场景前 30 名榜单中，“获取专业或个人支持”已成为 2025 年 AI 应用的最常见场景，“疗愈和陪伴”超越 2024 年排名第 1 的“创意生成”功能，首次进入榜单的新需求“整理生活”与“寻找人生方向”紧随其后。传统热门用途“具体搜索”和“创意生成”等需求的热度有所下降。其中 2024 年排名第 3 的“具体搜索”则在今年跌出前 10。分析指出，这可能与生成式AI被集成至主流搜索引擎（如 Gemini 被整合进 Google）有关，用户已不再单纯依赖 AI 进行查询，而更多将其作为认知辅助工具使用。

澎湃：和去年相比，人们使用AI的需求发生了哪些变化？
Hbr：How People Are Really Using Gen AI in 2025

#人工智能

3.3K views15:55

DeepMind 发布 Lyria 2 音乐生成模型

2025-04-25 14:56 by 羊毛战记

DeepMind 宣布发布 Lyria 2 音乐生成模型。第一代的音乐生成模型 Lyria 是在 2023 年发布的。Lyria 2 能提供高保真音乐和专业级音频输出，能捕捉不同音乐类型和复杂乐曲中的细微差别。Google 还同时开发了 Lyria RealTime，允许用户实时交互式地创作、演奏和控制音乐，混合不同音乐类型、融合不同风格，随时塑造音频。

deepmind.google：Music AI Sandbox, now with new features and broader access

#人工智能

3.8K views07:35

微软向 Copilot+ PC 推送 Windows Recall 功能

2025-04-26 23:35 by 黄泉归来

在宣布近一年之后，微软通过 Windows Experience Blog 宣布开始向 Copilot+ PC 用户推送受争议的 AI 功能
Windows Recall。Recall 会每隔数秒截取屏幕截图，将其与提取的文本一起储存在本地的可搜索数据库内。该功能因安全隐私方面的争议而多次推迟推出。微软通过修改解决了大部分问题，改进了安全保护措施，优化了敏感信息的内容过滤，最重要的是该功能是 opt-in 而不是 opt-out——即用户选择加入而不是默认启用选择退出。

Windows Experience Blog:Copilot+ PCs are the most performant Windows PCs ever built, now with more AI features that empower you every day

#人工智能

4.5K views23:40

DeepSeek 在韩国应用商店重新上架

2025-04-28 17:26 by 图书馆员与遗失的神灯

DeepSeek 更新了韩文版《个人信息处理方针》，在韩国应用商店重新上架。新的条款表示将在韩国《个人信息保护法》下处理个人信息，标明公司将用户个人信息转移至3家在华企业和 1 家在美企业，用户有权拒绝转移个人信息。上周韩国监管机构个人信息保护委员会发布了调查报告，称 DeepSeek未经同意将用户个人信息转移至境外，也未公开相关处理方针，并将用户在聊天框中输入的提示信息擅自传输至 TikTok 母公司字节跳动旗下云服务平台火山引擎。DeepSeek 是在 2 月中旬从韩国应用商店下架。

DeepSeek available to download again in South Korea after suspension

#人工智能

3.5K views14:20

阿里发布新开源权重模型 Qwen3

2025-04-29 15:24 by 再会，谢谢所有的鱼

阿里巴巴宣布了 Qwen 系列最新模型 Qwen3。阿里称 Qwen3 是其首个具备快思考与慢思考能力的混合推理大模型，采用混合专家（MoE）架构，能模仿人类思考问题的方式，对复杂问题可多步骤“深度思考”，对简单需求可低算力“秒回”答案，极大节省算力消耗。阿里称，旗舰模型 Qwen3-235B-A22B 在代码、数学、通用能力等基准测试中，与 DeepSeek-R1、o1、o3-mini、Grok-3 和 Gemini-2.5-Pro 等顶级模型相比，表现出极具竞争力的结果。小型 MoE 模型 Qwen3-30B-A3B 的激活参数数量是 QwQ-32B 的 10%，表现更胜一筹，甚至像 Qwen3-4B 这样的小模型也能匹敌 Qwen2.5-72B-Instruct 的性能。阿里巴巴开源了两个 MoE 模型的权重：Qwen3-235B-A22B，一个拥有 2350 多亿总参数和 220 多亿激活参数的大模型，以及Qwen3-30B-A3B，一个拥有约 300 亿总参数和 30 亿激活参数的小型 MoE 模型。此外，六个 Dense 模型也已开源，包括 Qwen3-32B、Qwen3-14B、Qwen3-8B、Qwen3-4B、Qwen3-1.7B 和 Qwen3-0.6B，均在 Apache 2.0 许可下开源。

github.com/QwenLM/Qwen3
qwenlm.github.io/zh/blog/qwen3/

#人工智能

3.3K views01:00

经济学家发现生成式 AI 没有取代工作或影响薪水

2025-04-29 22:13 by 基因突变

研究发现，生成式 AI 如 ChatGPT、Claude 和 Gemini 并没有取代人类工作或者降低人类员工的薪水。这一发现质疑了构建和运营生成式 AI 的高昂资本支出。经济学家 Anders Humlum 和 Emilie Vestergaard 研究了 AI 聊天机器人对丹麦 11 个职业的影响。会计师、客户支持专家、财务顾问、人力资源、IT 支持专家、记者、法务、市场营销、办公室文员、程序员和教师等职业被认为易受 AI 影响。但研究结果显示， AI 聊天机器人对劳动力市场和薪水的影响微乎其微，没有观察到存在显著影响。科技行业一直再宣称 AI 的经济潜力，企业投入了数十亿美元建设支持 AI 的基础设施。问题不在于员工们回避生成式 AI 聊天机器人，而是它们尚未转化为实际的经济效益。

theregister：Generative AI is not replacing jobs or hurting wages at all, say economists

papers.ssrn.com/sol3/papers.cfm?abstract_id=5219933

#人工智能

2.9K views01:00

微软 CEO 声称该公司三成新代码是用 AI 写的

2025-05-01 23:54 by 女神觉醒

微软 CEO Satya Nadella 出席了 Meta 的 LlamaCon 大会，与 Meta CEO Mark Zuckerberg 交谈时称该公司三成新代码是用 AI 写的。此前 Google CEO Sundar Pichai 也曾给出了类似的数据。在 LlamaCon 大会上，Zuckerberg 询问微软有多少代码是 AI 生成的，Nadella 给出了这一数字，他表示不同编程语言中 AI 生成代码的结果参差不齐，Python 中进步更快，而 C++ 进步较慢。

/.:Microsoft CEO Says Up To 30% of the Company's Code Was Written by AI

#人工智能

3.6K views01:00