Solidot
41.3K subscribers
26.9K links
solidot.org 非官方 RSS 推送频道。如有侵权,立即删除。
→ Buy Ads: https://telega.io/c/solidot
Download Telegram
OpenAI 被指控未经授权使用 O'Reilly 书籍训练 GPT-4o

2025-04-02 15:42 by 机械人生

AI Disclosures Project 发表的一篇论文认为,OpenAI 很可能未经授权使用 O'Reilly 书籍训练 GPT-4o 模型。AI Disclosures Project 由 O'Reilly Media CEO Tim O'Reilly 联合创办,它使用了名叫 DE-COP 的方法检测大语言模型训练数据中的版权内容。研究人员分析了 34 本 O'Reilly 书籍中的 13,962 个段落摘录,发现 GPT-4o “识别”的付费内容比 GPT-3.5 Turbo 等旧模型多得多。这项技术也被称为“成员推理攻击(membership inference attack)”,用于测试模型是否能可靠区分人类创作的文本和转述版本。

ssrc-static.s3.us-east-1.amazonaws.com/OpenAI-Training-Violations-OReillyBooks_Sruly-OReilly-Strauss_SSRC_04012025.pdf

#人工智能
微软 CTO 预测五年内 95% 的代码由 AI 生成

2025-04-03 17:41 by 星空暗流

微软 CTO Kevin Scott 预测五年内 95% 的代码将由 AI 生成。他表示,AI 不会取代软件工程师,但会改变他们的角色。“这并不意味着 AI 在做软件工程工作……作者仍然是人类。” Scott 称开发者的工作将从直接编写代码转变为通过提示和指令指导 AI,“我们从输入大师(编程语言)转变为提示大师(AI 协调者)。”

/.:95% of Code Will Be AI-Generated Within Five Years, Microsoft CTO Says

#人工智能
Meta 宣布最新模型 Llama 4 herd

2025-04-06 23:11 by 时间的地图

Meta 宣布了其最新的开放权重原生多模模型 Llama 4 Scout 和 Llama 4 Maverick。新模型使用了混合专家架构(mixture-of-experts)构建,每个有 170 亿活跃参数。Llama 4 Scout 有 16 个专家,适合单个 NVIDIA H100 GPU,提供了 1000 万上下文窗口,性能强于 Gemma 3、Gemini 2.0 Flash-Lite 和 Mistral 3.1。Llama 4 Maverick 有 128 个专家,在基准测试中超过 GPT-4o 和 Gemini 2.0 Flash,在 LMArena 的 ELO 得分为 1417,它适合单台 H100 主机。Meta 还训练了一个教师模型 Llama 4 Behemoth,它有 16 个专家和 2880 亿个活跃参数,在多项 STEM 测试中超过了 GPT-4.5、Claude Sonnet 3.7 和 Gemini 2.0 Pro,该模型仍然在训练中。最新模型通过 llama.com 和 Hugging Face 提供下载。

Meta AI- The Llama 4 herd: The beginning of a new era of natively multimodal AI innovation

#人工智能
Midjourney 发布新模型 V7

2025-04-07 11:31 by 洛基启示录

Midjourney 在时隔一年多之后发布新模型 V7,目前以 alpha 形式提供给用户。V7 改进了图像生成,为手、手指、身体部位和“各种对象”提供了更高的连贯性和一致性,还能提供细节更丰富和逼真的纹理和材质。V7 还提供了新工具和工作流,其中之一是用于迭代和探索的 Draft Mode,费用只需一半但渲染速度提高十倍。V7 有两种模式——turbo 和 relax,其中 turbo 能更快生成最终图像,但费用提高了一倍;而 relax 生成图像的速度很慢,但费用也低。Midjourney 是最早广泛使用的 AI 图像生成工具之一。最初只通过 Discord 提供给用户,现在有了 Web 版本。

Midjourney:updates/v7-alpha

#人工智能
多数美国公众不相信 AI 能改善他们的生活

2025-04-07 22:30 by 平行恋人

多数美国普通民众不相信 AI 能改善他们的生活,AI 专家则乐观得多。皮尤研究中心调查了 5410 普通民众和 1013 名 AI 专家对 AI 的态度。结果显示,56% 的 AI 专家相信 AI 将在未来 20 年对美国产生非常或相当积极的影响,在普通民众中间这一比例仅为 17%;76% 的专家认为 AI 将让他们个人受益而不是伤害他们。只有 11% 的民众对 AI 在日常生活中使用增加感到兴奋多于担忧,51% 更感到担忧,只有 24% 的民众认为 AI 能让他们受益,近半数民众认为 AI 会伤害他们。

Ars:Most Americans think AI won’t improve their lives, survey says
Pew Research Center:How the U.S. Public and AI Experts View Artificial Intelligence

#人工智能
中美 AI 差距仅为 0.3%

2025-04-08 18:03 by 追光的孩子

根据斯坦福最新的 2025 年 AI 指数报告,中美顶级 AI 模型的性能差距已缩小到了 0.3%,而在 2023 年差距是 20%,中国模型正在快速追赶美国的领先地位。从行业主导企业来看,美国仍然领先于中国。在 2024 年 90% 的知名 AI 模型来自企业,美国以 40 个模型领先,中国有 15 个。更明显的一个趋势是如今大模型的性能已经趋同。在 2024 年,TOP1 和 TOP10 的模型的差距能有 12%,如今差距已经越来越小,锐减至 5%。

Stanford HAI The 2025 AI Index Report

澎湃:斯坦福2025 AI指数出炉!中美AI终极对决差距仅剩0.3%,DeepSeek领衔

#人工智能
微软真的准备推出 Recall

2025-04-11 22:30 by 没有你的天堂

微软开始逐步向 Windows Insiders 推出 Recall 预览版,该功能会每隔数秒保存 Copilot Plus PC 上的屏幕截图,在本地创造可搜索数字记忆。此举可能表明微软真的准备向更多用户推出受争议的 Recall 功能了。微软原计划于去年 6 月与 Copilot Plus PC 一起推出 Recall,但由于隐私和安全方面的担忧,该功能推迟推出。微软之后计划于 10 月推出该功能,但为了提供“安全可靠的体验”,该计划也被推迟了。

/.:Microsoft is About To Launch Recall For Real This Time

#人工智能
OpenAI API 可能要求客户验证身份

2025-04-14 14:58 by 空中城堡

根据 OpenAI 支持页面“API Organization Verification”,OpenAI 可能很快要求组织完成身份验证才能访问某些先进 AI 模型。验证需要 OpenAI API 所支持的国家政府签发的身份证件。OpenAI 表示一个身份证件每 90 天只能验证一个组织,而且不是所有组织都有资格进行验证。OpenAI 声称此举是为了减少 AI 的不安全使用。它的一个目的可能是防止 IP 盗窃。DeepSeek 此前被指使用 OpenAI API 训练了它的模型,这违反了 OpenAI 的政策。

OpenAI:API Organization Verification
Techcrunch:Access to future AI models in OpenAI’s API may require a verified ID

#人工智能
美国主要 AI 公司六成其创始人有移民背景

2025-04-16 23:16 by 守卫者

Institute for Progress 分析了 Forbes AI 2025 名单中排名靠前的 AI 相关创业公司,在 42 家总部位于美国的 AI 创业公司中,六成或 25 家 AI 创业公司其创始人或联合创始人有移民背景。这些创始人来自 25 个国家,其中印度有 9 位,中国有 8 位,法国有 3 位,澳大利亚、英国、加拿大、以色列、罗马尼亚和智利各有两位。OpenAI 的联合创始人包括了南非的 Elon Musk 和俄罗斯的 Ilya Sutskever;Databricks 的联合创始人分别出生于伊朗、罗马尼亚和中国。研究凸显了移民对美国科技行业和整体经济的贡献。

/.:Immigrant Founders Are the Norm in Key US AI Firms: Study

#人工智能
微软开发出超高效的能运行在 CPU 上的 AI 模型

2025-04-17 18:05 by 森林送信人

微软研究人员声称,他们开发出迄今为止规模最大的 1 位 AI 模型 bitnet。该模型命名为 BitNet b1.58 2B4T,采用 MIT 许可证发布,能在包括苹果 M2 处理器在内的各种 CPU 上运行。大模型是通过修改人工神经元之间的连接强度进行训练,连接强度以数学参数的形式储存。通过减少参数的精度研究人员能压缩网络,这一过程被称为量化,参数的位数能从 16 位减少到 8 或 4 位,研究人员正致力于将其推向极限——以 1 位精度储存参数。压缩能让模型在低端硬件上运行。bitnet 将权重量化为三个值:-1、0 和 1,其内存和计算效率远高于大多数模型。BitNet b1.58 2B4T 是首个拥有 20 亿个参数的 bitnet,测试中该模型在包括 GSM8K(小学水平数学题库)和 PIQA(测试物理常识推理能力)的测试中超过了 Meta 的 Llama 3.2 1B、Google 的 Gemma 3 1B 和阿里巴巴的 Qwen 2.5 1.5B。

www.solidot.org/story?sid=78323
arxiv.org/abs/2504.12285 BitNet b1.58 2B4T Technical Report
TC:Microsoft researchers say they’ve developed a hyper-efficient AI model that can run on CPUs

#人工智能
OpenAI 新推理模型有更高的幻觉比例

2025-04-19 23:08 by 无敌号

根据内外部测试,OpenAI 最新推理模型 o3 和 o4-mini 比该公司之前的模型出现幻觉的概率更高。在 OpenAI 的 PersonQA 测试中,o3 出现幻觉的概率高达 33%,两倍于旧模型 o1(16%)和 o3-mini(14.8%)。o4-mini 更糟糕出现幻觉的概率高达 48%。斯坦福大学兼职教授 Kian Katanforoosh 指出他的团队发现 o3 常生成无效网址。OpenAI 表示需要更多研究去理解为什么随着推理模型规模的扩大,幻觉现象会加剧。

/.:OpenAI Puzzled as New Models Show Rising Hallucination Rates

#人工智能
研究发现五成员工使用未批准的 AI 工具

2025-04-19 23:32 by 一九八四

Software AG 的一项研究发现有多达五成员工使用未批准的 AI 工具。今天的 AI 工具非常容易获得,而企业也日益鼓励员工使用 AI 工具提高工作效率。无论是总结会议记录、起草客户邮件、探索代码还是创建内容,企业员工正在快速普及 AI。即使企业出于安全担忧内部限制员工使用 AI 工具,他们也可以通过浏览器访问 AI 工具的 Web 版本。分析显示最流行的 AI 工具是 ChatGPT,还有部分员工会使用中国公司开发的 AI 工具如 DeepSeek、Baidu Chat 和 Qwen。

The AI Tightrope: Balancing Innovation and Exposure in the Enterprise
SecurityWeek: The Shadow AI Surge: Study Finds 50% of Workers Use Unapproved AI Tools

#人工智能
Google Gemini 有 3.5 亿月活用户

2025-04-24 15:59 by 图书馆员与追寻鹅妈妈

根据正在进行中的 Google 反垄断诉讼披露的内部数据,截至今年 3 月 Google 的 AI 聊天机器人 Gemini 全球有 3.5 亿月活跃用户。Gemini 去年 10 月的日活用户仅为 900 万,但今年 3 月已经增加到了 3500 万。根据法庭文件,Google 估计 ChatGPT 的月活用户为 6 亿。ChatGPT 是目前最受欢迎的 AI 聊天机器人。

TechCrunch Google Gemini has 350M monthly users, reveals court hearing

#人工智能
用户使用 AI 的需求发生了改变

2025-04-24 18:29 by 发条女孩

根据数据分析师 Marc Zao-Sanders 的分析,在 2024-2025 年 AI 使用场景前 30 名榜单中,“获取专业或个人支持”已成为 2025 年 AI 应用的最常见场景,“疗愈和陪伴”超越 2024 年排名第 1 的“创意生成”功能,首次进入榜单的新需求“整理生活”与“寻找人生方向”紧随其后。传统热门用途“具体搜索”和“创意生成”等需求的热度有所下降。其中 2024 年排名第 3 的“具体搜索”则在今年跌出前 10。分析指出,这可能与生成式AI被集成至主流搜索引擎(如 Gemini 被整合进 Google)有关,用户已不再单纯依赖 AI 进行查询,而更多将其作为认知辅助工具使用。

澎湃:和去年相比,人们使用AI的需求发生了哪些变化?
Hbr:How People Are Really Using Gen AI in 2025

#人工智能
DeepMind 发布 Lyria 2 音乐生成模型

2025-04-25 14:56 by 羊毛战记

DeepMind 宣布发布 Lyria 2 音乐生成模型。第一代的音乐生成模型 Lyria 是在 2023 年发布的。Lyria 2 能提供高保真音乐和专业级音频输出,能捕捉不同音乐类型和复杂乐曲中的细微差别。Google 还同时开发了 Lyria RealTime,允许用户实时交互式地创作、演奏和控制音乐,混合不同音乐类型、融合不同风格,随时塑造音频。

deepmind.google:Music AI Sandbox, now with new features and broader access

#人工智能
微软向 Copilot+ PC 推送 Windows Recall 功能

2025-04-26 23:35 by 黄泉归来

在宣布近一年之后,微软通过 Windows Experience Blog 宣布开始向 Copilot+ PC 用户推送受争议的 AI 功能
Windows Recall。Recall 会每隔数秒截取屏幕截图,将其与提取的文本一起储存在本地的可搜索数据库内。该功能因安全隐私方面的争议而多次推迟推出。微软通过修改解决了大部分问题,改进了安全保护措施,优化了敏感信息的内容过滤,最重要的是该功能是 opt-in 而不是 opt-out——即用户选择加入而不是默认启用选择退出。

Windows Experience Blog:Copilot+ PCs are the most performant Windows PCs ever built, now with more AI features that empower you every day

#人工智能
DeepSeek 在韩国应用商店重新上架

2025-04-28 17:26 by 图书馆员与遗失的神灯

DeepSeek 更新了韩文版《个人信息处理方针》,在韩国应用商店重新上架。新的条款表示将在韩国《个人信息保护法》下处理个人信息,标明公司将用户个人信息转移至3家在华企业和 1 家在美企业,用户有权拒绝转移个人信息。上周韩国监管机构个人信息保护委员会发布了调查报告,称 DeepSeek未经同意将用户个人信息转移至境外,也未公开相关处理方针,并将用户在聊天框中输入的提示信息擅自传输至 TikTok 母公司字节跳动旗下云服务平台火山引擎。DeepSeek 是在 2 月中旬从韩国应用商店下架。

DeepSeek available to download again in South Korea after suspension

#人工智能
阿里发布新开源权重模型 Qwen3

2025-04-29 15:24 by 再会,谢谢所有的鱼

阿里巴巴宣布了 Qwen 系列最新模型 Qwen3。阿里称 Qwen3 是其首个具备快思考与慢思考能力的混合推理大模型,采用混合专家(MoE)架构,能模仿人类思考问题的方式,对复杂问题可多步骤“深度思考”,对简单需求可低算力“秒回”答案,极大节省算力消耗。阿里称,旗舰模型 Qwen3-235B-A22B 在代码、数学、通用能力等基准测试中,与 DeepSeek-R1、o1、o3-mini、Grok-3 和 Gemini-2.5-Pro 等顶级模型相比,表现出极具竞争力的结果。小型 MoE 模型 Qwen3-30B-A3B 的激活参数数量是 QwQ-32B 的 10%,表现更胜一筹,甚至像 Qwen3-4B 这样的小模型也能匹敌 Qwen2.5-72B-Instruct 的性能。阿里巴巴开源了两个 MoE 模型的权重:Qwen3-235B-A22B,一个拥有 2350 多亿总参数和 220 多亿激活参数的大模型,以及Qwen3-30B-A3B,一个拥有约 300 亿总参数和 30 亿激活参数的小型 MoE 模型。此外,六个 Dense 模型也已开源,包括 Qwen3-32B、Qwen3-14B、Qwen3-8B、Qwen3-4B、Qwen3-1.7B 和 Qwen3-0.6B,均在 Apache 2.0 许可下开源。

github.com/QwenLM/Qwen3
qwenlm.github.io/zh/blog/qwen3/

#人工智能
经济学家发现生成式 AI 没有取代工作或影响薪水

2025-04-29 22:13 by 基因突变

研究发现,生成式 AI 如 ChatGPT、Claude 和 Gemini 并没有取代人类工作或者降低人类员工的薪水。这一发现质疑了构建和运营生成式 AI 的高昂资本支出。经济学家 Anders Humlum 和 Emilie Vestergaard 研究了 AI 聊天机器人对丹麦 11 个职业的影响。会计师、客户支持专家、财务顾问、人力资源、IT 支持专家、记者、法务、市场营销、办公室文员、程序员和教师等职业被认为易受 AI 影响。但研究结果显示, AI 聊天机器人对劳动力市场和薪水的影响微乎其微,没有观察到存在显著影响。科技行业一直再宣称 AI 的经济潜力,企业投入了数十亿美元建设支持 AI 的基础设施。问题不在于员工们回避生成式 AI 聊天机器人,而是它们尚未转化为实际的经济效益。

theregister:Generative AI is not replacing jobs or hurting wages at all, say economists

papers.ssrn.com/sol3/papers.cfm?abstract_id=5219933

#人工智能
微软 CEO 声称该公司三成新代码是用 AI 写的

2025-05-01 23:54 by 女神觉醒

微软 CEO Satya Nadella 出席了 Meta 的 LlamaCon 大会,与 Meta CEO Mark Zuckerberg 交谈时称该公司三成新代码是用 AI 写的。此前 Google CEO Sundar Pichai 也曾给出了类似的数据。在 LlamaCon 大会上,Zuckerberg 询问微软有多少代码是 AI 生成的,Nadella 给出了这一数字,他表示不同编程语言中 AI 生成代码的结果参差不齐,Python 中进步更快,而 C++ 进步较慢。

/.:Microsoft CEO Says Up To 30% of the Company's Code Was Written by AI

#人工智能