Newlearnerの自留地
61.5K subscribers
14K photos
43 videos
63 files
10.7K links
🆕 不定期推送 IT 相关资讯,欢迎关注!

👥 博客群&投稿群&交流群: @NewlearnerGroup

📩 投稿请私信 @newlearner_pm_bot

🔍 频道内容关键词索引 Bot: @newlearner_search_bot

* 未经授权或标注来源,不得转载本频道内容
Download Telegram
#Blog #AI

🧑🏻‍💻 你不知道的大模型训练:原理、路径与新实践

🔗X Article

今天这篇是「你不知道的」系列第三篇,写完 Claude Code 和 Agent 之后,想着继续挑战一下,把大模型训练到底怎么回事梳理清楚,尽量让非专业背景的人也能读懂。

刚开始我也以为模型变强就是参数堆大、数据喂多。后来发现用户真正感受到的那些提升,大部分不是来自预训练,而是来自它后面那整套流程:后训练、评测、奖励、Agent 训练、蒸馏,每一层都在影响最终体感。InstructGPT 当年有个数字,1.3B 做过对齐的模型,人类偏好评测里能赢过 175B 的 GPT-3,差了两个数量级,但用户更喜欢那个小的。

这篇文章想聊清楚这几个点:训练为什么是条流水线、数据配方怎么决定能力分布、系统约束为什么要在训练前就想清楚、后训练到底在调什么、奖励模型和 RLHF 怎么回事、蒸馏怎么把大模型能力压进小模型,以及 Agent 训练和部署侧还有哪些工程现实。

频道:@NewlearnerChannel
3👍1
#News

🌃 自留地晚报 【4.8】

1️⃣ MacRumors 报道称,Apple 正在与供应链展开谈判,应对 MacBook Neo 笔记本销量超出预期带来的重大难题,A18 Pro 库存告急

2️⃣ Anthropic 发布前沿 AI 模型 Claude Mythos Preview 用于网络防御,该项目汇聚苹果、英伟达、微软、亚马逊云服务谷歌、Linux 基金会等 11 家科技巨头

3️⃣ DeepSeek 网页端悄然更新,输入框上方新增「快速模式」与「专家模式」,后者更擅长处理复杂问题

4️⃣ Wired 报道称,前苹果资深员工 Megen Leigh 接受采访表示,Vision Pro 首发前 Apple 进行严格培训,但因零售端人员体系等问题没有妥善执行,带来的体验参差不齐

5️⃣ Uber 与 AWS 达成合作,利用 AWS Graviton 实例驱动出行,并试点使用 Trainium 芯片训练部分 AI 模型,实现更快司机匹配、个性化用户体验

6️⃣ 联想 官宣,品牌首款大折叠手机 razr fold 将在 5 月发布,支持 moto pen ultra AI 手写笔

7️⃣ Xbox 公布 4 月初 XGP 会免阵容:含 《黑帝斯 2》《使命召唤:现代战争》《最终幻想 4》《NBA 2K26》等

频道:@NewlearnerChannel
8
#News

☀️ 自留地早报【4.9】

1️⃣ Bloomberg :苹果公司首款折叠屏手机将按计划于今年晚些时候,在该公司常规的 iPhone 发布期推出,这一消息驳斥了此前有关其遭遇重大生产障碍的报道

2️⃣ Thelec :报道称苹果公司正深化自研 AI 硬件布局,已开始测试先进的玻璃基板,用于代号为“Baltra”的 AI 服务器芯片

3️⃣ Trendforce :DRAM 现货市场因卖压受控,价格延续缓跌走势,主流 DDR4 芯片周环比跌幅 1.18%

4️⃣ MacRumors :苹果公司已与三星显示签署独家协议,未来三年只从 SDC 采购用于折叠屏 iPhone 的 OLED 面板。在此期间,苹果将不会使用其他显示厂商的折叠屏面板

5️⃣ Greekreporter :希腊宣布禁止 15 岁以下人群使用社交媒体

6️⃣ BIGME数码 :Bigme 大我公布全球首款彩墨屏 + LCD 双屏手机内存配置,最高 12GB+256GB 规格

7️⃣ 华为何刚 :华为 AI 眼镜将至,何刚首曝新机拍摄样张

频道:@NewlearnerChannel