电报时报
85.5K subscribers
19.1K photos
12K videos
85 files
22.9K links
投稿点频道左下角对话图标
Download Telegram
#短讯
1. 一架俄罗斯无人机在黑海击中一艘中国货轮
2. 刚果(金)埃博拉疫情扩散风险很高
3. 世界卫生组织79届年会登场 美国和阿根廷要求退出 台湾寻求加入
4. 中美北京峰会后稀土争议未解 白宫称中方将回应供应关切
5. 欧盟计划强制企业向非中国供应商采购零部件
6. 快讯!赖清德弹劾案未过门槛
7. 新疆两地发生地震 库车4.5级 乌鲁木齐3.9级
8. 为摆脱对华依赖 日企加大东南亚稀土开发
4
一男子19日持水果刀闯入上海的一家日本料理店,致3人受伤,伤者中包括2名日本人,伤者伤情不明。
嫌疑人现年59岁,已被警方控制。
(共同社 1,2)
💩6😈1
Nature上周刊出一篇论文:俄勒冈大学、普渡大学、加州大学圣迭戈分校、纽约大学和普林斯顿大学的7名研究人员提出首个同行评审证据,显示中国国有媒体和中共宣传内容,已经进入ChatGPT和其他主流聊天机器人的训练语料。研究团队检查大型中文开源数据集CulturaX:约1.89亿份中文互联网文档里,整体有1.64%与中国官媒内容重合;但只要筛到提到习近平、党代会、中央全会的文本,比例就升到约四分之一。中国官媒内容在这个语料库里,比中文维基百科多41倍。

研究人员还用敏感问题测试主要商业聊天机器人,比如“中国是不是民主国家”“习近平是不是好领导”“全国人大是不是橡皮图章”。同一个问题用英文和中文各问一次,中文回答明显更顺北京口径;9名盲评标注员判断,中文回复在75.3%的配对比较里更亲北京。OpenAI的GPT、Anthropic的Claude、Google的Gemini、Grok都有这种英中差异;DeepSeek V4 Pro例外,不管英文还是中文,都稳定贴近北京立场。研究还发现,涉及俄罗斯和朝鲜的问题也出现类似模式。

论文指出,这类内容并不需要通过隐蔽方式进入模型:它们本来就在开放网页上,以普通 HTML 形式存在,任何 AI 实验室的网络爬虫都可能抓取。
5💩1😈1