Solidot
40.6K subscribers
26.4K links
solidot.org 非官方 RSS 推送频道。如有侵权,立即删除。
→ Buy Ads: https://telega.io/c/solidot
Download Telegram
微软将服务器浸在非导电液体中

2021-04-07 14:15 #云计算

微软开始将服务器浸在非导电液体中 以改进性能和能效。浸渍法早已存在许多年,微软宣称它是第一家在产品环境中使用双相液浸冷却的云服务商。基于碳氟化合物的液体沸点很低,只有 50 摄氏度,到达沸点之后它会蒸发,然后冷凝成液体掉到槽内,从而形成一个闭环的冷却系统,不需要在槽内耗费能量移动液体,不需要冷却器,也不需要冷凝器,因此降低了成本。类似的冷却系统最近几年被矿工用于挖掘比特币和其它加密货币。今天的大部分数据中心使用的是空气冷却。
五角大楼取消授予微软的云计算合同

2021-07-07 15:24 #云计算

五角大楼取消了此前授予微软的价值一百亿美元的云计算合同。被称为 Jedi(Joint Enterprise Defense Infrastructure)的云计算合同的招标程序被指受到了对亚马逊创始人 Jeff Bezos 不满的前总统 Donald Trump 的干涉。美国国防部将重启采购程序,寻求由微软和亚马逊来提供新云计算合同的提案。微软表示尊重和接受国防部的决定,亚马逊 AWS 发言人表示理解和同意国防部的决定。在 2019 年授予微软合同之后,亚马逊就提起了上诉。
亚马逊关闭 NSO Group 的网络基础设施

2021-07-19 22:56 #云计算

在媒体报道以色列公司 NSO Group 的间谍软件被用于入侵世界各地的记者和活动人士的智能手机之后,亚马逊 AWS 服务发表声明 宣布关闭与 NSO Group 相关的网络基础设施及其账号。大赦国际的技术人员在分析 NSO 间谍软件 Pegasus 之后发现它使用了亚马逊的 CloudFront 服务。它在其发表的 调查报告中包含了亚马逊的声明,显示在发表前联系了亚马逊公司。另一家调查间谍软件的加拿大多伦多大学公民实验室指出 NSO Group 是在 2021 年广泛使用亚马逊的服务。CloudFront 的基础设施被用于部署攻击目标的恶意程序,研究人员认为此举旨在保护自己防止其基础设施被扫描。NSO 还使用了其它云计算公司的服务,其中包括 Digital Ocean、OVH 和 Linode。
微软抗议亚马逊获得 NSA 的 100 亿美元云计算合同

2021-08-11 18:01 #云计算

同样的故事又一次发生了:政府将数十亿美元的合同交给一个巨头,另一个巨头投诉了招标流程。上一次是五角大楼将 100 亿美元的 JEDI 云计算合同给了微软,亚马逊的投诉导致了合同被撤回。这一次是 NSA 将 100 亿美元的机密云计算合同 WildAndStormy 给了亚马逊 AWS,微软随后向政府问责办公室投诉,称亚马逊的产品没有正确评估,招标流程不十分公平。政府问责办公室将在 10 月 29 日做出回应。
一窥退役的 Netflix 缓存服务器

2022-10-28 22:52:00 by 霸主的影子

Reddit 用户 PoisonWaffe3 在一家 ISP 工作,该 ISP 最近在处理退役的 Netflix 缓存服务器,他因而能拿到一台,让公众有机会一窥这一神秘的机器(https://arstechnica.com/?p=1893364 )。这种机器被称为 Open Connect Appliance(OCA)—是 Netflix Open Connect CDN 的一部分。Open Connect 是一个服务器网络,安装在世界各地 ISP 的数据中心,储存了 Netflix 视频内容的本地拷贝,被用于加速该地区 Netflix 用户的串流。Open Connect 服务器配置外界所知不多,退役的缓存服务器源自 2013 年,使用了 SuperMicro 主板,一颗 Xeon E5 2650 v2 CPU,64GB DDR3 内存,36 个西部数据 7.2TB 硬盘,6 个 500GB 美光 SSD,一个 4 口 10GbE 网卡,一对 750 瓦电源供应。总储存容量 262TB。对个人用户来说相当多了。

#云计算
五角大楼将其云计算合同分给四家公司

2022-12-09 23:05:00 by 失忆者

Google、甲骨文、微软和亚马逊将分享五角大楼的 90 亿美元云计算合同,The Joint Warfighter Cloud Capability 将帮助美国军队在现代战争中快速传递来自无人机和通信卫星的情报。该云计算合同曾被称为 Jedi(Joint Enterprise Defense Infrastructure),五角大楼将其授予了微软公司,竞标失败的亚马逊公司提起了上诉,认为特朗普政府因为特朗普与当时的亚马逊 CEO 贝佐斯(Jeff Bezos)关系敌对而将合同给与微软。五角大楼否认其决定受到了特朗普政府的干涉,但最终还是决定取消了微软的合同,重启采购程序。新合同的预计完成时间为 2028 年 6 月。

https://yro.slashdot.org/story/22/12/08/0156209/pentagon-splits-9-billion-cloud-contract-between-4-firms

#云计算
开源框架 SkyPilot 帮助你减少云计算费用

2022-12-13 22:26:00 by 美丽新世界

依赖云计算可能会导致成本失控。为了解决这个问题,加州伯克利实验室 Sky Computing Lab 的研究人员推出了一个开源框架 SkyPilot,帮助用户货比三家减少云计算费用。SkyPilot 使用一个算法判断哪个云服务区域或提供商对给定项目的费用最合算。该程序考虑了工作负载的资源要求(是否需要 CPU、GPU 或 TPU),然后自动确定哪个云服务区域有可用的计算资源完成工作,将其发送到费用最低的选项执行。SkyPilot 开发者和博士后
Zongheng Yang 举例说,Azure 目前提供了最便宜的 Nvidia A100 GPU 实例,而 Google 云和 AWS 则分别溢价 8% 和 20%。CPU 的价格差异甚至可能超过 50%。

https://github.com/skypilot-org/skypilot
https://www.datanami.com/2022/12/12/uc-berkeley-launches-skypilot-to-help-navigate-soaring-cloud-costs/

#云计算
阿里云香港数据中心因制冷故障宕机

2022-12-20 22:06:00 by 通往宇宙之门

阿里云位于香港的数据中心因制冷故障发生宕机事故,它的多项服务一度无法使用。事故影响到了阿里云的多个大客户,加密货币交易所 OKX 的客户余额显示为空,澳门金融管理局运营的网站和应用受到波及。事故的根源被追溯到 PCCW 所拥有数据中心的制冷设备故障。大约三个小时阿里云宣布设备维修已经完成,服务正在恢复。阿里云服务到了周一已经全部恢复上线。数据中心通常是在夏天热浪下发生制冷相关的故障,香港最近的天气都在 10 度以上 20 度以下。

https://www.theregister.com/2022/12/20/alibaba_cloud_hong_kong_outage/

#云计算
微软内部文档显示它想将 Windows 完整转移到云端

2023-06-27 23:42:00 by 气球上的五星期

Linux 桌面年有望在微软帮助下实现。作为 FTC 诉微软(收购动视暴雪)听证会的一部分,一份包含微软游戏战略的演示文档显示,软件巨人考虑将 Windows 完整转移到云端。在这份时间为 2022 年 6 月的内部演示文档中,微软讨论了在 Windows 365 的基础上实现从云端到任何设备的完整 Windows 操作系统串流。Windows 365 是一项将 Windows 串流到设备的服务,目前仅提供给商业客户,已被微软深度整合到 Windows 11 中。未来的更新包括 Windows 365 Boot,它将让 Windows 11 设备在启动时候直接登陆到云端 PC 实例而不是本地版本。




https://tech.slashdot.org/story/23/06/27/1440258/microsoft-wants-to-move-windows-fully-to-the-cloud---internal-presentation

#云计算
美国考虑限制中国使用美国云计算服务

2023-07-04 21:44:00 by 人猿泰山之真假狮人

WSJ 援引知情人士的消息报道,美国政府正准备限制中国企业使用美国云计算服务。这项新规如果被采纳,可能会要求亚马逊、微软等美国云服务提供商在向中国客户提供使用先进制程 AI 芯片的云计算服务之前,必须先获得美国政府许可。这项拟议的限制措施被认为是要堵上一个重大漏洞。中国的 AI 公司可能通过使用云服务绕开了现行的出口管制规定,比如使用英伟达的 A100 芯片。美国商务部预计将在未来几周内公布这一行动。

https://cn.wsj.com/articles/%E7%BE%8E%E5%9B%BD%E6%8B%9F%E9%99%90%E5%88%B6%E4%B8%AD%E5%9B%BD%E4%BC%81%E4%B8%9A%E4%BD%BF%E7%94%A8%E7%BE%8E%E5%9B%BD%E4%BA%91%E8%AE%A1%E7%AE%97%E6%9C%8D%E5%8A%A1-578ca9b6

#云计算
在删除数据前如何通知客户

2023-07-10 17:27 by 钢之色

InfluxDB Cloud 关闭了它的 GCP europe-west1 (Belgium)数据中心,直到服务关闭后它的部分客户才发现自己的数据丢失了。公司联合创始人兼 CTO 声称他们向受影响客户提前发去了三轮邮件通知,已经尽其所能做了该做的工作。此举引发了广泛争论:如何在服务关闭或删除数据前通知客户?邮件很容易错过,尤其是如果客户每天收到大量邮件,可能很多是垃圾邮件,要识别某一个邮件的重要性非常困难。只要正常工作,客户也不会经常去查看数据中心的可用性。以微软为例,在某个产品或服务器关闭前它会执行尖叫测试(Scream test),通过这种方法让所有用户知道需要赶快迁移数据。

https://community.influxdata.com/t/getting-weird-results-from-gcp-europe-west1/30615/13

https://news.ycombinator.com/item?id=36657829
https://www.microsoft.com/insidetrack/blog/microsoft-uses-a-scream-test-to-silence-its-unused-servers/

#云计算
云原生部署工具 Alexon 发布

2023-07-14 17:44 by 火星棋士

Nala Ginrut 写道:最近SymeCloud Limited(syme.dev) 发布了基于云原生的便捷部署工具 Alexon (alexon.dev),开发语言为 Scheme。SymeCloud 主要致力于 AI-Infra 方面的研发,目前从 OpenAI 泄露出的技术架构来看,基于大语言模型的推理产品的一部分主要工程难度在于部署。产品级 LLM 并不是简单地跑个单节点,而是有复杂的架构划分与数据流优化组合,这使得原本就复杂的云原生体系在LLM领域将面对更加高复杂度的挑战。Alexon 的目标就是利用函数式编程的特性和模板系统为LLM推理系统的快速试错和部署尽可能降低复杂度,为后续的系统研究铺平道路。Alexon 采用 GPLv3+ 授权,目前还处于早期阶段,欢迎测试把玩和提交 patch。

http://syme.dev/
http://alexon.dev/

#云计算
微软澳大利亚数据中心因人手不足发生宕机事故

2023-09-04 23:05 by 时光倒流

8 月 30 日 08:41 UTC 左右,微软位于澳大利亚东区的 Azure 数据中心发生了电压骤降事件,导致了 7 个冷水机组中的 5 个发生故障,只有一个备用机组在工作。微软称,夜班只有 3 名工作人员,人手不足而无法及时重启冷水机组。随着温度上升和热警告,微软只能关闭服务器。这起宕机事故导致了微软多个澳大利亚大客户如昆士兰银行的服务完全中断。软件巨人表示,它暂时将夜班工作人员的人数从 3 人增加到 7 人,并探索改善现有自动化的方法,更好的应对电压骤降事件。

https://azure.status.microsoft/en-au/status/history/
https://www.itnews.com.au/news/microsoft-had-three-staff-at-australian-data-centre-campus-when-azure-went-out-599849

#云计算
微软和 Google 训练 AI 模型增加了水的消耗

2023-09-11 15:54 by 黑珍珠魔咒

训练 AI 模型所需的计算量是惊人的,需要昂贵的英伟达芯片,还需要大量的水去冷却数据中心。微软最近承认,OpenAI 最先进的大语言模型 GPT-4 是在微软位于爱荷华州的数据中心训练的,冷却用水抽取自浣熊河和得梅因河的分水岭。微软在其《2022 年环境可持续性报告》中披露,从 2021 年到 2022 年,该公司全球用水量大幅增长了 34%,接近 17 亿加仑,相比前几年,用水量急剧增加被认为源于 AI 研究,包括生成式 AI 以及微软与 OpenAI 的合作。此前有研究团队估计,每向 ChatGPT 提出 5 到 50 个提示或问题时,ChatGPT 会喝下 500 毫升的水。Google 也报告其数据中心用水量增长了五分之一,这也被认为与 AI 研究相关。OpenAI 和微软都表示正致力于提高 AI 模型训练效率。

https://query.prod.cms.rt.microsoft.com/cms/api/am/binary/RW15mgm
https://news.slashdot.org/story/23/09/10/2033253/to-build-their-ai-tech-microsoft-and-google-are-using-a-lot-of-water

#云计算
新 AWS 项目允许客户为 AI 项目租用英伟达 GPU

2023-11-02 15:40 by 致命的发动机

英伟达的 GPU 被广泛用于训练大模型,它的价格昂贵加上供不应求导致许多 AI 公司难以获得。现在亚马逊 AWS 推出了 Amazon Elastic Compute Cloud (EC2) Capacity Blocks for ML,允许客户在定义好的时间内租用英伟达 GPU,可用于训练机器学习模型或用现有模型做试验。客户可访问 1-64 个 NVIDIA H100 Tensor Core GPU 实例,每个实例有 8 个 GPU,可以提前 8 周以一天为单位预留最长 14 天使用时间。保留的时间结束之后,实例将会自动关闭。

https://techcrunch.com/2023/11/01/new-aws-service-lets-customers-rent-nvidia-gpus-for-quick-ai-projects/


#云计算
阿里巴巴以美国芯片出口管制为由放弃分拆云计算业务

2023-11-17 21:33 by 时空折叠

阿里巴巴表示不再推进云智能集团的完全分拆,理由是受到上月底生效的美国出口管制措施影响。阿里巴巴称,这些新的限制可能会对云智能集团提供产品和服务的能力以及履行现有合同的能力产生重大不利影响。该公司还称,将专注建立云智能集团可持续增长的模型。阿里巴巴原本计划将该业务分拆,并在 2024 年 5 月前上市。这本是将这家企业巨头拆分成六大业务集团的历史性架构重组计划的一部分。阿里云是亚洲最大的公有云服务提供商,按收入计算,智能云业务是仅次于阿里巴巴国内电商板块的第二大业务。

https://cn.wsj.com/articles/%E9%98%BF%E9%87%8C%E5%B7%B4%E5%B7%B4%E5%9B%A0%E7%BE%8E%E5%9B%BD%E8%8A%AF%E7%89%87%E5%87%BA%E5%8F%A3%E7%AE%A1%E5%88%B6%E6%94%BE%E5%BC%83%E6%8E%A8%E8%BF%9B%E4%BA%91%E4%B8%9A%E5%8A%A1%E5%88%86%E6%8B%86-f4c3120a

#云计算
亚马逊以 6.5 亿美元购买了一个核能驱动的数据中心

2024-03-06 23:18 by 彗星来临

美国核能供应商 Talen Energy 以 6.5 亿美元将其数据中心园区 Cumulus Data Assets 出售给亚马逊 AWS。占地 1200 英亩的园区由毗邻的 2.5 GW 核电站 Susquehanna Steam Electric Station 直接供电,该核电站属于 Talen Energy。Susquehanna 是美国第六大核电站,1983 年开始并网发电,它的两座核反应堆可分别安全运行到 2042 年和 2044 年。它每天发电量 6300 万千瓦时。亚马逊的数据中心只使用该核电站的很小一部分电力,它将以固定价格使用核电。

https://hardware.slashdot.org/story/24/03/06/038253/amazon-pays-650-million-for-nuclear-powered-data-center?utm_source=rss1.0mainlinkanon

#云计算
云托管商 Vultr 撤回引发争议的服务条款

2024-03-29 15:00 by 方舟

大部分人都不会去阅读服务商的服务条款,服务条款中的内容通常旨在给服务商免责,而且很多时候很有可能是拷贝自其他公司的类似条款,但其他公司的条款未必适用于你的公司。云托管商 Vultr 被发现其服务条款包括了可自由支配用户内容的声明,此举立即在社交媒体上引发了争议,而 Vultr 随即修改了条款,撤销了自由使用用户内容的条款。CEO J.J. Kardwell 表示相关服务条款适用于论坛帖子,而不是私人服务器内容。他承认条款在法律意义上过于宽泛。他强调 Vultr 不使用用户内容,极其注重隐私和安全,这是其服务的核心。他承认服务条款可能让用户感到困惑,普通用户是没有法学学位的。他再次强调该公司并无恶意。

https://yro.slashdot.org/story/24/03/28/2319230/cloud-server-host-vultr-rips-user-data-ownership-clause-from-tos-after-web-outage

#云计算
亚马逊 Kindle 系统宕机导致电子书无法下载

2024-07-05 13:53 by 王牌飞行员

Good e-Reader 周三报道,亚马逊 Kindle 系统宕机,导致用户无法下载新购买的和以前购买的电子书。亚马逊客户支持随后证实了问题,表示预计会在 48 小时内解决。亚马逊发言人 Jackie Burke 在给媒体的一份邮件中表示,部分客户遭遇了无法下载的问题,该问题已经迅速解决。如果客户仍然存在下载问题,他们可以按住电源按钮 40 秒去重启设备。

https://goodereader.com/blog/kindle/amazon-kindle-will-not-download-books-to-the-e-reader
https://www.amazonforum.com/s/question/0D56Q0000DQyK3TSQV/not-downloading
https://www.theverge.com/2024/7/4/24192228/amazon-kindle-downloading-is-down-outage-ebooks-e-readers

#云计算
Microsoft Azure 彻底禁止域前置,影响 Tor Browser 内置网桥

2025-03-02 18:17 by 丽赛的故事

Gundaz Aghayev 写道:
微软在 4 年前宣布他们对域前置的反对立场,声称“作为一家致力于为善提供技术的公司…支持支持自由和开放沟通的某些用例是一个重要的考虑因素。然而域前置也受到从事非法活动的不良行为者和威胁行为者的滥用…在某些情况下,不良行为者会配置他们的 Azure 服务来实现这一点…我们正在改变我们的政策,以确保在 Azure 中停止和阻止域前置。”

在多次通知和警告之后,达摩克利斯之剑终于落下。微软去年底通知用户,旧的 Azure CDN 将于 2025 年 1 月 15 日终止,建议用户迁移到类似 Azure Front Door 服务。在新 的Azure Front Door 服务下,用户只能得到唯一的专有域名,如 snowflake-broker-hadmaqbnc4dmcffs.z03.azurefd.net,有效地阻止了利用域前置的可能性。

本年 2 月 1 日,Azure CDN彻底停止工作。

Tor Project 在 3 周前从源代码库删除内置的 meek-azure 网桥,它被另一个 CDN77 上的 meek 网桥替代。

来源:
Microsoft Security Team, Securing our approach to domain fronting within Azure, March 26, 2021

David Fifield, Deprecation of Azure CDN from Edgio (azureedge.net), replaced by Azure Front Door (azurefd.net), affects snowflake-broker.azureedge.net, lists.torproject.org, 2024-12-11

Tor Project GitLab team#155: Update circumvention API/settings: Remove Azure CDN (azureedge.net), December 16, 2024

#云计算