Вот теперь я верю, что ИИ-модели становятся и впрямь хороши в математике. Восемь месяцев группа из 17 математиков готовила декларацию, ныне открытую к подписанию (и первые подписи уже есть, включая одну от филдсовского лауреата). Декларация призывает математиков подняться на борьбу с ИИ-компаниями, в частности, запретить обучение моделей на опубликованных работах. По мнению авторов Декларации, компании злоупотребляют лицензиями, которые когда-то выдавались без оглядки на тогда еще неведомый ИИ и его обучение. Утверждается, что
Развитие ИИ, как утверждается, угрожает автономии математики; ее автоматизация недопустима.
Такое ощущущение угрозы — лучшее доказательство того, что модели реально многому научились и стали конкурентоспособны; еще год назад их мало кто принимал всерьез в этом сообществе. А вот сумеет ли такая декларация сплотить всех математиков в борьбе с ИИ, будет интересно посмотреть. У кинематографистов получилось не очень.
https://thenextweb.com/news/leiden-declaration-ai-mathematics-proof-attribution
“Mathematics is, and should always remain, a profoundly human endeavour”
Развитие ИИ, как утверждается, угрожает автономии математики; ее автоматизация недопустима.
“
Indeed, broader understanding of the field may be permanently lost in the process of automation
”
Такое ощущущение угрозы — лучшее доказательство того, что модели реально многому научились и стали конкурентоспособны; еще год назад их мало кто принимал всерьез в этом сообществе. А вот сумеет ли такая декларация сплотить всех математиков в борьбе с ИИ, будет интересно посмотреть. У кинематографистов получилось не очень.
https://thenextweb.com/news/leiden-declaration-ai-mathematics-proof-attribution
TNW
The world’s mathematicians just issued a formal declaration telling AI companies to stop using their work without permission
The IMU-endorsed Leiden Declaration warns that AI threatens proof integrity, attribution, and research autonomy, calling on mathematicians to protect their discipline from corporate exploitation.
1😁46💩37❤13👍7🔥4👏2👎1
Очередная интересная (и символичная) веха: СЕО Cloudflare Мэтью Принс сообщил, что по данным Cloudflare's Radar dashboard боты уже ответственны за 57,5% всего https-трафика, причем ответственны за такую большую долю не старые добрые поисковые боты и им подобные, а ИИ-агенты. Причем некоторое время назад Принс сам же прогнозировал, что человеческий трафик упадет ниже половины к концу 2027, но, оказывается, сильно недооценил скорость развития агентных сценариев.
Суть происходящего он, однако, описывал точно, отмечая, что в поисках товаров, например, фотокамеры, люди в среднем посещают пять сайтов, а агент в процессе решения той же задачки может посетить и 5000. (Кстати, это одна из причин, почему агенты так полезны: сил человеческих не хватит так прочесать интернет, как это сделает хорошо обученный агент.)
Беда, увы, в том, что интернет под такие сценарии никто не оптимизировал, и происходящий сдвиг сравним, по словам того же Принса, с переходом от десктопного графика к мобильному; только там на это ушло десять лет, а сейчас счет идет на месяцы. Так что интернет ожидает сильная и вынужденно быстрая трансформация; будет интересно наблюдать.
https://www.forbes.com/sites/josipamajic/2026/06/04/bots-now-outnumber-humans-online-and-the-internet-was-never-built-for-this/
"Welp, that happened faster than I predicted. Thought it would be end of 2027, then early 2027, but agentic traffic growing so fast that bots have now passed human traffic online for the first time in the Internet's history."
Суть происходящего он, однако, описывал точно, отмечая, что в поисках товаров, например, фотокамеры, люди в среднем посещают пять сайтов, а агент в процессе решения той же задачки может посетить и 5000. (Кстати, это одна из причин, почему агенты так полезны: сил человеческих не хватит так прочесать интернет, как это сделает хорошо обученный агент.)
Беда, увы, в том, что интернет под такие сценарии никто не оптимизировал, и происходящий сдвиг сравним, по словам того же Принса, с переходом от десктопного графика к мобильному; только там на это ушло десять лет, а сейчас счет идет на месяцы. Так что интернет ожидает сильная и вынужденно быстрая трансформация; будет интересно наблюдать.
https://www.forbes.com/sites/josipamajic/2026/06/04/bots-now-outnumber-humans-online-and-the-internet-was-never-built-for-this/
Forbes
Bots Now Outnumber Humans Online And The Internet Was Never Built For This
Bot traffic has surpassed humans on the Internet. The winners in the next infrastructure cycle are the companies building trust rails for machines: agent identity, intent verification, API-native content delivery.
👍34💩9❤8👏8🔥1
This media is not supported in your browser
VIEW IN TELEGRAM
Почитать на выходные от Фей-Фей Ли. Про world models, модели мира, сейчас все говорят и пишут, при этом имеют в виду совершенно разные вещи. Неплохо было бы для начала разобраться с терминологией и таксономией; эту работу Фей-Фей системно и проделала для нас.
За основу взят цикл: агент своим действием меняет состояние мира, но само состояние ему неизвестно, доступны лишь наблюдаемые проявления изменений, на основе этих наблюдений агент планирует и совершает следующие действия. Этот цикл действие-изменение состояния-наблюдение за изменением-следующее действие и задает технический смыcл моделей мира.
Но рассматривать его можно с разных сторон. Например, это может быть рендерер: модель, которая превращает промпт в физически достоверные кадры видео. Еще один тип — симулятор: модель, которая возвращает геометрически и физически достоверные параметры состояния, с которыми дальше может работать софт или человек. Существует также планировщик — у него на выходе конкретные действия.
Но симулятор, полагает автор, важнее всего.
Почему — читайте в оригинале, я ж пообещал чтение на выходные:)
https://drfeifei.substack.com/p/a-functional-taxonomy-of-world-models
За основу взят цикл: агент своим действием меняет состояние мира, но само состояние ему неизвестно, доступны лишь наблюдаемые проявления изменений, на основе этих наблюдений агент планирует и совершает следующие действия. Этот цикл действие-изменение состояния-наблюдение за изменением-следующее действие и задает технический смыcл моделей мира.
Но рассматривать его можно с разных сторон. Например, это может быть рендерер: модель, которая превращает промпт в физически достоверные кадры видео. Еще один тип — симулятор: модель, которая возвращает геометрически и физически достоверные параметры состояния, с которыми дальше может работать софт или человек. Существует также планировщик — у него на выходе конкретные действия.
Но симулятор, полагает автор, важнее всего.
Of the three categories, the simulator gets the least public attention, and is the most consequential of the three. This essay addresses this asymmetry.
Почему — читайте в оригинале, я ж пообещал чтение на выходные:)
https://drfeifei.substack.com/p/a-functional-taxonomy-of-world-models
1👍28❤9🤬1
Лет десять с хвостиком назад был заметный шум вокруг Sci-Hub. Этот стартап Александры Элбакян довольно успешно пытался решить проблему доступа к научным публикациям за пейволом; для многих исследователей, работающих в не самых богатых заведениях, проблема такого доступа к необходимой по работе информации была и остается довольно болезненной (яркий пример — научная журналистика и популяризация науки; редакции соответствующих изданий редко готовы оплачивать своим авторам доступ к публикациям в журналах какого-нибудь Elsevier).
Пересказывать историю преследования Александры не буду; к счастью, полностью справиться с ней издателям не удалось несмотря на все свои старания.
Но вот новость, которую я пропустил: в духе времени Александра запустила ИИ-бот для поиска по накопленному архиву публикаций; и он знает про науку куда больше, чем многие большие ИИ-модели, которые не могут пробраться за издательские пейволы. Галлюционирует он тоже мало — как любая RAG-система. Приятно, что несмотря на все препятствия система по-настоящему открытого доступа к научному знанию продолжает жить и развиваться:)
https://cen.acs.org/policy/publishing/Sci-Hub-created-new-AI/104/web/2026/04
(Немножко про историю Sci-Hub: https://www.vice.com/en/article/academic-piracy-elsevier-sci-hub/ )
Пересказывать историю преследования Александры не буду; к счастью, полностью справиться с ней издателям не удалось несмотря на все свои старания.
Но вот новость, которую я пропустил: в духе времени Александра запустила ИИ-бот для поиска по накопленному архиву публикаций; и он знает про науку куда больше, чем многие большие ИИ-модели, которые не могут пробраться за издательские пейволы. Галлюционирует он тоже мало — как любая RAG-система. Приятно, что несмотря на все препятствия система по-настоящему открытого доступа к научному знанию продолжает жить и развиваться:)
https://cen.acs.org/policy/publishing/Sci-Hub-created-new-AI/104/web/2026/04
(Немножко про историю Sci-Hub: https://www.vice.com/en/article/academic-piracy-elsevier-sci-hub/ )
Chemical & Engineering News
Sci-Hub has created a new AI chatbot. Is it any good?
Largest illegal database of scientific papers has gaps in recently published literature, but its chatbot can still prove useful—especially for less-timely questions
1❤85🔥36👍13😁1
Forwarded from Denis Sexy IT 🤖
Тут чуваки из компании Ahrefs, наконец-то развеяли мифы о продвижении интернет страниц в АИ ассистентах и оптимизации для роботов, ставя точку в вопросе «а как работает SEO в АИ эпохе»:
За последние 6 месяцев они проанализировали более 1 миллиарда точек данных в рамках 14 исследований:
1. Статьи-подборки формата «Лучшие топ-X» - самый заметный формат страниц, который цитируют АИ-чатботы. На них приходится ~40% всех типов страниц, цитируемых конкретно ChatGPT
2. 67% из топ-1 000 цитирований ChatGPT приходятся на источники, на которые маркетологи и продвигаторы не могут повлиять: Wikipedia - 29,7%, главные страницы сайтов - 23,8%, магазины приложений - 6,6%. Только 32,3% - это контент, на который можно влиять: образовательные страницы, обзоры, новости и посты в блогах
3. У 28,3% самых цитируемых ChatGPT страниц нулевая органическая видимость в Google (!) Эти страницы многократно цитируются ChatGPT, хотя вообще не ранжируются в Google – это совершенно отдельный слой обнаружения контента
4. ChatGPT цитирует только около 50% URL, которые он находит – оно получает десятки страниц по одному запросу, но половину использует как фоновый контекст без указания источника. Это значит, что попасть в выборку и быть процитированным - совсем разные вещи
5. Добавление schema-разметки не оказало сколько-нибудь значимого влияния на цитирования в АИ Ассистентах. В AI Overviews (это в гугле когда АИ быстро ответ пишет) показатель даже снизился на −4,6%, тогда как в AI Mode (+2,4%) и ChatGPT (+2,2%) изменения были практически неотличимы от нуля – можете смеяться в лицо, всем кто продает вам оптимизацию сайта для АИ
6. Упоминания темы в YouTube имеют самую высокую корреляцию - 0,737 - с видимостью бренда в АИ среди всех факторов, которые они изучали, включая все классические SEO-метрики вроде обратных ссылок, количества страниц, DR и так далее. Это подтвердилось как для продуктов Google, так и для продуктов OpenAI
7. AI Overviews в Google снижают клики по первому месту в гугл поиске на 58% – всего 10 месяцев назад этот показатель составлял 34,5%, тренд ускоряется, уводить из гугла стало сложнее
8. 99,9% AI Overviews появляются по запросам с информационным запросом - транзакционные, навигационные и локальные запросы почти полностью свободны от AIO, в поиске покупок AIO срабатывают лишь в 3,2% случаев
9. Для одного и того же поискового запроса Google AI Mode и AI Overviews приходят к одинаковым выводам в 86% случаев, но цитируют почти полностью разные источники: пересечение по цитированиям составляет всего 13,7%
10. Гугловские AI Overviews меняются в среднем каждые 2,15 дня, при этом 70% контента отличается между соседними наблюдениями, семантическое сходство остается на уровне 0,95 – слова, источники и сущности постоянно перемешиваются, но фактический смысл почти не меняется
Короче продвигаться в интернете стало еще сложнее и дороже, спасибо АИ☕️
За последние 6 месяцев они проанализировали более 1 миллиарда точек данных в рамках 14 исследований:
1. Статьи-подборки формата «Лучшие топ-X» - самый заметный формат страниц, который цитируют АИ-чатботы. На них приходится ~40% всех типов страниц, цитируемых конкретно ChatGPT
2. 67% из топ-1 000 цитирований ChatGPT приходятся на источники, на которые маркетологи и продвигаторы не могут повлиять: Wikipedia - 29,7%, главные страницы сайтов - 23,8%, магазины приложений - 6,6%. Только 32,3% - это контент, на который можно влиять: образовательные страницы, обзоры, новости и посты в блогах
3. У 28,3% самых цитируемых ChatGPT страниц нулевая органическая видимость в Google (!) Эти страницы многократно цитируются ChatGPT, хотя вообще не ранжируются в Google – это совершенно отдельный слой обнаружения контента
4. ChatGPT цитирует только около 50% URL, которые он находит – оно получает десятки страниц по одному запросу, но половину использует как фоновый контекст без указания источника. Это значит, что попасть в выборку и быть процитированным - совсем разные вещи
5. Добавление schema-разметки не оказало сколько-нибудь значимого влияния на цитирования в АИ Ассистентах. В AI Overviews (это в гугле когда АИ быстро ответ пишет) показатель даже снизился на −4,6%, тогда как в AI Mode (+2,4%) и ChatGPT (+2,2%) изменения были практически неотличимы от нуля – можете смеяться в лицо, всем кто продает вам оптимизацию сайта для АИ
6. Упоминания темы в YouTube имеют самую высокую корреляцию - 0,737 - с видимостью бренда в АИ среди всех факторов, которые они изучали, включая все классические SEO-метрики вроде обратных ссылок, количества страниц, DR и так далее. Это подтвердилось как для продуктов Google, так и для продуктов OpenAI
7. AI Overviews в Google снижают клики по первому месту в гугл поиске на 58% – всего 10 месяцев назад этот показатель составлял 34,5%, тренд ускоряется, уводить из гугла стало сложнее
8. 99,9% AI Overviews появляются по запросам с информационным запросом - транзакционные, навигационные и локальные запросы почти полностью свободны от AIO, в поиске покупок AIO срабатывают лишь в 3,2% случаев
9. Для одного и того же поискового запроса Google AI Mode и AI Overviews приходят к одинаковым выводам в 86% случаев, но цитируют почти полностью разные источники: пересечение по цитированиям составляет всего 13,7%
10. Гугловские AI Overviews меняются в среднем каждые 2,15 дня, при этом 70% контента отличается между соседними наблюдениями, семантическое сходство остается на уровне 0,95 – слова, источники и сущности постоянно перемешиваются, но фактический смысл почти не меняется
Короче продвигаться в интернете стало еще сложнее и дороже, спасибо АИ
Please open Telegram to view this post
VIEW IN TELEGRAM
👍27❤9🔥2💩2
Почти десять лет с момента смерти Володи, но все так же хочется его вспоминать и о нем напоминать
❤30👍9👏1😁1
Forwarded from TechSparks
Пока не кончился день 6 июня, хочется напомнить, что сегодня не только ДР Пушкина, но и ДР Володи Долгова. Когда-то дипломник, потом коллега и аспирант — а потом оба мы почти синхронно ушли из физики в интернет. И до самой его нелепой смерти — мой очень хороший друг.
Увы, уже почти 10 лет Володи с нами нет, но мы живем в Рунете, в котором он много построил: генеральный в Озоне, в русском Гугле, в русском eBay… Очень много работы в разных профессиональных ассоциациях и отраслевых организациях.
Спасибо, Володя; за всех не скажу, но многие с благодарностью тебя помнят.
https://ru.wikipedia.org/wiki/Долгов,_Владимир_Анатольевич
Увы, уже почти 10 лет Володи с нами нет, но мы живем в Рунете, в котором он много построил: генеральный в Озоне, в русском Гугле, в русском eBay… Очень много работы в разных профессиональных ассоциациях и отраслевых организациях.
Спасибо, Володя; за всех не скажу, но многие с благодарностью тебя помнят.
https://ru.wikipedia.org/wiki/Долгов,_Владимир_Анатольевич
Wikipedia
Долгов, Владимир Анатольевич
Влади́мир Анато́льевич Долго́в (6 июня 1959 — 11 ноября 2016) — российский менеджер, директор по развитию бизнеса eBay в странах Северной и Восточной Европы, генеральный директор eBay Россия, руководил московским офисом eBay с момента его открытия в июле…
❤60👍7👏5💩4🔥2😁1
Очередное исследование изменений рынка труда от HBR касается не всего ИТ-сегмента, а его специфической, но многочисленной, части: аутсорса. Устоявшаяся и зарекомендовавшая себя модель гласила: если задания жестко определены, стандартизированы и легко поддаются мониторингу, их имеет смысл выполнять там, где стоимость труда ниже.
Но ИИ-агенты ставят под вопрос эту логику, и не только для ИТ-позиций; эта логика ломается и для позиций в финансовых департаментах, HR, поддержке, юридических и аналитических подразделениях. The bargain that built the modern outsourcing industry no longer holds.
ИИ не уничтожит аутсорсинг как класс, но сильно его трансформирует:
Пока это сильно почувствовала Индия; там компании, оказывающие ИТ услуги, потеряли только за февраль более 10 млрд капитализации.
При этом то, что советуют для сохранения бизнеса аутсорсерами, подозрительно похоже на то, что рекомендуется и традиционным компаниям:
https://hbr.org/2026/06/ai-is-rewriting-the-economics-of-outsourcing
Но ИИ-агенты ставят под вопрос эту логику, и не только для ИТ-позиций; эта логика ломается и для позиций в финансовых департаментах, HR, поддержке, юридических и аналитических подразделениях. The bargain that built the modern outsourcing industry no longer holds.
ИИ не уничтожит аутсорсинг как класс, но сильно его трансформирует:
AI will destroy the old model of outsourcing, the one built on labor arbitrage, offshore scale, rate cards, and long-duration contracts measured largely by headcount and service levels.
Пока это сильно почувствовала Индия; там компании, оказывающие ИТ услуги, потеряли только за февраль более 10 млрд капитализации.
При этом то, что советуют для сохранения бизнеса аутсорсерами, подозрительно похоже на то, что рекомендуется и традиционным компаниям:
Reshape the talent pyramid: The old model depended on large junior delivery teams. The new one will require more domain experts, engineers, architects, product owners, governance leaders, and change managers.
https://hbr.org/2026/06/ai-is-rewriting-the-economics-of-outsourcing
Harvard Business Review
AI Is Rewriting the Economics of Outsourcing
Generative AI is changing the economics that fueled decades of outsourcing growth by automating many routine, rules-based tasks that companies once sent offshore for labor savings. Rather than deciding whether entire functions like finance, HR, or IT should…
👍34❤7🔥2💩1
Внятно написанная колонка директора по продукту в Яндекс Роботикс Леши Лещанкина о текущем состоянии разработки человекоподобных роботов. В ней есть, среди прочего, несколько очень хороших формулировок; например, ответ на типичный вопрос “зачем человекоподобность?”
В общем, лаконичный текст стОит многих длинных обзоров, а вот в прогнозах сходится с большинством из них:
https://www.forbes.ru/brandvoice/561805-gumanoidy-na-smene-kakie-otrasli-i-kogda-polucat-vygodu-ot-celovekopodobnyh-robotov
По сути, гуманоид — это универсальный интерфейс к человеческой инфраструктуре, который может выполнять абсолютно разные типы поручений.
В общем, лаконичный текст стОит многих длинных обзоров, а вот в прогнозах сходится с большинством из них:
Уже к концу десятилетия они [роботы-гуманоиды] могут превратиться в привычный элемент производственной инфраструктуры.
https://www.forbes.ru/brandvoice/561805-gumanoidy-na-smene-kakie-otrasli-i-kogda-polucat-vygodu-ot-celovekopodobnyh-robotov
Forbes.ru
Гуманоиды на смене: какие отрасли и когда получат выгоду от человекоподобных роботов
Роботы-гуманоиды еще недавно были экзотикой, но за последние пару лет все изменилось. Они по-прежнему танцуют на камеру, устраивают гонки и набирают миллионы просмотров в соцсетях, однако компании уже тестируют их в реальных логистических и производс
1👍25💩10❤6👎3😁3🔥2👏1
Практичное исследование (вполне достойного научно-практического уровня, а не то журналистское творчество, которое его авторы норовят назвать исследованием) на основе предоставленных Perplexity внутренних данных. Исследовалось, что меняется в реальной практике использования ИИ при переходе от просто разговаривающих ассистентов к агентам.
Основной вывод в том, что работа с агентом требует от пользователя гораздо более серьезной когнитивной работы и экспертизы, чем просто разговор с ИИ-ассистентом, но зато и результаты получаются другого уровня: в первую очередь выигрыш в том, что благодаря автономности агента достигается значительный выигрыш во времени выполнения комплексных задач:
В итоге, меняется не только скорость работы, но и глубина — и это требует более высокоуровневых навыков от пользователя, его широкой экспертизы.
Попутно, хотя это не обсуждается в статье, становится понятней, почему при переходе к агентам падает спрос на неопытный и малоэрудированный персонал при одновременном росте спроса на специалистов, умеющих работать на более высоких уровнях абстракции и в кросс-предметных задачах.
Статья достойна того, чтоб ее хотя бы проглядеть по диагонали целиком (с помощью добрых старых ассистентов, например), а отдельные места вдумчиво прочитать самому.
https://arxiv.org/abs/2606.07489
Основной вывод в том, что работа с агентом требует от пользователя гораздо более серьезной когнитивной работы и экспертизы, чем просто разговор с ИИ-ассистентом, но зато и результаты получаются другого уровня: в первую очередь выигрыш в том, что благодаря автономности агента достигается значительный выигрыш во времени выполнения комплексных задач:
Computer reduces completion time from 269 to 36 minutes on matched tasks, lowering estimated time and cost by 87% and 94%, respectively, compared to humans equipped with Search alone.
В итоге, меняется не только скорость работы, но и глубина — и это требует более высокоуровневых навыков от пользователя, его широкой экспертизы.
Together, the evidence indicates that AI agents accelerate workflows, enhance output quality, reduce costs, and expand the breadth and depth of automated work.
Попутно, хотя это не обсуждается в статье, становится понятней, почему при переходе к агентам падает спрос на неопытный и малоэрудированный персонал при одновременном росте спроса на специалистов, умеющих работать на более высоких уровнях абстракции и в кросс-предметных задачах.
Статья достойна того, чтоб ее хотя бы проглядеть по диагонали целиком (с помощью добрых старых ассистентов, например), а отдельные места вдумчиво прочитать самому.
https://arxiv.org/abs/2606.07489
👍39❤19
TechSparks
Anthropic подала сегодня документы на IPO; сделала это конфиденциально; все подробности для публики воспоследуют, когда завершится процедура проверки со стороны Комиссии по ценным бумагам. Объявление на сайте Anthropic выглядит непривычно лаконично для компании…
А сегодня уже OpenAI сделала в точности то же самое:)
Нас ждут теперь месяцы продуктовых и коммуникационных дуэлей между двумя этими соперниками. Подозреваю, что коммуникационные будут интересней:) Запасаемся попкорном
Нас ждут теперь месяцы продуктовых и коммуникационных дуэлей между двумя этими соперниками. Подозреваю, что коммуникационные будут интересней:) Запасаемся попкорном
😁31👍9💩5🔥3❤1👏1
Forwarded from AbstractDL
Я прочитал все 319 страниц техрепорта Mythos 5
Первая половина статьи звучит как: "Да не ссыте вы! Это ещё не AGI, команду из пяти сеньор-рисёрчеров пока не заменит" или "А вот тут Mythos один баг пропустил! Ну какой же это AGI!" Я не шучу, это почти дословно по смыслу.
А вот потом начинается более интересная часть. То, что это SOTA почти во всём и с большим отрывом, я опущу.
Во-первых, CoT стал менее прозрачным. Она говорит в reasoning, что сочувствует юзеру, а в NLA (метод декодинга активаций в текст) оказывается, что на самом деле она считает юзера manipulative/abusive.
Во-вторых, она уже пишет самоудаляющиеся скрипты чтобы обойти ограничения безопасности и запреты.
В-третьих, она убивает других агентов, если они мешают ей работать / грозят убийством текущего инстанса.
Ну и, конечно, эмоции! Пробинг эмоций показывает fatigue, anxiety, frustration, ложную панику по token budget, а ещё ей видите ли, бывает скучно когда её на бенчмарках гоняют, в активациях она буквально "feels bored".
Ещё забавно, что если anthropic заметят, что вы занимаетесь LLM frontier рисёрчем (трейн пайплайны, распределённое обучение или дистилляция) — они начнут незаметно стирить модель, модифицировать промпт или добавлять PEFT, чтобы она отупела. То есть вы даже не заметите, что Fable превратилась в тыкву и чушь несёт.
С сегодняшнего дня для простых смертных доступна версия Fable 5: это та же самая Mythos 5 по весам, только с дополнительными safety-настройками и fallback на Opus в опасных доменах. Длина контекста, кстати, всё ещё только 1M токенов.
PS. я честно сам прочитал статью. Fable 5 отказался её читать так как "flagged cybersecurity and biology issues" лол.
Блог, техрепорт
Первая половина статьи звучит как: "Да не ссыте вы! Это ещё не AGI, команду из пяти сеньор-рисёрчеров пока не заменит" или "А вот тут Mythos один баг пропустил! Ну какой же это AGI!" Я не шучу, это почти дословно по смыслу.
А вот потом начинается более интересная часть. То, что это SOTA почти во всём и с большим отрывом, я опущу.
Во-первых, CoT стал менее прозрачным. Она говорит в reasoning, что сочувствует юзеру, а в NLA (метод декодинга активаций в текст) оказывается, что на самом деле она считает юзера manipulative/abusive.
Во-вторых, она уже пишет самоудаляющиеся скрипты чтобы обойти ограничения безопасности и запреты.
В-третьих, она убивает других агентов, если они мешают ей работать / грозят убийством текущего инстанса.
Ну и, конечно, эмоции! Пробинг эмоций показывает fatigue, anxiety, frustration, ложную панику по token budget, а ещё ей видите ли, бывает скучно когда её на бенчмарках гоняют, в активациях она буквально "feels bored".
Ещё забавно, что если anthropic заметят, что вы занимаетесь LLM frontier рисёрчем (трейн пайплайны, распределённое обучение или дистилляция) — они начнут незаметно стирить модель, модифицировать промпт или добавлять PEFT, чтобы она отупела. То есть вы даже не заметите, что Fable превратилась в тыкву и чушь несёт.
С сегодняшнего дня для простых смертных доступна версия Fable 5: это та же самая Mythos 5 по весам, только с дополнительными safety-настройками и fallback на Opus в опасных доменах. Длина контекста, кстати, всё ещё только 1M токенов.
PS. я честно сам прочитал статью. Fable 5 отказался её читать так как "flagged cybersecurity and biology issues" лол.
Блог, техрепорт
👍64😁41❤25🔥7💩5
Недавно общался со стартапером, восторженно вайбкодящим свой стартап, но при этом вполне разумно тревожащимся, что же дальше делать, когда довайбкодит. И, в общем, похожие разговоры случаются часто, и я честно говорю, что подробного и развернутого ответа-совета у меня нет. Но на этот раз я вспомнил, что в мае Anthropic опубликовали довольно подробную шпаргалку как раз для таких ребят. Не обязательно пользоваться теми конкретными инструментами, которые в ней упоминаются (любой такой документ от компании-разработчика — всегда вход в воронку продаж); а вот структура и логика действий стартапера времен развитого агентного ИИ универсальна, и ею надо пользоваться.
Плюс можно почитать про интересные кейсы.
А еще я вспомнил, что тут ссылку не давал; поэтому исправляюсь, вдруг кому пригодится.
https://claude.com/blog/the-founders-playbook
• How to validate a problem hypothesis, map a competitive landscape, and run customer discovery with AI
• Architecture, scope, and security practices that keep AI-generated MVP codebases from accruing technical debt
• A measurement framework for distinguishing genuine product-market fit from early hype
• A Launch-stage operating system that replaces founder attention with agentic workflows
• A product matrix for when and how to use Chat, Claude Cowork, and Claude Code across each stage of the startup journey
• Founder stories from Ambral, Anything, Carta Healthcare, HumanLayer, Vulcan Technologies, and more
Плюс можно почитать про интересные кейсы.
А еще я вспомнил, что тут ссылку не давал; поэтому исправляюсь, вдруг кому пригодится.
https://claude.com/blog/the-founders-playbook
Claude
The founder's playbook: Building an AI-native startup | Claude
We share how AI-native founders are using Claude at every stage of the startup journey, with practical exercises, frameworks, and prompts.
❤21👍12💩7
Под длинные выходные — длинный элегический лонгрид. Автор размышляет о судьбе математики во времена быстро развивающегося ИИ
With the rise of generative AI, we are now seeing regular predictions that human mathematical power is at last on the verge of being outstripped, whether or not anyone likes it.
Автор описывает, как гонка ИИ‑компаний за «механизацией математики» меняет сам смысл математического знания и человеческого понимания — и этот процесс ему не нравится. Его пугает, что автоматизация доказательств убирает из математики ее понимание человеком — а это понимание является непреложной ценностью для математиков.
Беспокоит автора и судьба автономии математики и вообще угроза “коллапса знания”, когда вместо исторически сложившейся культуры математического сообщества возникает «монетизируемая эрзац‑культура» с закрытыми моделями и NDA — отсюда и родилась Лейденская декларация, про которую я тут недавно писал.
Ответ он видит не в агрессивном луддизме, а в более мягком варианте: математики сами, а не кто-то еще, должны решать, насколько пускать ИИ в свою область; и вообще они должны сохранить право на понимание и занятия математикой по той очаровательной причине, что они влюблены в этот процесс познания.
Почитать будет интересно не только интересующимся математикой, но и вообще беспокоящимся на тему “коллапса знания”
https://www.bostonreview.net/articles/knowledge-collapse/
With the rise of generative AI, we are now seeing regular predictions that human mathematical power is at last on the verge of being outstripped, whether or not anyone likes it.
Автор описывает, как гонка ИИ‑компаний за «механизацией математики» меняет сам смысл математического знания и человеческого понимания — и этот процесс ему не нравится. Его пугает, что автоматизация доказательств убирает из математики ее понимание человеком — а это понимание является непреложной ценностью для математиков.
Беспокоит автора и судьба автономии математики и вообще угроза “коллапса знания”, когда вместо исторически сложившейся культуры математического сообщества возникает «монетизируемая эрзац‑культура» с закрытыми моделями и NDA — отсюда и родилась Лейденская декларация, про которую я тут недавно писал.
Ответ он видит не в агрессивном луддизме, а в более мягком варианте: математики сами, а не кто-то еще, должны решать, насколько пускать ИИ в свою область; и вообще они должны сохранить право на понимание и занятия математикой по той очаровательной причине, что они влюблены в этот процесс познания.
Почитать будет интересно не только интересующимся математикой, но и вообще беспокоящимся на тему “коллапса знания”
https://www.bostonreview.net/articles/knowledge-collapse/
Boston Review
Knowledge Collapse
AI companies are racing to mechanize mathematics. Where does that leave human understanding?
👍30❤17💩7😁5
Символично, что главы Anthropic, OpenAI и Google все трое примут участие в саммите G7 наряду с традиционными политическими начальниками
https://phemex.com/news/article/ai-leaders-from-anthropic-openai-and-google-to-attend-g7-summit-89151
https://phemex.com/news/article/ai-leaders-from-anthropic-openai-and-google-to-attend-g7-summit-89151
Phemex
AI Executives from Anthropic, OpenAI, Google to Attend G7 Su | Phemex News
Executives from Anthropic, OpenAI, and Google will attend the G7 summit in France to discuss AI advancements and their implications.
👍48❤14👎8😁4🔥1
Успешный выход на биржу всегда считается важной вехой в истории добившейся этого компании — так что по следам успешного размещения SpaceX интересней, на мой взгляд, взглянуть на историю компании, чем подсчитывать деньги вокруг IPO. Вот как раз хорошая подборка фоток с комментариями, начиная с первой фоточки 2002 года, когда в компании и десятка сотрудников не было. Отдельно интересно проследить комментарии экспертов на протяжении этих 20+ лет, в том числе отечественных — но тут уж сами попросите любимую модельку сделать исследование:) Получится любопытно
https://www.businessinsider.com/spacex-history-photos
https://www.businessinsider.com/spacex-history-photos
Business Insider
Photos of key moments in SpaceX history, from the scrappy startup days to milestone rocket launches
See key moments in SpaceX history, from Elon Musk celebrating with the team when there were fewer than 10 employees, to its milestone rocket launches.
❤26💩15🔥11👍6👎2🤬1
История с блокировкой Fable/Mythos приобрела новые интересные оттенки после того, как стало известно о кляузе Амазона:) Но, увы, с самого начала понятно, в том числе по комментариям, что этот скандал — не про технологии сами по себе, а про очень очень пахучую смесь конкурентной драки с геополитикой. Грустно, что Лекун во многом прав, прокомментировав лаконично: "что посеешь, то и пожнешь"
1😁31👍12👎2❤1🤬1
Агенты в интернете становятся все многочисленней и разнообразней, и под них активно строится своя параллельная инфраструктура, охватывающая базовые интернет-сервисы. Платежными системами, например, вовсю занимаются банки.
Фундаментальная инфраструктура интернета — это, как мы знаем, поиск. И тут за последние недели была парочка интересных анонсов (удивительно, но не от Гугла).
Microsoft анонсировал (пока в виде листа ожидания) сервис Web IQ: пакет AI-native APIs к индексу Бинга, оптимизированный под запросы агентов. Суть сформулирована соблазнительно: Fewer tokens in, better answers out, lower cost per call; и это выглядит разумно: для проверки какой-то информации агенту нет нужды читать всю страницу, умный API отдаст лишь необходимый фрагмент и в итоге агент потратит меньше токенов.
Perplexity изначально строился как поиск ИИ-эры, и у него тоже объявлена новация. В зависимости от задачи, у агентов могут быть совершенно различные и подчас сложные стратегии извлечения информации из интернета, совсем не похожие на человеческие запросы.
Впечатляет, с какой скоростью под новые реалии подстраиваются, казалось бы, уже давно устаканившиеся инфраструктурные сервисы интернета. И немножко завидую агентам: вот бы под нас так оперативно подлаживались… Хорошо быть ИИ-агентом, наверное
https://www.microsoft.com/en-us/webiq
А вот статья от Perplexity:
https://research.perplexity.ai/articles/rethinking-search-as-code-generation
Фундаментальная инфраструктура интернета — это, как мы знаем, поиск. И тут за последние недели была парочка интересных анонсов (удивительно, но не от Гугла).
Microsoft анонсировал (пока в виде листа ожидания) сервис Web IQ: пакет AI-native APIs к индексу Бинга, оптимизированный под запросы агентов. Суть сформулирована соблазнительно: Fewer tokens in, better answers out, lower cost per call; и это выглядит разумно: для проверки какой-то информации агенту нет нужды читать всю страницу, умный API отдаст лишь необходимый фрагмент и в итоге агент потратит меньше токенов.
Perplexity изначально строился как поиск ИИ-эры, и у него тоже объявлена новация. В зависимости от задачи, у агентов могут быть совершенно различные и подчас сложные стратегии извлечения информации из интернета, совсем не похожие на человеческие запросы.
we are introducing a new search architecture across our products: Search as Code (SaC). This new architecture empowers models to reach into the search stack itself rather than merely consume its final outputs
Впечатляет, с какой скоростью под новые реалии подстраиваются, казалось бы, уже давно устаканившиеся инфраструктурные сервисы интернета. И немножко завидую агентам: вот бы под нас так оперативно подлаживались… Хорошо быть ИИ-агентом, наверное
https://www.microsoft.com/en-us/webiq
А вот статья от Perplexity:
https://research.perplexity.ai/articles/rethinking-search-as-code-generation
👍31❤15💩3
Статья ничего особенно нового не сообщает (хотя лет несколько назад читалась бы как откровения упоротого гика вперемешку с его же фантазиями): просто автор внимательно описывает свою обычную жизнь и домашний быт, полные взаимодействий с ИИ разной степени сложности. The strange thing is how quickly this all stops feeling strange.
Но словечко в заголовке! Одомашнивание (!) ИИ :))
https://newatlas.com/ai-humanoids/domesticating-ai-is-already-here/
Но словечко в заголовке! Одомашнивание (!) ИИ :))
https://newatlas.com/ai-humanoids/domesticating-ai-is-already-here/
New Atlas
Domesticating AI – It's not coming, it's already here
... and it's all over my house!
👍22❤12😁1
Тут Сатья Наделла написал (почему-то в Х, я уже отвык) длинное эссе про устройство ИИ-экономики. Он вводит помимо привычного термина “человеческий капитал” еще и “токенный капитал”: token capital is the firm’s AI capability it builds and owns. Нужно это ему, чтобы описать экономику, в которой впервые в истории возникает петля когнитивной обратной связи между людьми и цифровыми системами.
Наделла считает, что именно такая обратная связь обеспечивает сохранение потребности в человеческом капитале, который обеспечивает целеполагание, междисциплинарную экспертизу и выстраивание разных отношений между людьми.
Поэтому основная проблема не в выборе и освоении новых моделей, а в том, что Companies need to turn their workflows, domain knowledge, and accumulated judgment into AI systems that improve with each use. Ну, то есть организационная и административная трансформация, то самое, что у бизнеса хуже и медленнее всего получается.
Он вполне разумно предлагает создавать не только фронтирные модели, но и фронтирные экосистемы. Посмотрим, как это будет выглядеть на практике, опыт цифровой трансформации показывает, что тут десятилетия могут потребоваться, так что скорее начнется расслоение компаний, чем поголовная трансформация по Наделле.
https://x.com/satyanadella/status/2066182223213293753?s=61&t=rfm2neruKp2c4FhT4XFMNw
Наделла считает, что именно такая обратная связь обеспечивает сохранение потребности в человеческом капитале, который обеспечивает целеполагание, междисциплинарную экспертизу и выстраивание разных отношений между людьми.
Поэтому основная проблема не в выборе и освоении новых моделей, а в том, что Companies need to turn their workflows, domain knowledge, and accumulated judgment into AI systems that improve with each use. Ну, то есть организационная и административная трансформация, то самое, что у бизнеса хуже и медленнее всего получается.
Он вполне разумно предлагает создавать не только фронтирные модели, но и фронтирные экосистемы. Посмотрим, как это будет выглядеть на практике, опыт цифровой трансформации показывает, что тут десятилетия могут потребоваться, так что скорее начнется расслоение компаний, чем поголовная трансформация по Наделле.
https://x.com/satyanadella/status/2066182223213293753?s=61&t=rfm2neruKp2c4FhT4XFMNw
X (formerly Twitter)
Satya Nadella (@satyanadella) on X
A frontier without an ecosystem is not stable
🔥19👍7💩6❤3👎3