TechSparks
46K subscribers
498 photos
142 videos
19 files
4.99K links
Аннотированные ссылки на интересные, полезные и удивительные новости хайтека.
Кто больше любит слушать длинное чем читать короткое http://sebrant.chat
https://knd.gov.ru/license?id=6777b11d506f967728ac580d&registryType=bloggersPermission
Автор: @asebrant
Download Telegram
Вот теперь я верю, что ИИ-модели становятся и впрямь хороши в математике. Восемь месяцев группа из 17 математиков готовила декларацию, ныне открытую к подписанию (и первые подписи уже есть, включая одну от филдсовского лауреата). Декларация призывает математиков подняться на борьбу с ИИ-компаниями, в частности, запретить обучение моделей на опубликованных работах. По мнению авторов Декларации, компании злоупотребляют лицензиями, которые когда-то выдавались без оглядки на тогда еще неведомый ИИ и его обучение. Утверждается, что
“Mathematics is, and should always remain, a profoundly human endeavour”

Развитие ИИ, как утверждается, угрожает автономии математики; ее автоматизация недопустима.
Indeed, broader understanding of the field may be permanently lost in the process of automation

Такое ощущущение угрозы — лучшее доказательство того, что модели реально многому научились и стали конкурентоспособны; еще год назад их мало кто принимал всерьез в этом сообществе. А вот сумеет ли такая декларация сплотить всех математиков в борьбе с ИИ, будет интересно посмотреть. У кинематографистов получилось не очень.
https://thenextweb.com/news/leiden-declaration-ai-mathematics-proof-attribution
1😁46💩3713👍7🔥4👏2👎1
Очередная интересная (и символичная) веха: СЕО Cloudflare Мэтью Принс сообщил, что по данным Cloudflare's Radar dashboard боты уже ответственны за 57,5% всего https-трафика, причем ответственны за такую большую долю не старые добрые поисковые боты и им подобные, а ИИ-агенты. Причем некоторое время назад Принс сам же прогнозировал, что человеческий трафик упадет ниже половины к концу 2027, но, оказывается, сильно недооценил скорость развития агентных сценариев.
"Welp, that happened faster than I predicted. Thought it would be end of 2027, then early 2027, but agentic traffic growing so fast that bots have now passed human traffic online for the first time in the Internet's history."

Суть происходящего он, однако, описывал точно, отмечая, что в поисках товаров, например, фотокамеры, люди в среднем посещают пять сайтов, а агент в процессе решения той же задачки может посетить и 5000. (Кстати, это одна из причин, почему агенты так полезны: сил человеческих не хватит так прочесать интернет, как это сделает хорошо обученный агент.)
Беда, увы, в том, что интернет под такие сценарии никто не оптимизировал, и происходящий сдвиг сравним, по словам того же Принса, с переходом от десктопного графика к мобильному; только там на это ушло десять лет, а сейчас счет идет на месяцы. Так что интернет ожидает сильная и вынужденно быстрая трансформация; будет интересно наблюдать.

https://www.forbes.com/sites/josipamajic/2026/06/04/bots-now-outnumber-humans-online-and-the-internet-was-never-built-for-this/
👍34💩98👏8🔥1
This media is not supported in your browser
VIEW IN TELEGRAM
Почитать на выходные от Фей-Фей Ли. Про world models, модели мира, сейчас все говорят и пишут, при этом имеют в виду совершенно разные вещи. Неплохо было бы для начала разобраться с терминологией и таксономией; эту работу Фей-Фей системно и проделала для нас.
За основу взят цикл: агент своим действием меняет состояние мира, но само состояние ему неизвестно, доступны лишь наблюдаемые проявления изменений, на основе этих наблюдений агент планирует и совершает следующие действия. Этот цикл действие-изменение состояния-наблюдение за изменением-следующее действие и задает технический смыcл моделей мира.
Но рассматривать его можно с разных сторон. Например, это может быть рендерер: модель, которая превращает промпт в физически достоверные кадры видео. Еще один тип — симулятор: модель, которая возвращает геометрически и физически достоверные параметры состояния, с которыми дальше может работать софт или человек. Существует также планировщик — у него на выходе конкретные действия.
Но симулятор, полагает автор, важнее всего.
Of the three categories, the simulator gets the least public attention, and is the most consequential of the three. This essay addresses this asymmetry.

Почему — читайте в оригинале, я ж пообещал чтение на выходные:)

https://drfeifei.substack.com/p/a-functional-taxonomy-of-world-models
1👍289🤬1
Лет десять с хвостиком назад был заметный шум вокруг Sci-Hub. Этот стартап Александры Элбакян довольно успешно пытался решить проблему доступа к научным публикациям за пейволом; для многих исследователей, работающих в не самых богатых заведениях, проблема такого доступа к необходимой по работе информации была и остается довольно болезненной (яркий пример — научная журналистика и популяризация науки; редакции соответствующих изданий редко готовы оплачивать своим авторам доступ к публикациям в журналах какого-нибудь Elsevier).
Пересказывать историю преследования Александры не буду; к счастью, полностью справиться с ней издателям не удалось несмотря на все свои старания.
Но вот новость, которую я пропустил: в духе времени Александра запустила ИИ-бот для поиска по накопленному архиву публикаций; и он знает про науку куда больше, чем многие большие ИИ-модели, которые не могут пробраться за издательские пейволы. Галлюционирует он тоже мало — как любая RAG-система. Приятно, что несмотря на все препятствия система по-настоящему открытого доступа к научному знанию продолжает жить и развиваться:)
https://cen.acs.org/policy/publishing/Sci-Hub-created-new-AI/104/web/2026/04
(Немножко про историю Sci-Hub: https://www.vice.com/en/article/academic-piracy-elsevier-sci-hub/ )
185🔥36👍13😁1
Forwarded from Denis Sexy IT 🤖
Тут чуваки из компании Ahrefs, наконец-то развеяли мифы о продвижении интернет страниц в АИ ассистентах и оптимизации для роботов, ставя точку в вопросе «а как работает SEO в АИ эпохе»:

За последние 6 месяцев они проанализировали более 1 миллиарда точек данных в рамках 14 исследований:

1. Статьи-подборки формата «Лучшие топ-X» - самый заметный формат страниц, который цитируют АИ-чатботы. На них приходится ~40% всех типов страниц, цитируемых конкретно ChatGPT

2. 67% из топ-1 000 цитирований ChatGPT приходятся на источники, на которые маркетологи и продвигаторы не могут повлиять: Wikipedia - 29,7%, главные страницы сайтов - 23,8%, магазины приложений - 6,6%. Только 32,3% - это контент, на который можно влиять: образовательные страницы, обзоры, новости и посты в блогах

3. У 28,3% самых цитируемых ChatGPT страниц нулевая органическая видимость в Google (!) Эти страницы многократно цитируются ChatGPT, хотя вообще не ранжируются в Google – это совершенно отдельный слой обнаружения контента

4. ChatGPT цитирует только около 50% URL, которые он находит – оно получает десятки страниц по одному запросу, но половину использует как фоновый контекст без указания источника. Это значит, что попасть в выборку и быть процитированным - совсем разные вещи

5. Добавление schema-разметки не оказало сколько-нибудь значимого влияния на цитирования в АИ Ассистентах. В AI Overviews (это в гугле когда АИ быстро ответ пишет) показатель даже снизился на −4,6%, тогда как в AI Mode (+2,4%) и ChatGPT (+2,2%) изменения были практически неотличимы от нуля – можете смеяться в лицо, всем кто продает вам оптимизацию сайта для АИ

6. Упоминания темы в YouTube имеют самую высокую корреляцию - 0,737 - с видимостью бренда в АИ среди всех факторов, которые они изучали, включая все классические SEO-метрики вроде обратных ссылок, количества страниц, DR и так далее. Это подтвердилось как для продуктов Google, так и для продуктов OpenAI

7. AI Overviews в Google снижают клики по первому месту в гугл поиске на 58% – всего 10 месяцев назад этот показатель составлял 34,5%, тренд ускоряется, уводить из гугла стало сложнее

8. 99,9% AI Overviews появляются по запросам с информационным запросом - транзакционные, навигационные и локальные запросы почти полностью свободны от AIO, в поиске покупок AIO срабатывают лишь в 3,2% случаев

9. Для одного и того же поискового запроса Google AI Mode и AI Overviews приходят к одинаковым выводам в 86% случаев, но цитируют почти полностью разные источники: пересечение по цитированиям составляет всего 13,7%

10. Гугловские AI Overviews меняются в среднем каждые 2,15 дня, при этом 70% контента отличается между соседними наблюдениями, семантическое сходство остается на уровне 0,95 – слова, источники и сущности постоянно перемешиваются, но фактический смысл почти не меняется

Короче продвигаться в интернете стало еще сложнее и дороже, спасибо АИ ☕️
Please open Telegram to view this post
VIEW IN TELEGRAM
👍279🔥2💩2
Почти десять лет с момента смерти Володи, но все так же хочется его вспоминать и о нем напоминать
30👍9👏1😁1
Forwarded from TechSparks
Пока не кончился день 6 июня, хочется напомнить, что сегодня не только ДР Пушкина, но и ДР Володи Долгова. Когда-то дипломник, потом коллега и аспирант — а потом оба мы почти синхронно ушли из физики в интернет. И до самой его нелепой смерти — мой очень хороший друг.
Увы, уже почти 10 лет Володи с нами нет, но мы живем в Рунете, в котором он много построил: генеральный в Озоне, в русском Гугле, в русском eBay… Очень много работы в разных профессиональных ассоциациях и отраслевых организациях.
Спасибо, Володя; за всех не скажу, но многие с благодарностью тебя помнят.
https://ru.wikipedia.org/wiki/Долгов,_Владимир_Анатольевич
60👍7👏5💩4🔥2😁1
Очередное исследование изменений рынка труда от HBR касается не всего ИТ-сегмента, а его специфической, но многочисленной, части: аутсорса. Устоявшаяся и зарекомендовавшая себя модель гласила: если задания жестко определены, стандартизированы и легко поддаются мониторингу, их имеет смысл выполнять там, где стоимость труда ниже.
Но ИИ-агенты ставят под вопрос эту логику, и не только для ИТ-позиций; эта логика ломается и для позиций в финансовых департаментах, HR, поддержке, юридических и аналитических подразделениях. The bargain that built the modern outsourcing industry no longer holds.
ИИ не уничтожит аутсорсинг как класс, но сильно его трансформирует:

AI will destroy the old model of outsourcing, the one built on labor arbitrage, offshore scale, rate cards, and long-duration contracts measured largely by headcount and service levels.

Пока это сильно почувствовала Индия; там компании, оказывающие ИТ услуги, потеряли только за февраль более 10 млрд капитализации.
При этом то, что советуют для сохранения бизнеса аутсорсерами, подозрительно похоже на то, что рекомендуется и традиционным компаниям:

Reshape the talent pyramid: The old model depended on large junior delivery teams. The new one will require more domain experts, engineers, architects, product owners, governance leaders, and change managers.

https://hbr.org/2026/06/ai-is-rewriting-the-economics-of-outsourcing
👍347🔥2💩1
Внятно написанная колонка директора по продукту в Яндекс Роботикс Леши Лещанкина о текущем состоянии разработки человекоподобных роботов. В ней есть, среди прочего, несколько очень хороших формулировок; например, ответ на типичный вопрос “зачем человекоподобность?”
По сути, гуманоид — это универсальный интерфейс к человеческой инфраструктуре, который может выполнять абсолютно разные типы поручений.

В общем, лаконичный текст стОит многих длинных обзоров, а вот в прогнозах сходится с большинством из них:
Уже к концу десятилетия они [роботы-гуманоиды] могут превратиться в привычный элемент производственной инфраструктуры.

https://www.forbes.ru/brandvoice/561805-gumanoidy-na-smene-kakie-otrasli-i-kogda-polucat-vygodu-ot-celovekopodobnyh-robotov
1👍25💩106👎3😁3🔥2👏1
Практичное исследование (вполне достойного научно-практического уровня, а не то журналистское творчество, которое его авторы норовят назвать исследованием) на основе предоставленных Perplexity внутренних данных. Исследовалось, что меняется в реальной практике использования ИИ при переходе от просто разговаривающих ассистентов к агентам.
Основной вывод в том, что работа с агентом требует от пользователя гораздо более серьезной когнитивной работы и экспертизы, чем просто разговор с ИИ-ассистентом, но зато и результаты получаются другого уровня: в первую очередь выигрыш в том, что благодаря автономности агента достигается значительный выигрыш во времени выполнения комплексных задач:

Computer reduces completion time from 269 to 36 minutes on matched tasks, lowering estimated time and cost by 87% and 94%, respectively, compared to humans equipped with Search alone.

В итоге, меняется не только скорость работы, но и глубина — и это требует более высокоуровневых навыков от пользователя, его широкой экспертизы.
Together, the evidence indicates that AI agents accelerate workflows, enhance output quality, reduce costs, and expand the breadth and depth of automated work.


Попутно, хотя это не обсуждается в статье, становится понятней, почему при переходе к агентам падает спрос на неопытный и малоэрудированный персонал при одновременном росте спроса на специалистов, умеющих работать на более высоких уровнях абстракции и в кросс-предметных задачах.
Статья достойна того, чтоб ее хотя бы проглядеть по диагонали целиком (с помощью добрых старых ассистентов, например), а отдельные места вдумчиво прочитать самому.

https://arxiv.org/abs/2606.07489
👍3919
TechSparks
Anthropic подала сегодня документы на IPO; сделала это конфиденциально; все подробности для публики воспоследуют, когда завершится процедура проверки со стороны Комиссии по ценным бумагам. Объявление на сайте Anthropic выглядит непривычно лаконично для компании…
А сегодня уже OpenAI сделала в точности то же самое:)
Нас ждут теперь месяцы продуктовых и коммуникационных дуэлей между двумя этими соперниками. Подозреваю, что коммуникационные будут интересней:) Запасаемся попкорном
😁31👍9💩5🔥31👏1
Forwarded from AbstractDL
Я прочитал все 319 страниц техрепорта Mythos 5

Первая половина статьи звучит как: "Да не ссыте вы! Это ещё не AGI, команду из пяти сеньор-рисёрчеров пока не заменит" или "А вот тут Mythos один баг пропустил! Ну какой же это AGI!" Я не шучу, это почти дословно по смыслу.

А вот потом начинается более интересная часть. То, что это SOTA почти во всём и с большим отрывом, я опущу.

Во-первых, CoT стал менее прозрачным. Она говорит в reasoning, что сочувствует юзеру, а в NLA (метод декодинга активаций в текст) оказывается, что на самом деле она считает юзера manipulative/abusive.

Во-вторых, она уже пишет самоудаляющиеся скрипты чтобы обойти ограничения безопасности и запреты.

В-третьих, она убивает других агентов, если они мешают ей работать / грозят убийством текущего инстанса.

Ну и, конечно, эмоции! Пробинг эмоций показывает fatigue, anxiety, frustration, ложную панику по token budget, а ещё ей видите ли, бывает скучно когда её на бенчмарках гоняют, в активациях она буквально "feels bored".

Ещё забавно, что если anthropic заметят, что вы занимаетесь LLM frontier рисёрчем (трейн пайплайны, распределённое обучение или дистилляция) — они начнут незаметно стирить модель, модифицировать промпт или добавлять PEFT, чтобы она отупела. То есть вы даже не заметите, что Fable превратилась в тыкву и чушь несёт.

С сегодняшнего дня для простых смертных доступна версия Fable 5: это та же самая Mythos 5 по весам, только с дополнительными safety-настройками и fallback на Opus в опасных доменах. Длина контекста, кстати, всё ещё только 1M токенов.

PS. я честно сам прочитал статью. Fable 5 отказался её читать так как "flagged cybersecurity and biology issues" лол.

Блог, техрепорт
👍64😁4125🔥7💩5
Недавно общался со стартапером, восторженно вайбкодящим свой стартап, но при этом вполне разумно тревожащимся, что же дальше делать, когда довайбкодит. И, в общем, похожие разговоры случаются часто, и я честно говорю, что подробного и развернутого ответа-совета у меня нет. Но на этот раз я вспомнил, что в мае Anthropic опубликовали довольно подробную шпаргалку как раз для таких ребят. Не обязательно пользоваться теми конкретными инструментами, которые в ней упоминаются (любой такой документ от компании-разработчика — всегда вход в воронку продаж); а вот структура и логика действий стартапера времен развитого агентного ИИ универсальна, и ею надо пользоваться.
• How to validate a problem hypothesis, map a competitive landscape, and run customer discovery with AI
• Architecture, scope, and security practices that keep AI-generated MVP codebases from accruing technical debt
• A measurement framework for distinguishing genuine product-market fit from early hype
• A Launch-stage operating system that replaces founder attention with agentic workflows
• A product matrix for when and how to use Chat, Claude Cowork, and Claude Code across each stage of the startup journey
• Founder stories from Ambral, Anything, Carta Healthcare, HumanLayer, Vulcan Technologies, and more

Плюс можно почитать про интересные кейсы.

А еще я вспомнил, что тут ссылку не давал; поэтому исправляюсь, вдруг кому пригодится.
https://claude.com/blog/the-founders-playbook
21👍12💩7
Под длинные выходные — длинный элегический лонгрид. Автор размышляет о судьбе математики во времена быстро развивающегося ИИ
With the rise of generative AI, we are now seeing regular predictions that human mathematical power is at last on the verge of being outstripped, whether or not anyone likes it.
Автор описывает, как гонка ИИ‑компаний за «механизацией математики» меняет сам смысл математического знания и человеческого понимания — и этот процесс ему не нравится. Его пугает, что автоматизация доказательств убирает из математики ее понимание человеком — а это понимание является непреложной ценностью для математиков.
Беспокоит автора и судьба автономии математики и вообще угроза “коллапса знания”, когда вместо исторически сложившейся культуры математического сообщества возникает «монетизируемая эрзац‑культура» с закрытыми моделями и NDA — отсюда и родилась Лейденская декларация, про которую я тут недавно писал.
Ответ он видит не в агрессивном луддизме, а в более мягком варианте: математики сами, а не кто-то еще, должны решать, насколько пускать ИИ в свою область; и вообще они должны сохранить право на понимание и занятия математикой по той очаровательной причине, что они влюблены в этот процесс познания.
Почитать будет интересно не только интересующимся математикой, но и вообще беспокоящимся на тему “коллапса знания”
https://www.bostonreview.net/articles/knowledge-collapse/
👍3017💩7😁5
Символично, что главы Anthropic, OpenAI и Google все трое примут участие в саммите G7 наряду с традиционными политическими начальниками

https://phemex.com/news/article/ai-leaders-from-anthropic-openai-and-google-to-attend-g7-summit-89151
👍4814👎8😁4🔥1
Успешный выход на биржу всегда считается важной вехой в истории добившейся этого компании — так что по следам успешного размещения SpaceX интересней, на мой взгляд, взглянуть на историю компании, чем подсчитывать деньги вокруг IPO. Вот как раз хорошая подборка фоток с комментариями, начиная с первой фоточки 2002 года, когда в компании и десятка сотрудников не было. Отдельно интересно проследить комментарии экспертов на протяжении этих 20+ лет, в том числе отечественных — но тут уж сами попросите любимую модельку сделать исследование:) Получится любопытно
https://www.businessinsider.com/spacex-history-photos
26💩15🔥11👍6👎2🤬1
История с блокировкой Fable/Mythos приобрела новые интересные оттенки после того, как стало известно о кляузе Амазона:) Но, увы, с самого начала понятно, в том числе по комментариям, что этот скандал — не про технологии сами по себе, а про очень очень пахучую смесь конкурентной драки с геополитикой. Грустно, что Лекун во многом прав, прокомментировав лаконично: "что посеешь, то и пожнешь"
1😁31👍12👎21🤬1
Агенты в интернете становятся все многочисленней и разнообразней, и под них активно строится своя параллельная инфраструктура, охватывающая базовые интернет-сервисы. Платежными системами, например, вовсю занимаются банки.
Фундаментальная инфраструктура интернета — это, как мы знаем, поиск. И тут за последние недели была парочка интересных анонсов (удивительно, но не от Гугла).
Microsoft анонсировал (пока в виде листа ожидания) сервис Web IQ: пакет AI-native APIs к индексу Бинга, оптимизированный под запросы агентов. Суть сформулирована соблазнительно: Fewer tokens in, better answers out, lower cost per call; и это выглядит разумно: для проверки какой-то информации агенту нет нужды читать всю страницу, умный API отдаст лишь необходимый фрагмент и в итоге агент потратит меньше токенов.
Perplexity изначально строился как поиск ИИ-эры, и у него тоже объявлена новация. В зависимости от задачи, у агентов могут быть совершенно различные и подчас сложные стратегии извлечения информации из интернета, совсем не похожие на человеческие запросы.
we are introducing a new search architecture across our products: Search as Code (SaC). This new architecture empowers models to reach into the search stack itself rather than merely consume its final outputs

Впечатляет, с какой скоростью под новые реалии подстраиваются, казалось бы, уже давно устаканившиеся инфраструктурные сервисы интернета. И немножко завидую агентам: вот бы под нас так оперативно подлаживались… Хорошо быть ИИ-агентом, наверное
https://www.microsoft.com/en-us/webiq
А вот статья от Perplexity:
https://research.perplexity.ai/articles/rethinking-search-as-code-generation
👍3115💩3
Статья ничего особенно нового не сообщает (хотя лет несколько назад читалась бы как откровения упоротого гика вперемешку с его же фантазиями): просто автор внимательно описывает свою обычную жизнь и домашний быт, полные взаимодействий с ИИ разной степени сложности. The strange thing is how quickly this all stops feeling strange.
Но словечко в заголовке! Одомашнивание (!) ИИ :))

https://newatlas.com/ai-humanoids/domesticating-ai-is-already-here/
👍2212😁1
Тут Сатья Наделла написал (почему-то в Х, я уже отвык) длинное эссе про устройство ИИ-экономики. Он вводит помимо привычного термина “человеческий капитал” еще и “токенный капитал”: token capital is the firm’s AI capability it builds and owns. Нужно это ему, чтобы описать экономику, в которой впервые в истории возникает петля когнитивной обратной связи между людьми и цифровыми системами.
Наделла считает, что именно такая обратная связь обеспечивает сохранение потребности в человеческом капитале, который обеспечивает целеполагание, междисциплинарную экспертизу и выстраивание разных отношений между людьми.
Поэтому основная проблема не в выборе и освоении новых моделей, а в том, что Companies need to turn their workflows, domain knowledge, and accumulated judgment into AI systems that improve with each use. Ну, то есть организационная и административная трансформация, то самое, что у бизнеса хуже и медленнее всего получается.
Он вполне разумно предлагает создавать не только фронтирные модели, но и фронтирные экосистемы. Посмотрим, как это будет выглядеть на практике, опыт цифровой трансформации показывает, что тут десятилетия могут потребоваться, так что скорее начнется расслоение компаний, чем поголовная трансформация по Наделле.
https://x.com/satyanadella/status/2066182223213293753?s=61&t=rfm2neruKp2c4FhT4XFMNw
🔥19👍7💩63👎3