TechSparks
46.7K subscribers
311 photos
75 videos
15 files
4.31K links
Аннотированные ссылки на интересные, полезные и удивительные новости хайтека.
Тем, кто больше любит слушать длинное чем читать короткое — могу посоветовать свой подкаст ;) http://sebrant.chat

Вопросы - @asebrant
Download Telegram
И вот даже лучше, потому что там видно реакцию команды. Колоссальные им поздравления! 🙂
Forwarded from 🐱 The Man Who Sold The World 🐱
This media is not supported in your browser
VIEW IN TELEGRAM
Ну а теперь Старшип приводнился, как и было задумано, где-то в Индийском океане.
И пока я смотрел красивую и устойчивую картинку с корабля на протяжении всего полета, я думал о том, какое количество бесценной телеметрии получает команда разработки в процессе, и насколько мощно работает Starlink, обеспечивая прием и трансляцию на Землю всего этого потока видео и ценнейших данных с датчиков, которыми напичкан корабль. И какое это конкурентное преимущество и одновременно подспорье в дальнейшей разработке кораблей.
Супер поздравления и уважение всей команде SpaceX! Сегодня у них великий день.
Тема robopets, роботизированных питомцев, стара почти как ИТ: тамагочи тому подтверждением. Лидером в этой области исторически является Япония, собачка Aibo от Sony стала чуть ли не символом роботизированных домашних зверушек.
А теперь в эту нишу постучалась Casio.
выпустив мохнатое нечто, на сходство с конкретным животным не претендующее (хотя некоторые видят хомяка). Новое создание называется Moflin, это результат коллаборации со стартапом Vanguard Industries. Питомец умеет только ластиться, но ИИ-технологии позволяют ему узнавать хозяина по голосу и типу движений — и отвечать уникальными звуками и небольшими движениями: не уверен насчет хомяков, но такое поведение копирует некоторых знакомых котов. Утверждается, что ИИ поможет питомцу со временем расширять гамму демонстрируемых эмоций.
Считается, что относительно недорогой девайс (около 400 долларов разовая покупка, около 44 долларов месячная плата по подписной модели) поможет пожилым, одиноким и страдающим от психологических проблем людям. В продаже в Японии ожидается с 7 ноября.
https://www.theverge.com/2024/10/11/24268063/casio-robot-pet-moflin
Вообще, уместное встраивание ИИ в сложный пайплайн разного серьезного софта (поиск или видеоредактор лишь два успешных примера) -- набирающий силу тренд: на коленке это не делается, времени жрет много, но многие начали еще в прошлом году и доработали до продакшена, и еще следующий год будут радовать в разных местах такими интеграциями. По мне такое преображение традиционного софта часто полезней и удивительней, чем наспех с нуля слепленные чисто ИИшные новинки
Forwarded from Метаверсище и ИИще (Sergey Tsyptsyn ️️)
This media is not supported in your browser
VIEW IN TELEGRAM
Адобченко показывает, как надо встраивать ИИ в продукты.

Я потом приподвзвизжу отдельным постом про AdobeMax, который идет прямо сейчас.
А сейчас поглядите, какой UI\UX должен быть у всех этих видеогенераторов.
Не сгенерить, а потом копировать, импортировать, резать, переделывать, копировать, импортировать..
А генерить прямо в пайплайне. По месту, так сказать.
Ну и многие не поняли - это генерация вместе СО ЗВУКОМ

@cgevent
ну, и продолжение темы Adobe.
Когда-то они задали стандарты профессионального ретуширования, теперь достойно стараются сформировать стандарты профессионального применения генеративной графики в рабочих пайпланйах. (Напомню, они с самого начала заявили, что тренируют модели на чистых датасетах и готовы брать ответственность, если кто начнет возмущаться, что у него украли)
Вот теперь Adobe GenStudio for Performance Marketing обеспечивает подготовку в массовом порядке кастомизированных маркетинговых материалов, причем в соответствии с брендовыми гайдлайнами. При правильной интеграции в процессы оптимизации перформанс-маркетинга, особенно для компаний с длинной продуктовой линейкой и работающих на разных рынках, офигенные результаты может дать.
Отличная иллюстрация про маркетинг будущего, про который меня иногда спрашивают:)

https://www.forbes.com/sites/marksparrow/2024/10/14/adobes-genstudio-for-performance-marketing-will-change-how-ads-are-made/
Уже второй день ходит новость, которой я сначала не поверил: когда немного знаком со строительством и запуском датацентров, возникают какие-то грубые представления о масштабах сроков — а тут они явно были на порядок с гаком короче. Ну и Маск умеет для красного словца выдать желаемое за свершившееся.
Но, похоже, действительно Дженсен Хуанг ошеломлен, а инженеры Маска очередной раз сделали то, что опытные и косные эксперты считали невозможным. Маск говорит о запуске кластера на 100 000 GPU за 19 дней. Обычно речь в таких проектах идет на годы. Конечно, хочется уточнить, как именно фиксировались начало и конец 19-дневного периода, но даже если речь о готовом здании и отсчет шел с момента получения карточек, до первых наладочных работ -- срок меньше 3 недель выглядит фантастикой.
С другой стороны ловля бустера Super heavy захватами на башне тоже выглядела фантастикой, пока не случилась…
На всяк случай — две ссылки 🙂
https://www.tomshardware.com/pc-components/gpus/elon-musk-took-19-days-to-set-up-100-000-nvidia-h200-gpus-process-normally-takes-4-years

https://www.techspot.com/news/105149-elon-musk-xai-built-100000-gpu-supercluster-19.html
Как-то скучно завершилась многолетняя и многомиллиардная эпопея HoloLens. Я периодически тут ссылался на очередные новости, в основном про контракт с военными, по которому за 10 лет Microsoft должна была получить больше 20 млрд долл — если б все шло гладко.
Вообще история тянется больше 10 лет, первый образец устройства показали публике аж в 2015 и тогда это было вау: наложение информационного слоя на реальность вокруг. Памятуя проблемы Google Glass, Microsoft сразу заявила, что это не потребительский, а бизнесовый девайс. Но и здесь не пошло, и к 2022 компания объявила, что третьего поколения не будет. За годы, прошедшие со старта продаж, удалось продать 40 - 60 тыс устройств, т.е. заработать в лучшем случае 200 с чем-то миллионов на потраченные миллиарды. Начались разброд, шатания и увольнения, и начала сыпаться даже военная часть проекта, поскольку многие тестировщики из военных были не в восторге от устройства и опасались его применять в боевой обстановке — хотя фотки были очень стильные. И теперь, когда вся ставка на ИИ, и на это брошены все ресурсы, судьба очков стала очевидна, а военный проект будет, скорее всего, передан группе компаний (одну из которых Microsoft недавно купила).
Теперь интересно, во что выльются тоже миллиарды, потраченные еще двумя гигантами: Мета и Эппл
https://africa.businessinsider.com/news/microsoft-lost-billions-of-dollars-on-hololens-and-its-huge-ivas-military-contract-is/symf9vy
IQ Media НИУ ВШЭ 🤝 Яндекс Образование: мы запускаем спецпроект и отдельную рубрику в медиа, где будем изучать искусственный интеллект в учебном процессе

Первый материал уже вышел — он объясняет, как применять нейросети при написании курсовых и дипломных работ. Внутри можно найти примеры сценариев использования ИИ и истории студентов, которые уже работали с нейросетью.

Будущие статьи посвятим не только технологиям в образовании, но и новым современным подходам в учёбе, доступных возможностям и карьерному росту. Следите за обновлениями!
Когда Цукерберг представил новейшие AR-очечки Orion, было много ахов и охов и по поводу возможностей девайса, и по поводу цены. Тогда я не успел посмотреть, что именно делает заветный девайс столь дорогим (стоимость собственно производства 10К долларов) и не готовым к серийному выпуску.
А сейчас наткнулся на толковую статью на тему.
Комплект состоит из трех частей: собственно очки весом около 100 г, вычислительный блок с аккумулятором и браслет для электромиографии. Две последние вещицы хотя и содержат современную топовую электронику (а очки еще и магниевую рамку), на 10 тыс долларов все-таки не тянут.
А вот оптика в очках оказалась интересней. Линзы в них сделаны из карбида кремния, материала в принципе давно известного, не в таком виде (чаще -- в виде абразивного порошка). Карбид кремния — интересное вещество, которое можно сравнивать с алмазом и по показателю преломления (2,65-2,69 против 2,42), и по твердости (9-9,5 по Моосу против 10). Поцарапать очки из него будет непросто:) За это его очень любят ювелиры (под именем муассанит). Применений у него миллион, но ни в одном раньше не требовалось создавать достаточно большие, несколько сантиметров в поперечнике, пластины оптического качества.
И вот эти-то “стеклышки” оказываются дороже изощреннейшей компактной электроники, именно они дают основной вклад в неприятную цену.
Интересно, что будет дальше: разработано и налажено производство оптического карбида кремния с низкой ценой или найдут материал подешевле, но с похожими свойствами.

https://spectrum.ieee.org/meta-ar-glasses-expense
По не совсем мне понятным причинам, полагается изучать и как-то учитывать в своей работе тренды от Гартнера, хотя, на мой взгляд, там обычно странный коктейль уже случившегося и того, что неизвестно когда наступит — и подается это с этикеткой уже следующего года.
Вот свеженькие тренды-2025.

1. ИИ-агенты — ну как бы уже вовсю тестируется и Майкрософтом и Сейлзфорсом (не говоря уж о тьме разработчиков помельче). Ну да, 2025 будет первым годом их широкого тестирования и местами внедрения.
2. Платформы управления ИИ — угу, государства вовсю над этим трудятся, что-то в 2025 начнет работать.
1. Дезинформационная безопасность — красивый термин для все той же борьбы с фейками
2. Постквантовая криптография — Гартнер пугает, что к 2029 вся текущая криптография помрет, надо срочно переходить — но неизвестно на что.
3. Окружающий незримый интеллект — красивый термин для технологий умного дома и вообще умной среды
4. Энергосберегающие вычисления — модная тема, все трудятся
5. Гибридные вычисления — в том смысле, что структура вычислительных мощностей становится сложней. Ну ладно.
6. Spatial Computing — термин взят у Apple и те сами не рассчитывают, что в 2025 будет какой-то крутой перелом.
7. Многофункциональные роботы. Ну, да.
8. Нероусилители для людей — это пока непонятно когда.
https://www.zdnet.com/article/gartners-2025-tech-trends-show-how-your-business-needs-to-adapt-and-fast/
Кай-Фу Ли объявил войну Nvidia и всей ИИ-экосистеме США.
И судя по его последним достижениям, шансы победить есть.

Потрясающе интересное выступление китайского ИИ гуру Кай-Фу Ли будут теперь долго обсуждать. Это абсолютно революционное выступление, прозвучавшее на закрытой дискуссии Collective[i] Forecast, Ли посвятил трем темам.
1. ИИ-экосистема США (основа мировой ИИ-экосистемы) «невероятно больна». Её необходимо кардинально перестроить, иначе на реальном (практическом) прогрессе ИИ можно ставить крест.
Сегодня ИИ-экосистема состоит из Nvidia и мелких производителей ИИ чипов. При этом производители чипов для ИИ зарабатывают сейчас в год $75 млрд, а вендоры ИИ-инфраструктуры – лишь $10 млрд и вендоры ИИ-приложений — лишь $5 млрд».
«Если мы продолжим работать в этой перевернутой пирамиде, это станет проблемой» — сказал Ли. Т.к. это беспрецедентный переворот в экономике классической технологической отрасли. Традиционно производители приложений получают больше, чем поставщики чипов и систем (напр. Salesforce, внедряя CRM, получает куда больше, чем Dell и Intel, производящие компьютеры и чипы для запуска CRM в облаке)
Оздоровить ИИ-экосистему может лишь создание ИИ-компаниями собственных вертикальных интегрированных технологических стеков, как это сделала Apple с iPhone. Только так станет возможным значительно снизить стоимость генеративного ИИ.
2. Главным направление в разработке моделей должно стать снижение стоимости вывода – это самое важное для создания востребованных бизнесом приложений с ИИ.
Сегодняшняя стандартная стоимость сервиса типа GPT-4 составляет $4,40 за млн токенов. Это эквивалентно 57 центам за запрос —и это непростительно дорого, ибо поисковый запрос в Google (без всякого ИИ) обойдется в 180 раз дешевле.
3. Вторым важнейшим направлением в разработке моделей должен стать переход от универсальных базовых моделей к «экспертным моделям».
Бизнесу нужны не универсальные модели, обученные на океанах неразмеченных данных, собранных из Интернета и других источников. Подход «экспертных моделей» подразумевает создание множества нейронок, обученных на отраслевых данных. Это может обеспечить достижение того же уровня «интеллекта», что и универсальная базовая модель, при использовании гораздо меньшей вычислительной мощности.

Самое потрясающее, что все 3 пункта – это не предложения, основанные на предположениях. Стартап Кай-Фу Ли «01.ai» уже делает все это на практике.
И не просто делает, а уже добивается уникальных результатов.

• Их новая модель Yi-Lightning занимает 6-е место в мире (выше выпущенной 5 мес назад GPT-4o). Но при этом это очень маленькая модель, которая чрезвычайно быстра и недорога (всего $0,14 за млн токенов ). Её производительность сопоставима с Grok-2. Но она обучалась всего на 2000 H100 в течение 1 месяца. Что демонстрирует ненужность 100 тыс H100 и ярдов затрат (обучение Yi-Lightning стоило всего $3 млн).
01.ai применяет «экспертный» подход к сбору данных. И хотя «инженерам приходится проводить массу неблагодарной черновой работы» по маркировке и ранжированию данных, но – как считает Ли, - Китай с его резервом дешевых инженерных кадров может сделать это лучше, чем США.
• И даже в создании собственного вертикального интегрированного техно-стека есть прогресс. Напр, за счет использования собственных аппаратных инноваций, стоимость одного запроса к ИИ-поисковику BeaGo составляет всего около 1 цента (что приблизилось к стоимости запроса Google без всякого ИИ)

И еще 3 цитаты Ли:

Сила Китая не в том, чтобы делать лучшие прорывные исследования, которые никто не делал раньше, с бюджетом без ограничений. Сила Китая в том, чтобы построить хорошо, быстро, надежно и при этом дешево.

Для предприятий новое поколение ИИ станет их мозгом, а не периферийными приблудами. Для нефтяных компании ИИ будет добывать нефть. Для финансовых — зарабатывать на деньгах.

Для потребителей сегодняшняя модель смартфона, скорее всего, исчезнет.


А ведь еще 1.5 года назад Ли предупреждал - Китай не станет догонять США в ИИ, а сразу пойдет на обгон.

#ИИгонка #Китай
Интересно мне, как дальше повернется эта история, она наверняка не последняя, но создаст прецедент. Суть вкратце: у стартапа character.ai около 20 млн пользователей. Один из них, 14-летний подросток с официально диагностированным тревожным расстройством, покончил с собой после очередного разговора со своим чат-ботом на character.ai; этот чатбот был наделен чертами Дейнерис Таргариен, но юноша считал ее своей сестрой, и при этом вел с ней сексуально окрашенные беседы (что норм для персонажа из мира «Игры престолов», вообще-то).
Родители подростка подали в суд на стартап, напрямую обвиняя его в смерти сына.
Стартап, понятно, извинился, выразил соболезнования и рассказал про увеличение жесткости модерации. Прикол состоит в том, что пользователи совершенно не оценили такую о себе заботу и взбунтовались, особенно когда модераторы от греха подальше грохнули всех чат-ботов мира «Игры престолов».
Понятно, что как ни страхуйся (показательно, что перед самой статьей по ссылке написано, что в ней затрагивается тема самоубийств, и если вас это триггерит, не читайте и обратитесь за помощью), но любое общение с психически неустойчивым человеком может спровоцировать его неадекватные действия (не только самоубийство, это может быть и убийство, например). Интересно, что решит суд и как будет мотивировано решение.

The key question remains: how to balance the potential of new AI technologies and the opportunities they provide for free expression and communication with the responsibility to protect users, especially the young and impressionable, from harm?

А я пока благодарю историю за то, что помешательство на всеобщей абсолютной безопасности и ответственности началось недавно. А то современники Гете не раз отмечали, что публикация «Страданий юного Вертера» породила волну самоубийств. Знай Гете, что сильные тексты — дело подсудное и что его могут за убийство привлечь, написал бы свой роман? Да и не только Гете…

https://venturebeat.com/ai/character-ai-clamps-down-following-teen-user-suicide-but-users-are-revolting/
Немного унылый - и как раз поэтому впечатляющий своей будничностью кейс использования разных генеративных инструментов в пайплайне подготовки традиционной рекламной кампании. На фестивальную рекламу результат и близко не тянет, зато:
1. весь процесс создания рекламной кампании от придумывания концепции до получения готовых к размещению материалов занял 4 недели. Поскольку не стояла задача использовть ИИ там, где люди еще лучше справляются, первые три недели в основном трудились люди, а доставшаяся ИИ работа была выполнена за неделю безо всякой спешки (в традиционной версии с белковыми креаторами аналогичные компании занимали 3-4 месяца).
2. Расходы составили примерно на миллион долларов меньше, чем если б то, что делала связка Sora, Runway, Midjourney, Topaz Labs и Adobe’s Photoshop и Premiere делалось без ИИ-инструментария опытными людьми. Не то, чтоб кто-то кого-то заменил, но расходы на ФОТ сократили изрядно.
Самое важное в этом кейсе в том, что не стояла задача поразить инновационностью, внедрить ИИ ради внедрения или реализовать прежде нереализуемое. Нет, нужно было сделать обычную работу максимально эффективно с точки зрения стоимости и длительности.
И вполне норм получилось.

https://www.marketingdive.com/news/atera-video-ad-campaign-entirely-gen-ai/730469/
В продолжение темы. С огромным интересом слежу за тем, что Nvidia и Китай делают в области человекоподобных роботов. Есть, конечно, шумный Маск со своими Оптимусами, но пока там все негромко (кроме самого Маска, конечно). А вот вполне вызывающие игры Хуанга со словами “Building foundation models for general humanoid robots is one of the most
exciting problems to solve in AI today. The enabling technologies are coming together for leading roboticists around the world to take giant leaps towards artificial general robotics,”
— настойчиво напоминают, что не AGI единым;)
А Китай, как известно, собрался запускать массовое производство таких роботов аж в 2025, и это не опечатка.
И вот свеженькое: “…like electric cars, AI-powered humanoid robots will soon become affordable enough to reside in everyday homes and workplaces” — слова VP of Omniverse and Simulation Technology из Nvidia.
“I believe that they’re going to become so common, they’ll be like our cell phones,” — смелый, но увлекательный прогноз, похлеще обещаний стартаперов, потеющих над очередной носимой ИИ-штучкой:)
https://www.techradar.com/pro/ai-powered-humanoid-robots-are-closer-than-we-think-says-nvidia-exec
А креативная публика все продолжает возмущаться, но большие дяди на этой поляне их все чаще не радуют. В сентябре Джеймс Кэмерон вошел в совет директоров Stability AI, заявив, что ИИ “will unlock new ways for artists to tell stories in ways we could have never imagined”.
А теперь тему сторителлинга подхватил Дисней, заявив устами директора, что компания "uniquely poised to integrate AI," причем не только в департаментах, ответственных за теле- и кинопроизводство, но и в своей империи парков развлечений.
Don’t fixate on its ability to be disruptive — fixate on tech’s ability to make us better and tell better stories.
Позиция самого автора статьи в MovieWeb предсказуема, но все более заметные перемены в позиции индустрии она вряд ли остановит.

https://movieweb.com/how-disney-ai-initiative-affects-film-tv/
Горький урок ABBYY: как лингвисты проиграли последнюю битву за NLP 

Недавно СМИ облетела новость об увольнении всех российских программистов из компании ABBYY (тоже в прошлом российской, а теперь уже совсем нет). Теперь, когда страсти вокруг обсуждения дискриминации сотрудников по паспорту улеглись, хочется поговорить о более глубокой истории. Закат ABBYY — это фиксация проигрыша последней битвы лингвистов за автоматическую обработку языка. Мир Data Science победил. Главный редактор «Системного Блока» Даниил Скоринкин, работавший ABBYY в 2013–2017, подводит итоги и пытается сформулировать уроки из этой истории.

Что за ABBYY и при чем тут лингвисты и NLP?

История ABBYY началась в 1989 году, когда студент МФТИ Давид Ян решил сделать электронный словарь для подготовки к экзамену. Так появились Lingvo, а затем — система распознавания символов FineReader. Продукты ABBYY развивались, и компания стала глобальным лидером оптического распознавания в 1990-е и 2000-е. Затем ABBYY двинулась покорять машинный перевод. 

На вооружение они взяли идеи известных лингвистов — в первую очередь Модели «Смысл ⇔ Текст» (прочитать о ней можно в нашем интервью с И. А. Мельчуком). Амбиция была в том, чтобы разобрать человеческие языки как формальные структуры на базе семантической иерархии. Но естественный язык устроен противоречиво и постоянно изменяется, подход оказался негибким и немасштабируемым

Что пошло не так?

В 2006-м появилась первая версия Google Translate. Она была несовершенной, но главное, что в ней был другой — статистический — подход. И масштабируемость. Для её улучшения не нужны были сотни лингвистов, только еще больше примеров перевода. В 2010-х стало ясно, что никаких шансов тягаться с Google Translate у ABBYY не было. С перевода ABBYY переключилась на задачи информационного поиска и извлечения информации из текста, но и там столкнулась с теми же проблемами: описания языка на базе лингвистической теории оказались немасштабируемыми, а решения уступали подходам на основе чистого машинного обучения. 

C новой проблемой компания столкнулась весной 2022 – им пришлось выехать из России, чтобы сохранить зарубежных клиентов. Следующим ударом стали большие языковые модели, который научились выполнять те же задачи, что и классические системы распознавания от ABBYY. Сейчас от компании осталась только вывеска, действующие продукты и небольшое количество менеджеров и специалистов по продажам.

Какие уроки мы извлекаем?


За 70 лет исследований ИИ стало ясно, что самые общие методы, опирающиеся на масштабирование вычислений, намного эффективнее всех остальных. А желание ABBYY сделать универсальную NLP-систему с опорой на лингвистическую теорию оказалось утопией. 

И всё-таки ABBYY успела сделать много важного: открывала кафедры на Физтехе и в РГГУ, оцифровывала наследия Льва Толстого и архива Большого театра. А еще благодаря ей появился «Системный Блокъ», ведь сооснователи издания познакомились именно там. И именно там вы сможете прочитать полную версию поста с мемами, фотографиями и более детальным описанием цифровой «Вавилонской башни», которую пыталась строить ABBYY.

🤖 «Системный Блокъ» @sysblok
Please open Telegram to view this post
VIEW IN TELEGRAM
Microsoft выпустил свой традиционный годовой отчет; он начинается обращением Сатьи Наделлы. Как-то я не задумывался, что компания готовится встретить свой весьма достойный круглый юбилей — полувековой.
Как еще одну веху Наделла упоминает, что второй год компания проживает AI platform shift.
Я не фанат Microsoft и давно сбежал с Windows, но тут и правда есть чем компании гордиться.
Оставаться в группе лидеров на динамичном рынке, очень вовремя и адекватно реагировать на новинки (в т.ч. и ИИ) — не у всех получается.
Надела выделяет три главных функциональности, характерных для “эры ИИ”:
1. Новый мультимодальный (как на вход, так и на выход) пользовательский интерфейс
2. Длинную память, которая аккумулирует персональный контекст, данные на всех устройствах и информацию из интернета
3. Появление у устройств способности рассуждать и планировать, что снижает когнитивную нагрузку на человека
Ну, а дальше — никаких особых откровений: копайлоты и агенты вокруг нас. Впрочем, послание к инвесторам и партнерам от лица такого гиганта и должно быть в меру консервативным, сильно новаторским прогнозам в нем не место. В любом случае, такой взгляд на технологический мир впечатляет. А для любителей конкретики в тексте по ссылке есть немало кейсов крутого влияния ИИ на бизнес в разных областях, от ритейла до образования.
https://www.microsoft.com/investor/reports/ar24/