TechSparks
46.7K subscribers
311 photos
75 videos
15 files
4.31K links
Аннотированные ссылки на интересные, полезные и удивительные новости хайтека.
Тем, кто больше любит слушать длинное чем читать короткое — могу посоветовать свой подкаст ;) http://sebrant.chat

Вопросы - @asebrant
Download Telegram
Я б не стал публиковать ссылку на очередное сравнительное исследование реакции читателей на творчество людей и алгоритмов (ответы были получены еще несколько лет назад и с тех пор ни разу не менялись), но меня упрямо продолжают убеждать некоторые слушатели/читатели, что не дано машине писать/рисовать/музицировать/… как человек. И они искренно это делают, потому что убеждены, что контекст создания произведения является его неотъемлемой частью, впечатан в само произведение — и якобы это заметно.
Однако эксперименты раз за разом доказывают, что это не так, по крайней мере, когда участвуют люди без специальной подготовки (ибо ясно, что специалист, специализирующийся на творчестве какого-то поэта все его стихи читал, и потому незнакомый текст опознает).
Поэтому напишу, что в очередной раз non-expert poetry readers оценили поэзия, генерированную ИИ, аж несколько выше, чем поэзию белкового происхождения. Примечательно, что один из разделов работы называется Perception and preference in poetry: biases toward AI-generated poems: зловещая долина вздыбилась и стала холмом :))
А в тексте занятные рассуждения, за что именно полюбили поэзию алгоритмов.
https://www.nature.com/articles/s41598-024-76900-1
(Напомню, что недавно аж колонку написал про то, почему часть творческой публики не может принять алгоритмическое творчество — https://www.forbes.ru/tekhnologii/520066-znaki-vremeni-pocemu-vazno-pomnit-o-razliciah-mezdu-tvorcami-i-potrebitelami )
Полезное исследование от бывших коллег из Толоки: внятно потестировали наиболее популярные LLM на вопросы из области естественных наук. Но вопросы не то чтоб со звездочкой, но на понимание, а не знание — причем противоречащее бытовым представлениям.
Вот хороший пример по физике:
“В пасмурный день за окном машины закреплен термометр. Машина начинает движение и быстро набирает скорость. Через несколько минут смотрим на термометр за окном. В какую сторону изменились его показания?”
И, что не удивительно, оказалось, что по иммунобиологии, физике, биоинформатике и пр. ответы даже лучших моделей выглядят так себе. Что логично: язык не содержит в себе понимания физики мира, а из текстов можно скорее извлечь идею “высунулся из окна и свежий ветер охладил…” Так что здесь к созданию помощников по обучению придется подходить осторожно.
https://toloka.ai/blog/are-llms-good-at-natural-science/
Написанный очень простым языком обзор состояния нейроинтерфейсов отчетливо дает понять, со ссылкой на многие годы занимающихся этой темой исследователей, что там идет медленный, постепенный прогресс много лет. Какие бы заявления ни делал Маск, прорывов нет и не предвидится.
Но есть разумный совет: чтобы видеть имеющийся прогресс, надо поумерить собственные ожидания. Мы далеки от единения с цифровыми сущностями, но все большее число больных улучшают свое качество жизни благодаря разным инвазивным и не очень интерфейсам.
We’re still learning how it works, why it works, when it works, when it doesn’t work, what kind of support it needs, and how many places are going to be able to deliver it.
Радует, что в этой области работают не только буйные — но и в то же время легко теряющие интерес и финансирование —стартапы, но и традиционные исследовательские центры, которые постоянно получают новые и важные данные о мозге.
Как часто бывает: надо подождать. https://www.digitaltrends.com/computing/tech-for-change-brain-computer-interface/
Forwarded from IT|ИТ
Частные расходы на строительство дата-центров выросли почти до $30 млрд/год.

Этот показатель более чем вдвое превышает траты за 2022 год.

Дата-центры стали главным сегментом для строительства: они опережают отели, торговые и развлекательные центры.

США лидируют по объему инвестиций для дата-центров. При этом глобальные расходы на них составят $250 млрд.
👁️
Термины «цифровизация» и «цифровая экономика» возникли еще в прошлом веке, в начале 10-х нынешнего века заговорили о «цифровой трансформации». И продолжают по всему миру говорить, принимать программы, обучать чиновников и руководителей предприятий. Потому что разговоры разговорами, а на деле бизнес (кроме изначально ориентированного на цифровые продукты и инфраструктуру) осторожен и консервативен. Кстати, это демонстрирует график из предыдущего поста: экспоненциальный рост расходов на строение датацентров свидетельствует, что потребность в них все еще на ранних стадиях, в развитой цифровой экономике рост бы уже выполаживался: в реальном мире экспоненты — это чаще всего начальные участки логистических кривых и им подобных.
Это я все к тому, что и с ИИ в бизнесе будет примерно так же. Реальные перемены происходят со сменой поколений управленцев, и пока предприятиями управляют люди, этот масштаб времени вряд ли изменится. Так что в статье по ссылки все ожидаемо и закономерно: ИИ-зация рабочих процессов и мест на практике идет неторопливо. На конец прошлого года в четверти организаций ИИ вообще никак не использовался, и лишь в 8% — использовался системно по всему предприятию (подозреваю, бОльшая часть таких организаций — технологические компании). Полезный reality check и для стартапов, весьма фантазийно оценивающих размеры своих рынков, и для нервных алармистов.
https://localnewsmatters.org/2024/11/17/why-the-ai-ification-of-workplaces-may-move-slower-than-we-think-despite-corporate-hype/
Появляются интересные инженерные детали китайской миссии, которая будет запущена в 2028 чтобы доставить на Землю полкило марсианского грунта. Весь дизайн миссии подчинен минимизации расхода топлива. Поэтому приходится применять нетривиальные и ранее не испытанные методы перевалки ценнейшего груза. Контейнер с собранным грунтом будет выведен на орбиту небольшим разгонным блоком, но стыковки с орбитальным модулем не предусмотрено: ловушка на модуле должна будет поймать контейнер, загрузить его в возвращаемый блок, который уже доставит контейнер на Землю.
Выглядит как чудеса акробатики на околомарсианской орбите — но китайцам акробатика близка. Очень интересно, как на практике все это сработает.
https://www.scmp.com/news/china/science/article/3286721/how-chinese-spacecraft-will-catch-mars-rock-samples-journey-earth
Вполне ожидаемо: появилась компания, всерьез сфокусированная на AI-оптимизиции. Собственно, с момента появления коммерческих интересов в интернете, возник и бизнес их обслуживания: как манипулировать трафиком на ресурсы клиента с разных информационных систем в интересах клиента. Но пока системы работали алгоритмически (начиная с Page rank), решения оптимизаторов были тоже алгоритмичными: “ах, он ссылки учитывает — наплодим ссылочные фермы” и т.п.
С ИИ-поиском не так все просто, поэтому неудивительно, что за дело взялась компания, изначально занимавшаяся управлением репутацией в сети, а не реинжинирингом поисковых алгоритмов: approach isn’t about hacking AI systems but rather systematically shaping the web content that feeds these systems.
Изучение изменений ответов ИИ на вопросы — вполне в духе хорошей аналитики: ответы на один и тот вопрос разнятся для разных пользователей, поэтому давайте эмулировать множество пользователей и смотреть, как изменения в интернете влияют на характеристики всей совокупности ответов. Учитывается два канала воздействия на ИИ: изменения в контенте, который используется для тренировки новых версий моделей, и изменения на страницах со свежей информацией, к которым модель обращается при подготовке ответа.
Интересно, получится ли такая же большая индустрия, как традиционное SEO. Первые стартапы уже есть.
https://crazystupidtech.com/archive/can-we-manipulate-ai-as-much-as-it-manipulates-us/
Еще 4 года назад тогда еще не запрещенная Meta объявила о проекте ARIA: исследованию будущего AR и VR очков. Больших откровений там не случилось, но анонс прототипа Orion вдохнул немного новой жизни. Теперь публике представлен Aria Research Kit: первые кейсы использования и призыв к сообществу делиться своими наработками.
Процитированные в тексте проекты трудно назвать новаторскими:
1. Картирование окружающего мира с помощью данных, собираемых носителем очков
2. Изучение звукового окружения пользователя, чтобы в дальнейшем помочь людям с потерей слуха не только лучше слышать, но и понимать пространственное расположение источника звука.
3. Улучшенный ассистент водителя, учитывающий события вне его текущего поля зрения
4. Улучшенная навигация в помещениях для пользователей с проблемами зрения
В новом раунде исследований компания предлагает раздать прототипы своих очков исследователям работающим над broad range of research topics, including embodied AI, contextualized AI, human-computer interaction (HCI), robotics, and more.
И ждет, конечно, их отчетов.

https://www.meta.com/en-gb/blog/quest/project-aria-research-kit-case-studies/
Foundation models стал популярным термином, все больше отраслей стремятся иметь свои модели, претендующие на фундаментальность. Логично, что появилась Evo, a multimodal artificial intelligence model that can interpret and generate genomic sequences at a vast scale… Evo represents a major advancement in our capacity to comprehend and engineer biology across multiple modalities and multiple scales of complexity
Впрочем, пока, хотя genomic foundation model enables prediction and generation tasks from the molecular to the genome scale — речь о геномах микробов. Насчет существ побольше, включая растения, животных и нас, пока неясно — удастся ли Evo усовершенствовать для работы с геномами такого размера. Но даже и с бактериями перед CRISPR открываются совсем новые перспективы
https://www.science.org/doi/10.1126/science.ado9336
Совсем популярный, но толковый пересказ:
https://singularityhub.com/2024/11/18/a-chatgpt-like-ai-can-now-design-entirely-new-genomes-from-scratch/
Сегодняшний шестой испытательный полет Старшипа не принес сенсаций, а местами оказался даже менее зрелищным, потому что бустер опустили в залив, а не в «руки» Мехазиллы. Как и прежние полеты, этот наверняка добавил кучу полезных данных, в том числе и о неполадках при посадке разгонного блока — но это невидимый фронт. Поэтому ссылка будет не на захватывающее видео, а на статью с впечатляющими цифрами про акустическое воздействие запусков Старшипа на окружающую среду. Они в буквальном смысле слова оглушающие.
even 10 kilometers away, it was as loud as a rock concert. At 20 kilometers, it rivaled the noise of a table saw or snow blower. At 30–35 kilometers, the sound was still as loud as a vacuum cleaner or hair dryer.
Ох и интересная задача будет искать места под космодромы будущего с высокой частотой стартов…
https://phys.org/news/2024-11-roar-spacex-starship-impact-communities.html
Свежий лонгрид про Майкрософт: как 50+ лет не смогли состарить компанию, и все предсказания о ее неизбежном сходе со с цены оказались ложными. И очень интересно описана роль Наделлы в траектории компании.
С наступлением мобильной эры разговоры про неадекватность Майкрософт усилились - и на то были причины: неудачи с Windows Mobile были уж больно наглядными. Казалось, что компания, как часто делают гиганты в тяжелой ситуации, вцепилась в своих дойных коров — Windows и Office и просто оттягивает неизбежное. Потом пришли времена ML, и опять казалось, что компания уже не в силах адаптироваться к новациям, трансформирующим цифровой мир вокруг.
А потом случилось странное. Десять лет назад, в 2014, сменился глава компании. Обычно, в ситуации, когда компания начинает немного протухать, ищут внешнего человека, чтоб встряхнул команду, принес свежие идеи и видение, заменил дряхлеющих менеджеров.
Но тут руководство перешло к человеку изнутри компании, который 22 года неторопливо перемещался вверх по карьерной лестнице и никак мне отличался радикализмом. Но при этом одно из знаковых его решений было вложить в 2019 один млрд долларов в OpenAI, известный в довольно тогда узких кругах.
А еще его очень любили и любят сотрудники — что нечасто в очень пестрых и требовательных командах техногигантов.
Почитайте — вроде бы корпоративная история, но история очень современная, показавшая как за 10 лет огромная корпорация сумела пересобрать себя, снова стать лидером технологической гонки и красиво нарастить капитализацию. Очень полезное — и приятное само по себе — чтение, из которого можно много уроков извлечь. Среди них важный: не торопитесь хоронить старичков. Времена изменились, и продолжительность жизни растет не только среди людей, и не только люди имеют серьезные планы на бессмертие:)
https://www.wired.com/story/at-age-50-microsoft-is-an-ai-giant-an-open-source-lover-and-bad-as-it-ever-was/
Гибкие дисплеи как-то перестали удивлять — но и применений особо не нашли. LG предлагает следующий уровень: гибкий дисплей, который еще и эластичен, неплохо растягивается. А это значит, что он уже напоминает материалы, используемые в одежде: у дизайнеров появляются интересные перспективы;)
Да, это пока прототип, и разрешение, которого бы постеснялся даже древний дисплей, — но ограничения часто лишь стимулируют фантазию;)

https://www.core77.com/posts/134351
Обойдя Японию и Германию, Китай теперь №3.
А США покинули десятку лидеров.

Об индустриальной мощи страны имеет смысл судить не по её парку роботов-андроидов, а по уровню автоматизации её промышленности - количеству эксплуатируемых промышленных роботов на 10 тыс. сотрудников.
Вот три примера.
США
Недавно Илон Маск развлекал журналистов шумной презентацией, где роботы-андроиды готовили коктейли и разносили закуски. Это конечно прикольно, но не более того. А тем временем, согласно новому годовому отчету Международной федерации робототехники, США покинули десятку стран мировых лидеров по количеству эксплуатируемых промышленных роботов на 10 тыс. сотрудников. Как видно из приведенных диаграмм, США уже который год плавно теряют позиции среди ТОР 25 стран-лидеров, пропустив вперед Швейцарию и Словению и имея шансы в этом году скатиться ниже Тайваня и Нидерландов.
Китай
Поставив роботизацию промышленности среди ключевых приоритетов, Китай, с настойчивость прихватившего противника бульдога, из года в год поднимается в рейтинге все выше. И теперь, обойдя Японию и Германию, Китай ставит цель достать №2 Сингапур. Что сложно, ибо тот на «целый круг» впереди, опережая почти в 2 раза. С лидером – Юж.Корея будет еще сложнее, т.к. он опережает аж «на два круга» (примерно в 3 раза). Но Китай это не смущает. И по их планам 1-е место в мире Китай займет уже в 2030.
Россия
Тут могу лишь сказать, что при показателях Китая и США 479 и 295 эксплуатируемых промышленных роботов на 10 тыс. сотрудников и среднем по миру показателе в 162 робота, в России сейчас этот показатель равен 11 (т.е. отставание от США в 27 раз, а от Китая в 44 раза. Планирующий контролировать более 50% рынка робототехники в России "Росатом" обещает к 2030 г. увеличить число роботов в 9,5 раз (с 10 тыс до 95 тыс), что в 2 раза меньше последнего (№25) в сегодняшнем списке стран-лидеров. А в 2030, когда этот список планирует возглавить Китай, цифры лидеров должны будут вырасти, минимум, еще в 4 раза.
#роботы
Поразительно, как не нравятся людям зеркала:) Вот вышла очередная тревожная работа команды гуманитарных исследователей из Германии и Великобритании.
Проанализировав сайты, созданные разными популярными генеративными моделями (ChatGPT, Claude 3.5, Gemini 1.5 Flash), они обнаружили, что дизайн содержит различные манипулятивные элементы, побуждающие пользователя к тем или иным действиям.
Вроде нет вопросов, откуда взялся такой стиль: модель училась на вполне человеческих творениях, которые все это добро содержат сплошь и рядом, и там элементы манипуляции были заложены в ТЗ заказчиками или отвечали собственному представлению вебдизайнеров о прекрасном.
Но исследователи волнуются, что модели демонстрируют не самое лучшее и бескорыстное поведение и требуют, как обычно, дополнительного регулирования и ограничений для моделей.
О каких-то ограничениях для людей вопрос даже не ставится. В итоге призыв выглядит как неуклюжая попытка сохранить коммуникационные функции за людьми: только белковым дано право манипулировать себе подобными:)
https://arxiv.org/pdf/2411.03108
Добрый старый Zoom решил освежить бренд: после окончания пандемийного бума бороться с конкуренцией техногигантов все сложнее. Да и слово Video в названии компании не очень уже соблазняет в эпоху всеобщего ИИ.
Так что предлагается ознакомиться с Zoom 2.0: AI-first company delivering modern, hybrid work solutions that enable you to collaborate seamlessly.
Прямо сейчас трансформация выглядит довольно скромно, следуя привычной уже модели ИИ-помощников: By summarizing meeting tasks, drafting email responses, and preparing you for meetings, AI Companion is your digital assistant that reduces your overall workload.
А в будущем обещают полноценного цифрового двойника — главная фишка которого в том, что с его помощью можно будет перейти на 4-дневную рабочую неделю. Забавно, что сейчас такие заявления уже не возбуждают, и даже хочется заботливо спросить: “Ребята, у вас точно все норм?” Обычно заявления типа “we’re still just as committed to delivering happiness as we were in 2011” (2011 — год основания компании) делаются не от хорошей жизни.
А продукт ведь вполне крутой.
https://www.zoom.com/en/blog/introducing-zoom-communications-inc/
А вот Nvidia продолжает демонстрировать, что компания не только про чипы, но и про собственные модели, иллюстрирующие красоту генеративного ИИ и крутость продуктов Nvidia — full version uses 2.5 billion parameters and was trained on a bank of Nviidia DGX systems packing 32 H100 Tensor Core GPUs 🙂
Модель по имени Fugatto (от Foundational Generative Audio Transformer Opus 1) описывается как a Swiss Army knife for sound, а сравнение ее с другими моделями звучит немножко токсично: some AI models can compose a song or modify a voice, none have the dexterity of the new offering 🙂
Музыкантам предлагается использовать новый инструмент на разных стадиях процесса — от прототипирования до улучшения качества имеющихся треков. Модель умеет создавать неожиданные эффекты: For instance, Fugatto can make a trumpet bark or a saxophone meow. Whatever users can describe, the model can create. Черрипики в приложенном треке звучат впечатляюще.
Осталось дождаться реакции и без того в последнее время нервных музыкантов:)

https://blogs.nvidia.com/blog/fugatto-gen-ai-sound-model/
Ну наконец-то кто-то вслух высказался на тему бесконечных пузомерок из мира ИИ-моделей, называемых умным словом benchmarks, которые не только маркетологи в хвост и в гриву используют, но и более техничные ребята начали воспринимать всерьез — ну потому что как жить без пузомерки? Ленты новостей и каналы про ИИ завалены ежедневными сводками с полей разных арен и бенчмарков; мне вспоминаются времена, когда в еще некрупном Рунете было принято по утрам изучать счетчик Рамблера и делать из этого глубокомысленные выводы. Технологии изменились, людская (а разработчики тоже люди) психология — нет.
Так вот, группа исследователей решила разобраться с тем, что these benchmarks are poorly designed, the results hard to replicate, and the metrics they use are frequently arbitrary. Это становится уже серьезной проблемой, потому что за бенчмарки схватились и законодатели, которым же надо порегулировать на якобы объективной основе.
Авторы работы подтвердили и наличие, и серьезность проблемы и, как положено, предложили свои способы решения. Интересно, что из этого возьмет на вооружение сообщество. Есть у меня некий скепсис…
https://www.technologyreview.com/2024/11/26/1107346/the-way-we-measure-progress-in-ai-is-terrible/
Оригинал работы - https://arxiv.org/abs/2411.12990
Название статьи обидное для Apple, но фактически точное: Xiaomi сумел сделать то, чего ждали от Apple, но так и не дождались.
Китайский производитель гаджетов весной этого года представил свой первый электромобиль, который сразу стал хитом: за первые сутки было собрано 90 000 заказов на SU7. Планы продаж до конца года компания подняла до 130 000 штук.
Про технические характеристики можно почитать в статье или на автосайтах, но о многом говорит тот факт, что CEO Ford Джим Фарли, предположительно неплохо разбирающийся в автомобилях и имеющий возможности выбирать, на чем ему ездить, наплевал на корпоративный патриотизм и ездит как раз на SU7 и не устает им восхищаться.
Достойны упоминания еще два факта: операционка автомашины прекрасно работает с iOS и Android, превратив автомобиль в идеально совместимый с устройствами водителя и пассажира гаджет. А сборку компания не аутсорсит (как бывает со стартапами), а построила собственный полномасштабный автозавод.
Тем временем ходят слухи, что готовится выпуск еще двух моделей. Автор статьи иронично отмечает, что наконец-то фанаты получили свой iCar, вот только прибыл он из Китая
https://www.wired.com/story/phone-maker-xiaomi-made-the-car-that-apple-couldnt/
This media is not supported in your browser
VIEW IN TELEGRAM
Умные очки с дисплеем есть не только у Цукера.

Вот например, девушка получила Hearview Glasses - очки, которые улавливают звук, распознают речь и выводят субтитры.

Основная аудитория - люди, у которых проблемы со слухом.
Цена $1300, вес 52 гр, 7 часов без подзарядки, точность распознавания текста 95%.

Субтитры выводятся на правую линзу, распознавание и перевод могут быть на несколько языков, в том числе на русский.
У меня сегодня в новостных лентах — сплошь КМУ в Сочи и выступления о важности для науки цифровых технологий вообще и ИИ в частности. На этом фоне контекстно выглядит интересный и глубокий (простите за невольный каламбур) манифест DeepMind о роли ИИ в науке. Там 30 с небольшим страниц, стоят того, чтоб всем интересующимся прочитать: и про возможности, и про суть, и про риски.
Основная идея: сегодня все науки, от генетики до метеорологии, сталкиваются с ростом масштабов и сложности во всей деятельности ученого, от работы с потоком литературы до сложнейших экспериментов, генерящих массу данных. Но именно с проблемами нарастания масштабов и сложности отлично работает глубокое ML.
Но внедрение ИИ-центричных подходов к научным исследованиям требует серьезной стратегии, а не попыток прикрутить ИИ любой ценой.
our essay can inform such a strategy. It is aimed at those who make and influence science policy, and funding decisions. We first identify 5 opportunities where there is a growing imperative to use AI in science and examine the primary ingredients needed to make breakthroughs in these areas. We then explore the most commonly-cited risks from using AI in science
Перечисленные пять возможностей:
1. Работа со знаниями
2. Работа с данными
3. Подготовка, моделирование и проведение сложных экспериментов
4. Построение моделей сложных систем и взаимодействий
5. Поиск новых решений в областях с очень большим пространством возможных решений (проблема синтеза белков тому примером)
Перечисленные пять рисков:
1. Не снизит ли ИИ креативность и новизну научных прорывов
2. Не пострадает ли надежность и воспроизводимость результатов, способность науки корректрировать собственные ошибки
3. Не заменят ли полезные работающие решения глубокое понимание их сути
4. Не затруднит ли ИИ доступ к науке представителям уязвимых групп
5. Не затормозит ли ИИ старания снизить углеродный след человечества

Как в начале прошлого века Гильберт сформулировал 23 проблемы, решение которых во многом определило математику XX века, так и сейчас ученым совместно со специалистами по ИИ предстоит определить направления, в которых использование ИИ важней всего.
Есть, правда, серьезная засада: scientific data is uncollected, partial, uncurated or inaccessible, making it unavailable to train AI models
И ее тоже придется решать, если мы хотим реально ускорить научный прогресс.

https://deepmind.google/public-policy/ai-for-science/