Расширяем кругозор с GOAP (Goal-Oriented Action Planning) – методикой и фреймворком проектирования ИИ в играх, при котором цепочки поведений и действий агентов (NPC, абстрактных сущностей, "живых" препятствий) моделируют игровые миры и события в режиме live.
+ Часть 2: Непредсказуемый ИИ: интеллект толпы
Погружение в GOAP:
– Extending Behavior Trees with Classical Planning
– Three States and a Plan: The A.I. of F.E.A.R.
– AI in Games: Automated Planning (lecture 5)
+ Часть 2: Непредсказуемый ИИ: интеллект толпы
Погружение в GOAP:
– Extending Behavior Trees with Classical Planning
– Three States and a Plan: The A.I. of F.E.A.R.
– AI in Games: Automated Planning (lecture 5)
Хабр
Проектирование непредсказуемого интеллекта в играх. Часть 1 — архитектура
Создаем персонажа, который сам решает, что ему стоит сделать с игроком. NPC делает селфи после убийства игрока, почему нет? Введение В этой статье я познакомлю вас с Goal-Oriented Action Planning, а...
Product Management & AI
Расширяем кругозор с GOAP (Goal-Oriented Action Planning) – методикой и фреймворком проектирования ИИ в играх, при котором цепочки поведений и действий агентов (NPC, абстрактных сущностей, "живых" препятствий) моделируют игровые миры и события в режиме live.…
Есть два(?) момента:
1) Каждое состояние должно реализовывать метод «Evalute», который оценивает себя относительно мира и/или агента;
2) Каждое действие должно реализовывать метод Execute, который занимается своим выполнением в игровом мире.
Обо всём остальном должен заботиться фреймворк.
1) Каждое состояние должно реализовывать метод «Evalute», который оценивает себя относительно мира и/или агента;
2) Каждое действие должно реализовывать метод Execute, который занимается своим выполнением в игровом мире.
Обо всём остальном должен заботиться фреймворк.
Как определить фичи с наибольшей ценностью для пользователей?
Простой шаблон аудита функций поможет расставить приоритеты в соответствии с частотой использования функций среди ваших пользователей.
Шаблон аудита имеет два измерения:
– На шкале X сколько людей используют фичу (несколько человек, некоторые люди, большинство людей и все люди).
– На шкале Y частота использования фичи (никогда, некоторое время, большую часть времени и всё время).
В идеале, все функции продукта должны быть расположены в правом верхнем углу шаблона (все пользователи постоянно ими пользуются).
1) Определите функции, которые, по вашему мнению, представляют ценность для ваших пользователей.
2) Отслеживайте использование функций с течением времени, чтобы понять частоту и скорость их принятия.
3) Используйте качественные и количественные данные, чтобы понять, как пользователи на самом деле используют ваш продукт и какие функции они считают ценными.
4) Размещайте функции в нужные квадраты в шаблоне.
5) Систематически анализируйте и актуализируйте этот шаблон.
🩻 Шаблон в Miro
Простой шаблон аудита функций поможет расставить приоритеты в соответствии с частотой использования функций среди ваших пользователей.
Шаблон аудита имеет два измерения:
– На шкале X сколько людей используют фичу (несколько человек, некоторые люди, большинство людей и все люди).
– На шкале Y частота использования фичи (никогда, некоторое время, большую часть времени и всё время).
В идеале, все функции продукта должны быть расположены в правом верхнем углу шаблона (все пользователи постоянно ими пользуются).
1) Определите функции, которые, по вашему мнению, представляют ценность для ваших пользователей.
2) Отслеживайте использование функций с течением времени, чтобы понять частоту и скорость их принятия.
3) Используйте качественные и количественные данные, чтобы понять, как пользователи на самом деле используют ваш продукт и какие функции они считают ценными.
4) Размещайте функции в нужные квадраты в шаблоне.
5) Систематически анализируйте и актуализируйте этот шаблон.
🩻 Шаблон в Miro
Forwarded from Математика не для всех
LLM-модели пока не всесильны.
Согласно недавнему исследованию, проведенному учеными из Суперкомпьютерного центра Юлиха, Бристольского университета и лаборатории LAION, даже самые продвинутые модели искусственного интеллекта для обработки естественного языка (LLM) демонстрируют серьезные проблемы с простейшими логическими задачами.
В своей работе "Алиса в Стране чудес: простые задачи, выявляющие полный крах рассуждений в современных крупных языковых моделях" исследователи обнаружили "резкое нарушение функций и способностей к рассуждению" у тестируемых LLM. Они предполагают, что хотя у моделей есть потенциал для базовых рассуждений, они не могут стабильно его реализовать.
Авторы призывают научное сообщество срочно пересмотреть заявленные возможности современных LLM и разработать новые стандартизированные тесты для выявления недостатков в их базовых навыках рассуждения.
Исследование сосредоточилось на простой задаче, названной "проблемой AIW": "У Алисы N братьев и M сестер. Сколько сестер у брата Алисы?". Несмотря на простоту задачи, которую легко решит ребенок младшего школьного возраста, языковые модели справлялись с ней лишь эпизодически.
Модели часто давали неверные ответы, сопровождая их псевдологичными объяснениями. Даже попытки исследователей побудить ИИ пересмотреть свои ответы не приводили к улучшению результатов.
В среднем частота правильных ответов у LLM была значительно ниже 50%. Более крупные модели, такие как GPT-4, показывали лучшие результаты (около 60% правильных ответов), но все равно недостаточные для модели с надежными базовыми навыками рассуждения.
Исследователи отмечают, что многие протестированные модели, несмотря на высокие результаты в стандартных тестах на рассуждение, не справились с простой задачей AIW. Это ставит под сомнение адекватность существующих методов оценки возможностей языковых моделей. Оригинальная статья
Согласно недавнему исследованию, проведенному учеными из Суперкомпьютерного центра Юлиха, Бристольского университета и лаборатории LAION, даже самые продвинутые модели искусственного интеллекта для обработки естественного языка (LLM) демонстрируют серьезные проблемы с простейшими логическими задачами.
В своей работе "Алиса в Стране чудес: простые задачи, выявляющие полный крах рассуждений в современных крупных языковых моделях" исследователи обнаружили "резкое нарушение функций и способностей к рассуждению" у тестируемых LLM. Они предполагают, что хотя у моделей есть потенциал для базовых рассуждений, они не могут стабильно его реализовать.
Авторы призывают научное сообщество срочно пересмотреть заявленные возможности современных LLM и разработать новые стандартизированные тесты для выявления недостатков в их базовых навыках рассуждения.
Исследование сосредоточилось на простой задаче, названной "проблемой AIW": "У Алисы N братьев и M сестер. Сколько сестер у брата Алисы?". Несмотря на простоту задачи, которую легко решит ребенок младшего школьного возраста, языковые модели справлялись с ней лишь эпизодически.
Модели часто давали неверные ответы, сопровождая их псевдологичными объяснениями. Даже попытки исследователей побудить ИИ пересмотреть свои ответы не приводили к улучшению результатов.
В среднем частота правильных ответов у LLM была значительно ниже 50%. Более крупные модели, такие как GPT-4, показывали лучшие результаты (около 60% правильных ответов), но все равно недостаточные для модели с надежными базовыми навыками рассуждения.
Исследователи отмечают, что многие протестированные модели, несмотря на высокие результаты в стандартных тестах на рассуждение, не справились с простой задачей AIW. Это ставит под сомнение адекватность существующих методов оценки возможностей языковых моделей. Оригинальная статья
Product Management & AI
Энтони Пайри о том, какой должна быть главная страница продукта на примерах Slack, Zoom, Loom, Asana и прочих. – определение предназначения главной страницы; – сегментация клиентов и ЦА по критериям; – ценности и позиционирование продукта на главной; – почему…
Продвижение продукта через главную страницу be like:
Junior: предлагаю рассказать о продукте через его преимущества и выгоды.
Middle: давайте покажем наш продукт через варианты его использования (use cases).
Senior: го через главную всех без реги сразу в рабочую среду онбордить.
Head: A/B, дальше смотрим.
CEO:cameronsworld.net
☕️✨
Junior: предлагаю рассказать о продукте через его преимущества и выгоды.
Middle: давайте покажем наш продукт через варианты его использования (use cases).
Senior: го через главную всех без реги сразу в рабочую среду онбордить.
Head: A/B, дальше смотрим.
CEO:
☕️
Please open Telegram to view this post
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
О чём на самом деле думает венчур, когда вы с командой питчите свой стартап:
– Хороший стартап как хорошее вино 🍷
Please open Telegram to view this post
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
«Большие идеи» и банк «Точка» рассказывают о масштабировании бизнеса в исследовательском спецпроекте для управленцев и предпринимателей «Точка роста».
Проект состоит из пяти материалов, где каждый посвящен одной из проблем, с которыми компании сталкиваются в процессе роста.
«Не по размеру» — о том, что делать предпринимателю, если размер компании перерастает масштабы его личности.
«Культура роста» — как сохранить в растущей компании культуру и ценности проекта.
«Трансформация всего» — как контролировать операционные процессы во время перехода в сегмент крупного бизнеса.
«Вовремя остановиться» — как решить проблемы, связанные с неустойчивым ростом.
«Остаться на вершине» — как удержать успех и всегда ли остановка масштабирования — это плохо.
🪜 Cерия материалов «Точка роста»
Каждый материал — мультиформатная история с разборами кейсов в формате текста, видео и аудио.
Среди спикеров — CEO и основатели Flowwow, SkyEng, Sokolov, Whoosh, «ВкусВилла», «Алгоритмики», «Азбуки Вкуса» и других известных компаний.
С каждым материалом читатели также получают чек-лист для проверки собственного бизнеса, а в конце проекта фреймворк — «рабочую тетрадь», которая поможет организовать и провести со своей командой полноценную стратсессию на тему масштабирования. Реклама. АО «Точка»
Проект состоит из пяти материалов, где каждый посвящен одной из проблем, с которыми компании сталкиваются в процессе роста.
«Не по размеру» — о том, что делать предпринимателю, если размер компании перерастает масштабы его личности.
«Культура роста» — как сохранить в растущей компании культуру и ценности проекта.
«Трансформация всего» — как контролировать операционные процессы во время перехода в сегмент крупного бизнеса.
«Вовремя остановиться» — как решить проблемы, связанные с неустойчивым ростом.
«Остаться на вершине» — как удержать успех и всегда ли остановка масштабирования — это плохо.
🪜 Cерия материалов «Точка роста»
Каждый материал — мультиформатная история с разборами кейсов в формате текста, видео и аудио.
Среди спикеров — CEO и основатели Flowwow, SkyEng, Sokolov, Whoosh, «ВкусВилла», «Алгоритмики», «Азбуки Вкуса» и других известных компаний.
С каждым материалом читатели также получают чек-лист для проверки собственного бизнеса, а в конце проекта фреймворк — «рабочую тетрадь», которая поможет организовать и провести со своей командой полноценную стратсессию на тему масштабирования. Реклама. АО «Точка»
REPORT_Newzoo_Global_Games_Market_Report_August_2024_Free_Version.pdf
1.6 MB
Статистика и тренды игрового рынка 2024 по версии Newzoo
– Кол-во игроков в 2024: 3,42 миллиарда (+4,5% YoY).
– 53% игроков в Азиатско-Тихоокеанском регионе (1,809 миллиарда; +4% YoY), MENA-регион (559 миллионов; +8,2% YoY); Европа (454 миллиона; +2,4% YoY); Латинская Америка (355 миллионов; +5,6% YoY); Северная Америка (244 миллиона; +2,9% YoY).
– Прогноз роста по игрокам к 2027 году: 3,759 миллиарда человек.
– Объём игровой индустрии по итогам 2024: $187,7 миллиардов (+2,1% YoY).
– К 2027 году игровой рынок достигнет выручки в $213,3 миллиардов.
Тренды
1. Комфортнее всего себя чувствуют инди-разработчики и проекты AA-уровня, т.к. на их разработку тратится меньше ресурсов, комады могут экспериментировать и нет давления больших бюджетов.
2. Поэтому разработчики осознанно уменьшают масштаб своих проектов.
3. Мобильная игровая экосистема обретает второе дыхание благодаря европейскому DMA, допускающему новые разные платёжные методы на iOS и Android.
4. Лояльность и коммуникации с пользователями по-прежнему играют ключевую роль в развитии игрового комьюнити.
7. Gen-AI продолжает всё глубже проникать в разработку, но массовых и известных кейсов применения нет.
8. Для игроков поколений Alpha и Z предпочтения меняются в сторону UGC.
– Кол-во игроков в 2024: 3,42 миллиарда (+4,5% YoY).
– 53% игроков в Азиатско-Тихоокеанском регионе (1,809 миллиарда; +4% YoY), MENA-регион (559 миллионов; +8,2% YoY); Европа (454 миллиона; +2,4% YoY); Латинская Америка (355 миллионов; +5,6% YoY); Северная Америка (244 миллиона; +2,9% YoY).
– Прогноз роста по игрокам к 2027 году: 3,759 миллиарда человек.
– Объём игровой индустрии по итогам 2024: $187,7 миллиардов (+2,1% YoY).
– К 2027 году игровой рынок достигнет выручки в $213,3 миллиардов.
Тренды
1. Комфортнее всего себя чувствуют инди-разработчики и проекты AA-уровня, т.к. на их разработку тратится меньше ресурсов, комады могут экспериментировать и нет давления больших бюджетов.
2. Поэтому разработчики осознанно уменьшают масштаб своих проектов.
3. Мобильная игровая экосистема обретает второе дыхание благодаря европейскому DMA, допускающему новые разные платёжные методы на iOS и Android.
4. Лояльность и коммуникации с пользователями по-прежнему играют ключевую роль в развитии игрового комьюнити.
7. Gen-AI продолжает всё глубже проникать в разработку, но массовых и известных кейсов применения нет.
8. Для игроков поколений Alpha и Z предпочтения меняются в сторону UGC.
Product Management & AI
Please open Telegram to view this post
VIEW IN TELEGRAM
Product Management & AI
Оптимизация размышлений ИИ на примере мультиагентного фреймворка MindSearch. MindSearch: Mimicking Human Minds Elicits Deep AI Searcher наглядно демонстрирует работу многоагентной LLM-структуры, которая объединяет "ИИ + Web Search" для обработки запросов…
STORM — свежая ИИ-система от Стэнфордского университета, демонстрирующая работу Агентских Систем.
Фреймворк STORM может использовать большие LLM и моделировать многосторонние разговоры и решения между ИИ-агентами, объединённых в Агентскую Систему.
Агентские Системы — это глобальные ИИ-фреймворки, построенные с помощью сетей ИИ-агентов для выполнения множественных подзадач и имеющие определённую степень автономности.
В системе STORM работает несколько типов ИИ-агентов:
– Исследовательские агенты, которые отвечают за сбор информации по теме из различных источников в Интернете.
– Агенты, задающие вопросы, которые моделируют различные точки зрения, чтобы задавать содержательные вопросы по теме исследования.
– Агенты-эксперты, которые дают ответы на вопросы, заданные агентами, задающими вопросы.
– Агенты синтеза, которые объединяют и организуют собранную информацию в целостную структуру.
Работа STORM состоит из 3 этапов:
1) Извлечение. Получив тему, STORM отправляет свою команду агентов на поиски в Интернете соответствующей информации из различных источников.
2) Далее STORM имитирует беседы, в которых другие агенты представляют разные точки зрения и задают вопросы эксперту по теме, помогая агентам развить всестороннее понимание темы исследования.
3) Синтез. Наконец, STORM синтезирует все собранные данные в связанный, хорошо организованный и структурированный ответ в духе профессиональной статьи с Википедии.
🌊 https://storm.genie.stanford.edu (manual).
Фреймворк STORM может использовать большие LLM и моделировать многосторонние разговоры и решения между ИИ-агентами, объединённых в Агентскую Систему.
Агентские Системы — это глобальные ИИ-фреймворки, построенные с помощью сетей ИИ-агентов для выполнения множественных подзадач и имеющие определённую степень автономности.
В системе STORM работает несколько типов ИИ-агентов:
– Исследовательские агенты, которые отвечают за сбор информации по теме из различных источников в Интернете.
– Агенты, задающие вопросы, которые моделируют различные точки зрения, чтобы задавать содержательные вопросы по теме исследования.
– Агенты-эксперты, которые дают ответы на вопросы, заданные агентами, задающими вопросы.
– Агенты синтеза, которые объединяют и организуют собранную информацию в целостную структуру.
Работа STORM состоит из 3 этапов:
1) Извлечение. Получив тему, STORM отправляет свою команду агентов на поиски в Интернете соответствующей информации из различных источников.
2) Далее STORM имитирует беседы, в которых другие агенты представляют разные точки зрения и задают вопросы эксперту по теме, помогая агентам развить всестороннее понимание темы исследования.
3) Синтез. Наконец, STORM синтезирует все собранные данные в связанный, хорошо организованный и структурированный ответ в духе профессиональной статьи с Википедии.
🌊 https://storm.genie.stanford.edu (manual).
Сложности с взаимопониманием в команде по понедельникам?
Поможет универсальный международный IT-словарь:
Absolute shit – Shit
Dogshit – Very poor quality
Ratshit – Poor quality
Dipshit – A total dumbass
Deep shit – A lot of trouble
Deep shit – Rabbit hole
Chickenshit – Cowards
Tuff shit – Take it or leave it
Bullshit – Not true
Horseshit – Nonsense
Apeshit – Rambunctious
Batshit – Insane
Jack shit – Nothing
No shit – Obviously
Good shit – Good quality
Real shit – High quality
Hot shit – Very good
Epic shit – Colossal
Holy shit – Unbelievable
✨ ✨ ✨
The Shit –Perfection
☕️
Поможет универсальный международный IT-словарь:
Absolute shit – Shit
Dogshit – Very poor quality
Ratshit – Poor quality
Dipshit – A total dumbass
Deep shit – A lot of trouble
Deep shit – Rabbit hole
Chickenshit – Cowards
Tuff shit – Take it or leave it
Bullshit – Not true
Horseshit – Nonsense
Apeshit – Rambunctious
Batshit – Insane
Jack shit – Nothing
No shit – Obviously
Good shit – Good quality
Real shit – High quality
Hot shit – Very good
Epic shit – Colossal
Holy shit – Unbelievable
The Shit –
☕️
Please open Telegram to view this post
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
Наглядная визуализация работы LLM или что скрывается за чатом с ИИ: данные, абстракции, вычисления, сложность, тензоры, веса + масштабы расчётов для разных моделей (на видео самая маленькая).
https://bbycroft.net/llm (пояснения)
Юзер: «приветкакдела»
ИИ: ...
https://bbycroft.net/llm (пояснения)
Юзер: «приветкакдела»
ИИ: ...
Product Management & AI
Хорошая статья-лонгрид, объясняющая как работает наш мозг, как он принимает решения и обучается чему-либо.
Please open Telegram to view this post
VIEW IN TELEGRAM
В AppMetrica появились инсайты, которые анализируют динамику ключевых метрик приложения.
Новая фича позволяет оперативно отслеживать значимые колебания по времени и частоте использования приложения, а также упрощает отслеживание динамики ключевых метрик (DAU/WAU/MAU, Sticky Factor, ARPPU, ARPWAU), экономя время на изучении отдельных отчётов и сопоставлении данных.
Функция уже доступна владельцам и пользователям с правами чтения и редактирования в AppMetrica.
Новая фича позволяет оперативно отслеживать значимые колебания по времени и частоте использования приложения, а также упрощает отслеживание динамики ключевых метрик (DAU/WAU/MAU, Sticky Factor, ARPPU, ARPWAU), экономя время на изучении отдельных отчётов и сопоставлении данных.
Функция уже доступна владельцам и пользователям с правами чтения и редактирования в AppMetrica.
ppc.world
В AppMetrica появился новый инструмент — «Инсайты»
Самые заметные колебания фиксируются в новом разделе «Инсайты». Читайте на ppc.world.
Product Management & AI
🌡️ Средняя температура по больнице удержание и вовлечение по рынку по самым известным продуктам