Инжиниринг Данных

Компании бывают разные - кто-то тихо и усердно работает, а кто-то хайпует, собирает лайки, реакции, раунды инвестиций и растет.

Один из самых крутых стартапов в этой области это Artisan. Они еще давно вешали плакаты в Сан Франциско - “Stop hiring people”.

В этот раз они прям реально отожгли - она наняли на работу Jordan Belfort на позицию VP оf sales. Того самого Волка с Wall Street. И записал крутые рекламы - The Wolf of Wall Street vs. Ava 2.0 | The Sell-Off Возможно он там временно, как первоапрельская шутка.

Они как-то предлагали им написать и рассказать о себе, чтобы устроиться к ним на работу. Вместо резюме я им отправил себя сидящего на крыше гелика с шампанским. Ответа не получил=)

YouTube

The Wolf of Wall Street vs. Ava 2.0 | The Sell-Off

Ava 2.0 is live. Get early access: https://artisan.co/wolf
We put Jordan Belfort up against Ava 2.0, the first autonomous AI BDR. One day. One sales floor. Most meetings booked wins.
Ava found 1,400 qualified leads, identified 420 with buying intent, and…

❤‍🔥4🙈32🦄1

6.03K views15:37

Инжиниринг Данных

Ducklake демо репозиторий https://github.com/jeff-skoldberg-gmds/ducklake-demo

Отличное и простое решение, главное не дорогое.

❤‍🔥24🦄3⚡1

5.77K views22:57

Инжиниринг Данных

Когда нет особых новостей и инноваций, то можно просто переименовывать решения.

Looker Studio переименовывается обратно в Data Studio — возвращение к «любимому и знакомому» названию.

Data Studio становится единым местом для работы с активами Google Data Cloud: отчёты, разговорные агенты BigQuery, приложения из Colab-ноутбуков.

• Data Studio — инструмент для личного исследования данных: быстрые ad-hoc отчёты, визуализация данных из BigQuery, Google Sheets, Google Ads.
• Looker — остаётся корпоративной BI-платформой с управляемой семантической моделью и агентными возможностями.

Google Cloud Blog

Looker Studio is Data Studio | Google Cloud Blog

Data Studio, formerly Looker Studio, is playing a significant role serving Google Data Cloud content, on top of its data visualization capabilities.

🤷18❤‍🔥4🐳2👨‍💻2

5.7K views06:59

Инжиниринг Данных

В понедельник, 13 апреля в 8:00 (МСК) проведём совместный эфир с Яной Тимохиной.

Поговорим на ооочень важную тему👇

🔥Выгорание: как распознать вовремя и не сгореть

Обсудим:
— Что такое выгорание на самом деле
— Личный опыт Димы Аношина (как это ощущается изнутри)
— Основные симптомы, которые многие игнорируют
— Причины: почему это происходит даже у «успешных»
— Стадии выгорания — как не довести до крайности
— Как отличить выгорание от усталости или депрессии
— Что делать, чтобы помочь себе и восстановиться

Вам точно на эфир, если вы:
— чувствуете усталость, которая не проходит
— теряете интерес к работе или жизни
— много делаете, но не чувствуете отдачи

Про Яну:
— Бизнес-психолог
— Сертифицированный коуч
— Карьерный консультант
— Еx-HR в международной компании

📍Эфир пройдет в ZOOM
⏱ Продолжительность: ~1 час

Ссылка на Zoom:
https://us06web.zoom.us/j/87588523656?pwd=5xnE1Cp6Uwad4j8dcoDIIjH60qhAZg.1

Идентификатор конференции: 875 8852 3656
Код доступа: 581962

Пишите ваши вопросы в комментариях 🙂

До встречи!

Zoom

Join our Cloud HD Video Meeting

Zoom is the leader in modern enterprise cloud communications.

❤‍🔥22🍌1

6.9K views14:25

Инжиниринг Данных

Сылка https://calendar.app.google/Tuhj6ZCRtKgEPKi9A чтобы добавить в календарь

Google

Burnout вебинар — Invitation via Google Calendar

🐳1

6.35K views16:51

Я тут видео хотел записать про наш вебинар, но телефон все время падал, но идею передал:) присоединяйтесь и в конце смогу ответить на ваши вопросы на любую тему 🛸

Please open Telegram to view this post

VIEW IN TELEGRAM

2❤‍🔥15⚡5🤷2💯1

7.09K viewsedited 06:15

Инжиниринг Данных

Кто не приходил в зум, многое пропустил🫣🤯
Давайте продолжим в meet

Update: ссылку убрал.

❤‍🔥8🍌2

6.05K viewsedited 05:28

Инжиниринг Данных

Андрей Карпатый разделяет пользователей на 2 группы

Первая проблема, на мой взгляд, — это актуальность и уровень использования. Думаю, многие попробовали бесплатный тариф ChatGPT где-то в прошлом году и позволили этому опыту слишком сильно повлиять на их взгляды на ИИ. Это группа людей, которые смеются над различными причудами моделей, галлюцинациями и т. д. Да, я тоже видел вирусные видео, где расширенный голосовой режим OpenAI тупит на простых вопросах вроде «мне лучше доехать до автомойки или дойти пешком». Дело в том, что эти бесплатные и устаревшие/снятые с поддержки модели не отражают возможностей новейшего поколения передовых агентных моделей этого года — в особенности OpenAI Codex и Claude Code.

Но это подводит меня ко второй проблеме. Даже если люди платят 200 долларов в месяц за использование передовых моделей, многие из их возможностей относительно «точечны» в узкотехнических областях. Типичные запросы — поиск, написание текстов, советы и т. п. — это не те области, в которых произошли наиболее заметные и драматические скачки в возможностях. Отчасти это связано с техническими особенностями обучения с подкреплением и использованием верифицируемых наград. Но отчасти и потому, что эти сценарии использования недостаточно приоритизированы компаниями в их гонке за улучшениями, поскольку не приносят столько денег. Золотые жилы находятся в другом месте, и фокус внимания смещается туда.

Это подводит меня ко второй группе людей, которые одновременно 1) платят за и используют передовые агентные модели (OpenAI Codex / Claude Code) и 2) делают это профессионально в технических областях — программировании, математике и исследованиях. Именно эта группа людей в наибольшей степени подвержена «ИИ-психозу», потому что недавние улучшения в этих областях в этом году были просто ошеломляющими. Когда вы даёте одной из этих моделей доступ к терминалу, вы можете наблюдать, как она разбирается с задачами программирования, на которые обычно ушли бы дни или недели работы. Именно эта вторая группа людей придаёт гораздо большее значение возможностям моделей, их темпу роста и различным последствиям в сфере кибербезопасности.

TLDR: Люди из этих двух групп просто говорят на разных языках. Это действительно одновременно так: бесплатный и, думаю, слегка заброшенный (?) «Расширенный голосовой режим» OpenAI будет тупить на самых глупых вопросах в вашем Instagram Reels — и в то же самое время платный Codex от OpenAI высшего уровня будет час за часом методично переструктурировать целую кодовую базу или находить и эксплуатировать уязвимости в компьютерных системах. Это действительно работает и сделало драматический скачок благодаря двум свойствам: 1) эти области предлагают явные функции вознаграждения, которые поддаются верификации, а значит, хорошо поддаются обучению с подкреплением (например, пройдены ли юнит-тесты — да или нет, в отличие от написания текстов, качество которых гораздо сложнее оценить объективно), но также 2) они значительно ценнее в B2B-сегменте, а значит, наибольшая часть команды сосредоточена на их улучшении. Вот где мы сейчас находимся.

Я так же замечаю это особенность про два типа пользователей. Первая группа - их большинство. Они не сильно используют AI, ведь он тупой. Вторая группа сидит на Claude Code с тарифом за 200$ в месяц и им мало токенов.

Про результат и перспективы каждой из групп можете догадаться сами.

Только сегодня встречался с боссами большой публичной американской компании. Они всем дали Claude Code и никто его не использует, они не понимают, что делать и как.

И так везде.

Я предложил им нагрузить работой всех так, что без AI они просто не вытянут.

Мы согласились, что все кто не хочет меняться и использовать AI в работе буду уволены.

И в подтверждение этому, на прошлой неделе другая публичная американская компания уволила куча людей, включая две команда дата инженеров. Почему? AI оптимизация.

💯22🙈14⚡4🍌4🙉3🐳1

6.01K views17:09

Инжиниринг Данных

Forwarded from Михаил Иванов, издатель

Модель вашей жизни

Иван Крутко сделал хорошее интервью.

Важная мысль -- мы не объекты, мы субъекты своей жизни.
Плохо получится само, над хорошим надо работать.

Я искренне поделился своими мыслями

О предпринимательстве и бизнесе. Как предпринимателям проверять жизнеспособность своих идей? Стоит ли давать второй шанс убыточным проектам? Что делает проекты успешными — интуиция или удача?

Об инвестициях. И здесь не только про финансы. Регулярный спорт и тренировки — это тоже инвестиции в свою энергию, здоровье и дисциплину, которые прямо влияют на продуктивность.

О жизни в релокации, хобби и планах на будущее.

https://www.youtube.com/watch?v=w-gRLhyNfz4

❤‍🔥13🌚1

5.32K views01:42

Инжиниринг Данных

Запись нашего разговора про выгорание, как его распознать и как с ним бороться. https://youtu.be/vmjZgpMFrUo

⚡15❤‍🔥11🍌7🦄3😭1

6.72K viewsedited 05:45

Инжиниринг Данных

Продолжаем тему про выгорание:)

❤‍🔥45💯27🌚7⚡5🦄3

6.9K views14:54

Инжиниринг Данных

Самое любимое в процессе книго-писания - это получить обложку со своим именем. Коллег писателей поздравляю.

Я даже не знаю какая эта книга по счету - 9ая? 10ая?

Как говориться больше 2х уже не имеет значение.

Я думаю это последняя книга у меня. И в целом технические книги проигрывают AI ассистентам.

Все еще ценны советы экспертов и видео уроки, где можно понять общую идею (system design) и дальше уже раскрутить ее с AI и понять как построить.

Все-таки на человека приятней смотреть и слушать.

Дальше, уже нужно получать патенты в области космических изобретений😎

1⚡50❤‍🔥10🤷3

6.87K viewsedited 18:25

Инжиниринг Данных

Я провел следующую часть воркшопа про Data Ingestion Patterns | Part 2- в нем добавил другой метод создания AWS Lambda, рассмотрели AWS Batch, AWS ECR (container registry) и AWS ECS (Container Service). Как обычно использовали Claude Code и Infra as a Code с AWS Cloud Formation. Много рассуждение про использование этих решений на реальных проектах.

Концепт очень простой - у нас есть Python файл, который скачивает данные по GitHub API и мы его переиспользуем разными методами. План рассмотреть все возможности AWS для batch и streaming и потом повторить для Azure и GCP.

Первая часть - Data Ingestions Patterns | Part 1 - я начал серию видео для System Design DE по подходу от простому к сложному, где мы загружаем данные из API в базу 10ью разными способами. Пока только 1/7 покрыл, потратил много времени на разговоры про security, infra as a code, evn variables и как сразу делать правильно. Сразу гонял Cursor Agent и Claude и видно насколько Cursor тупее Claude, зато дешевле.

YouTube

Data Ingestions Patterns | Part 2 | Projects

In this FREE Surfalytics workshop, we continue our beginner-friendly Data Engineering series and build the same ingestion pipeline using multiple AWS patterns: Lambda, Serverless Framework, and AWS Batch with Docker.

If you are a beginner with little cloud…

1🫡16❤‍🔥13⚡7💯1

5.62K views15:40

Инжиниринг Данных

Аналитика, DWH и OLAP-нагрузки растут, и базы начинают упираться в дисковую подсистему…

Для таких задач Selectel добавили новую конфигурацию Mega в базы данных на выделенных облачных серверах. Это кластер объёмом до 27,1 ТБ, приватной сетью 10 Гбит/с и производительностью до 1,5 млн IOPS.

Хороший вариант для высоконагруженных и масштабируемых систем, где важна физическая изоляция данных. По стоимости выходит до 47% дешевле, чем стандартные DBaaS-решения.

Протестируйте бесплатно, до 30 000 бонусных рублей на запуск — по ссылке: https://slc.tl/xwc1h

Реклама. АО "Селектел". erid:2W5zFGj3Mkd

🙈7🐳2⚡1

5.12K views06:59

Инжиниринг Данных

Лучший способ экономить на токенах. Да еще можно людям помочь карьеру устроить.

Объединяйтесь против машин и берите на работу junior!

👨‍💻50🙈2112🫡6⚡5❤‍🔥4🙊1

5.65K views14:56

Инжиниринг Данных

Как понять, что в компании, где вы работаете проблема?

Достаточно просто:
• Начинают отслеживать вашу активность, сколько часов вы онлайн, сколько митингов провели и тп
• Каждую неделю каждая команда должна писать детальный отчет о том, что было сделано
• Вы перестаёте понимать, как ваша работа влияет на успех компании - и никто вокруг тоже не понимает.
• Инженерные задачки оторваны от потребностей бизнеса (миграции, новый инструменты и подходы)
• Постоянные реорганизации и смена приоритетов каждые 2–3 месяца
• Митинги ради митингов - встречи без повестки и без итогов
• Решения принимаются месяцами, но никто не несёт за них ответственности
• Культура страха - никто не говорит о проблемах вслух
• Технический долг растёт, но на него никогда нет времени

Такое чаще в больших компаниях. Как правило раз в год компании нужна свежая кровь, поэтому есть раунды увольнений. Но главную причину никогда не решают.

В стартапах тоже такое бывает, но там сложней долго создавать видимость, ведь run time короткий. Из-за этого все может быть еще хуже.

Все это ведет к выгорянию, отсутствую job security, стрессу. Ведь проблемы в компании и в культуре компании будут влиять на вашу эффективность. Поэтому всегда нужно шопиться на рынке вакансий и компаний, чтобы найти то место, где вам будет комфортно.

💯66🫡13🌚2⚡1

6.58K viewsedited 19:20

Инжиниринг Данных

Классный бесплатный курс https://opencode.school/

OpenCode School

Learn to use OpenCode, the free and open-source AI coding agent.

❤‍🔥21⚡6

6.2K views06:12

Инжиниринг Данных

Еще одно преимущество использования git и строить аналитические решения как код. То есть сохранять в репо все изменения. Даже если вы делаете ad-hoc вещи и отчеты.

Пример - к вам приходит босс и говорит, напиши мне, что ты сделал в Q1 и что будешь делать в Q2.

Я могу попросить AI агента (Claude, cursor, и тп) посмотреть историю комитов и написать, что я делал и зачем(придумать с поправкой на бизнес смысл). Дополнительно мы можем через MCP сходить в Jira, Confluence и тп, и найти наши тикеты, документы и тп. Мало? Можно в MCP slack пойти, и взять всю переписку.

⚡26💯19❤‍🔥12🦄2

4.97K views19:16

Инжиниринг Данных

Так как компании активно бросились на внедрение AI, то ушлые менеджеры решили, что надо отслеживать KPI - потребление токенов.

Есть такое явление - «Эффект Кобры» (Cobra Effect) или Закон Гудхарта: «Когда метрика становится целью, она перестаёт быть хорошей метрикой».

Есть даже яркие примеры из истории (спасибо ИИ):

Кобры в Индии (Британская колония)
Правительство предложило вознаграждение за каждую убитую кобру. Местные жители начали разводить кобр ради денег. Когда программу отменили — бreeders выпустили всех змей на волю. Популяция кобр выросла.

Советская плановая экономика
Классический масштабный пример. Заводам давали план в тоннах — делали максимально тяжёлые изделия. Давали план в штуках — делали максимально маленькие и лёгкие. Менеджеры занижали реальные мощности, чтобы получить выполнимый план, и скрывали запасы. Экономист Янош Корнаи в книге Economics of Shortage (1980) детально описал, как вся система планирования систематически порождала поведение, которое выполняло метрику, но разрушало реальную цель.

Колл-центры
Классика корпоративного мира: KPI на количество обработанных звонков в час → сотрудники начинают сбрасывать сложные звонки, чтобы брать больше простых. Или звонок «принимается» мгновенно (метрика выполнена), но клиент 10 минут слушает музыку в ожидании.

Wells Fargo (2002–2016)
Сотрудникам банка ставили KPI на количество открытых счетов на одного клиента (cross-sell ratio). Под угрозой увольнения они открыли ~3.5 миллиона фиктивных счетов без ведома клиентов. Метрика показывала рост — реальные отношения с клиентами разрушались. Банк выплатил штрафов на $3 млрд, CEO ушёл в отставку.

Таких примеров много в корпоративном мире. Руководство любит придумать новые метрики эффективности, и сотрудники быстро адаптируются и фокусируются на этих метриках. Очевидно, они никак не влияют на качество и на конечный результат.

Вот сейчас мы активно переживаем фазу внедрения ИИ эффективности. История с месенджарами точно такая же, как и история про альтернативные методы подключения к интернету🏴‍☠️.

Возвращаемся к ИИ. Термин называется tokenmaxxing - это практика, при которой разработчики искусственно раздувают потребление токенов (единиц обработки данных в AI-моделях) ради карьерных выгод: попадания в рейтинги, признания или защиты своей должности.

Хотя большинство все равно еще не используют ИИ🛌

Please open Telegram to view this post

VIEW IN TELEGRAM

Pragmaticengineer

The Pulse: ‘Tokenmaxxing’ as a weird new trend

At Meta, Microsoft, Salesforce and other large companies, devs are purposefully burning tokens (and money!) to inflate their AI usage and hit AI usage metrics which they treat as targets.

💯16⚡6🐳3

6.2K views21:59

About

Blog

Apps

Platform