Инжиниринг Данных
23.9K subscribers
2.14K photos
63 videos
194 files
3.29K links
Делюсь новостями из мира аналитики и карьерными советами.

15 лет в Аналитике и Инжиниринге Данных, 10 лет в MAANG

🛠️ dataengineer.ru | 🏄‍♂️ Surfalytics.com

№5017813306

Реклама:
https://almond-rule-130.notion.site/1199f595f76a8030ba1be1e607c9a8ce
Download Telegram
Компании бывают разные - кто-то тихо и усердно работает, а кто-то хайпует, собирает лайки, реакции, раунды инвестиций и растет.

Один из самых крутых стартапов в этой области это Artisan. Они еще давно вешали плакаты в Сан Франциско - “Stop hiring people”.

В этот раз они прям реально отожгли - она наняли на работу Jordan Belfort на позицию VP оf sales. Того самого Волка с Wall Street. И записал крутые рекламы - The Wolf of Wall Street vs. Ava 2.0 | The Sell-Off Возможно он там временно, как первоапрельская шутка.

Они как-то предлагали им написать и рассказать о себе, чтобы устроиться к ним на работу. Вместо резюме я им отправил себя сидящего на крыше гелика с шампанским. Ответа не получил=)
❤‍🔥4🙈32🦄1
Ducklake демо репозиторий https://github.com/jeff-skoldberg-gmds/ducklake-demo

Отличное и простое решение, главное не дорогое.
❤‍🔥24🦄31
Когда нет особых новостей и инноваций, то можно просто переименовывать решения.

Looker Studio переименовывается обратно в Data Studio — возвращение к «любимому и знакомому» названию.

Data Studio становится единым местом для работы с активами Google Data Cloud: отчёты, разговорные агенты BigQuery, приложения из Colab-ноутбуков.

• Data Studio — инструмент для личного исследования данных: быстрые ad-hoc отчёты, визуализация данных из BigQuery, Google Sheets, Google Ads.
• Looker — остаётся корпоративной BI-платформой с управляемой семантической моделью и агентными возможностями.
🤷18❤‍🔥4🐳2👨‍💻2
В понедельник, 13 апреля в 8:00 (МСК) проведём совместный эфир с Яной Тимохиной.

Поговорим на ооочень важную тему👇

🔥Выгорание: как распознать вовремя и не сгореть

Обсудим:
— Что такое выгорание на самом деле
— Личный опыт Димы Аношина (как это ощущается изнутри)
— Основные симптомы, которые многие игнорируют
— Причины: почему это происходит даже у «успешных»
— Стадии выгорания — как не довести до крайности
— Как отличить выгорание от усталости или депрессии
— Что делать, чтобы помочь себе и восстановиться

Вам точно на эфир, если вы:
— чувствуете усталость, которая не проходит
— теряете интерес к работе или жизни
— много делаете, но не чувствуете отдачи

Про Яну:
— Бизнес-психолог
— Сертифицированный коуч
— Карьерный консультант
— Еx-HR в международной компании

📍Эфир пройдет в ZOOM
Продолжительность: ~1 час

Ссылка на Zoom:
https://us06web.zoom.us/j/87588523656?pwd=5xnE1Cp6Uwad4j8dcoDIIjH60qhAZg.1

Идентификатор конференции: 875 8852 3656
Код доступа: 581962

Пишите ваши вопросы в комментариях 🙂

До встречи!
❤‍🔥22🍌1
Media is too big
VIEW IN TELEGRAM
Я тут видео хотел записать про наш вебинар, но телефон все время падал, но идею передал:) присоединяйтесь и в конце смогу ответить на ваши вопросы на любую тему 🛸
Please open Telegram to view this post
VIEW IN TELEGRAM
2❤‍🔥155🤷2💯1
Кто не приходил в зум, многое пропустил🫣🤯
Давайте продолжим в meet

Update: ссылку убрал.
❤‍🔥8🍌2
Андрей Карпатый разделяет пользователей на 2 группы

Первая проблема, на мой взгляд, — это актуальность и уровень использования. Думаю, многие попробовали бесплатный тариф ChatGPT где-то в прошлом году и позволили этому опыту слишком сильно повлиять на их взгляды на ИИ. Это группа людей, которые смеются над различными причудами моделей, галлюцинациями и т. д. Да, я тоже видел вирусные видео, где расширенный голосовой режим OpenAI тупит на простых вопросах вроде «мне лучше доехать до автомойки или дойти пешком». Дело в том, что эти бесплатные и устаревшие/снятые с поддержки модели не отражают возможностей новейшего поколения передовых агентных моделей этого года — в особенности OpenAI Codex и Claude Code.

Но это подводит меня ко второй проблеме. Даже если люди платят 200 долларов в месяц за использование передовых моделей, многие из их возможностей относительно «точечны» в узкотехнических областях. Типичные запросы — поиск, написание текстов, советы и т. п. — это не те области, в которых произошли наиболее заметные и драматические скачки в возможностях. Отчасти это связано с техническими особенностями обучения с подкреплением и использованием верифицируемых наград. Но отчасти и потому, что эти сценарии использования недостаточно приоритизированы компаниями в их гонке за улучшениями, поскольку не приносят столько денег. Золотые жилы находятся в другом месте, и фокус внимания смещается туда.

Это подводит меня ко второй группе людей, которые одновременно 1) платят за и используют передовые агентные модели (OpenAI Codex / Claude Code) и 2) делают это профессионально в технических областях — программировании, математике и исследованиях. Именно эта группа людей в наибольшей степени подвержена «ИИ-психозу», потому что недавние улучшения в этих областях в этом году были просто ошеломляющими. Когда вы даёте одной из этих моделей доступ к терминалу, вы можете наблюдать, как она разбирается с задачами программирования, на которые обычно ушли бы дни или недели работы. Именно эта вторая группа людей придаёт гораздо большее значение возможностям моделей, их темпу роста и различным последствиям в сфере кибербезопасности.

TLDR: Люди из этих двух групп просто говорят на разных языках. Это действительно одновременно так: бесплатный и, думаю, слегка заброшенный (?) «Расширенный голосовой режим» OpenAI будет тупить на самых глупых вопросах в вашем Instagram Reels — и в то же самое время платный Codex от OpenAI высшего уровня будет час за часом методично переструктурировать целую кодовую базу или находить и эксплуатировать уязвимости в компьютерных системах. Это действительно работает и сделало драматический скачок благодаря двум свойствам: 1) эти области предлагают явные функции вознаграждения, которые поддаются верификации, а значит, хорошо поддаются обучению с подкреплением (например, пройдены ли юнит-тесты — да или нет, в отличие от написания текстов, качество которых гораздо сложнее оценить объективно), но также 2) они значительно ценнее в B2B-сегменте, а значит, наибольшая часть команды сосредоточена на их улучшении. Вот где мы сейчас находимся.


Я так же замечаю это особенность про два типа пользователей. Первая группа - их большинство. Они не сильно используют AI, ведь он тупой. Вторая группа сидит на Claude Code с тарифом за 200$ в месяц и им мало токенов.

Про результат и перспективы каждой из групп можете догадаться сами.

Только сегодня встречался с боссами большой публичной американской компании. Они всем дали Claude Code и никто его не использует, они не понимают, что делать и как.

И так везде.

Я предложил им нагрузить работой всех так, что без AI они просто не вытянут.

Мы согласились, что все кто не хочет меняться и использовать AI в работе буду уволены.

И в подтверждение этому, на прошлой неделе другая публичная американская компания уволила куча людей, включая две команда дата инженеров. Почему? AI оптимизация.
💯22🙈144🍌4🙉3🐳1
Модель вашей жизни

Иван Крутко сделал хорошее интервью.

Важная мысль -- мы не объекты, мы субъекты своей жизни.
Плохо получится само, над хорошим надо работать.

Я искренне поделился своими мыслями

О предпринимательстве и бизнесе. Как предпринимателям проверять жизнеспособность своих идей? Стоит ли давать второй шанс убыточным проектам? Что делает проекты успешными — интуиция или удача?

Об инвестициях. И здесь не только про финансы. Регулярный спорт и тренировки — это тоже инвестиции в свою энергию, здоровье и дисциплину, которые прямо влияют на продуктивность.

О жизни в релокации, хобби и планах на будущее.

https://www.youtube.com/watch?v=w-gRLhyNfz4
❤‍🔥13🌚1
Продолжаем тему про выгорание:)
❤‍🔥45💯26🌚75🦄3
Самое любимое в процессе книго-писания - это получить обложку со своим именем. Коллег писателей поздравляю.

Я даже не знаю какая эта книга по счету - 9ая? 10ая?

Как говориться больше 2х уже не имеет значение.

Я думаю это последняя книга у меня. И в целом технические книги проигрывают AI ассистентам.

Все еще ценны советы экспертов и видео уроки, где можно понять общую идею (system design) и дальше уже раскрутить ее с AI и понять как построить.

Все-таки на человека приятней смотреть и слушать.

Дальше, уже нужно получать патенты в области космических изобретений😎
150❤‍🔥10🤷3
Я провел следующую часть воркшопа про Data Ingestion Patterns | Part 2- в нем добавил другой метод создания AWS Lambda, рассмотрели AWS Batch, AWS ECR (container registry) и AWS ECS (Container Service). Как обычно использовали Claude Code и Infra as a Code с AWS Cloud Formation. Много рассуждение про использование этих решений на реальных проектах.

Концепт очень простой - у нас есть Python файл, который скачивает данные по GitHub API и мы его переиспользуем разными методами. План рассмотреть все возможности AWS для batch и streaming и потом повторить для Azure и GCP.

Первая часть - Data Ingestions Patterns | Part 1 - я начал серию видео для System Design DE по подходу от простому к сложному, где мы загружаем данные из API в базу 10ью разными способами. Пока только 1/7 покрыл, потратил много времени на разговоры про security, infra as a code, evn variables и как сразу делать правильно. Сразу гонял Cursor Agent и Claude и видно насколько Cursor тупее Claude, зато дешевле.
1🫡16❤‍🔥137💯1
Аналитика, DWH и OLAP-нагрузки растут, и базы начинают упираться в дисковую подсистему…

Для таких задач Selectel добавили новую конфигурацию Mega в базы данных на выделенных облачных серверах. Это кластер объёмом до 27,1 ТБ, приватной сетью 10 Гбит/с и производительностью до 1,5 млн IOPS.

Хороший вариант для высоконагруженных и масштабируемых систем, где важна физическая изоляция данных. По стоимости выходит до 47% дешевле, чем стандартные DBaaS-решения.

Протестируйте бесплатно, до 30 000 бонусных рублей на запуск — по ссылке: https://slc.tl/xwc1h

Реклама. АО "Селектел". erid:2W5zFGj3Mkd
🙈7🐳21
Лучший способ экономить на токенах. Да еще можно людям помочь карьеру устроить.

Объединяйтесь против машин и берите на работу junior!
👨‍💻50🙈2112🫡65❤‍🔥4🙊1
Как понять, что в компании, где вы работаете проблема?

Достаточно просто:
• Начинают отслеживать вашу активность, сколько часов вы онлайн, сколько митингов провели и тп
• Каждую неделю каждая команда должна писать детальный отчет о том, что было сделано
• Вы перестаёте понимать, как ваша работа влияет на успех компании - и никто вокруг тоже не понимает.
• Инженерные задачки оторваны от потребностей бизнеса (миграции, новый инструменты и подходы)
• Постоянные реорганизации и смена приоритетов каждые 2–3 месяца
• Митинги ради митингов - встречи без повестки и без итогов
• Решения принимаются месяцами, но никто не несёт за них ответственности
• Культура страха - никто не говорит о проблемах вслух
• Технический долг растёт, но на него никогда нет времени

Такое чаще в больших компаниях. Как правило раз в год компании нужна свежая кровь, поэтому есть раунды увольнений. Но главную причину никогда не решают.

В стартапах тоже такое бывает, но там сложней долго создавать видимость, ведь run time короткий. Из-за этого все может быть еще хуже.

Все это ведет к выгорянию, отсутствую job security, стрессу. Ведь проблемы в компании и в культуре компании будут влиять на вашу эффективность. Поэтому всегда нужно шопиться на рынке вакансий и компаний, чтобы найти то место, где вам будет комфортно.
💯64🫡13🌚21
Еще одно преимущество использования git и строить аналитические решения как код. То есть сохранять в репо все изменения. Даже если вы делаете ad-hoc вещи и отчеты.

Пример - к вам приходит босс и говорит, напиши мне, что ты сделал в Q1 и что будешь делать в Q2.

Я могу попросить AI агента (Claude, cursor, и тп) посмотреть историю комитов и написать, что я делал и зачем(придумать с поправкой на бизнес смысл). Дополнительно мы можем через MCP сходить в Jira, Confluence и тп, и найти наши тикеты, документы и тп. Мало? Можно в MCP slack пойти, и взять всю переписку.
26💯19❤‍🔥12🦄1
Так как компании активно бросились на внедрение AI, то ушлые менеджеры решили, что надо отслеживать KPI - потребление токенов.

Есть такое явление - «Эффект Кобры» (Cobra Effect) или Закон Гудхарта: «Когда метрика становится целью, она перестаёт быть хорошей метрикой».

Есть даже яркие примеры из истории (спасибо ИИ):

Кобры в Индии (Британская колония)
Правительство предложило вознаграждение за каждую убитую кобру. Местные жители начали разводить кобр ради денег. Когда программу отменили — бreeders выпустили всех змей на волю. Популяция кобр выросла.

Советская плановая экономика
Классический масштабный пример. Заводам давали план в тоннах — делали максимально тяжёлые изделия. Давали план в штуках — делали максимально маленькие и лёгкие. Менеджеры занижали реальные мощности, чтобы получить выполнимый план, и скрывали запасы. Экономист Янош Корнаи в книге Economics of Shortage (1980) детально описал, как вся система планирования систематически порождала поведение, которое выполняло метрику, но разрушало реальную цель.

Колл-центры
Классика корпоративного мира: KPI на количество обработанных звонков в час → сотрудники начинают сбрасывать сложные звонки, чтобы брать больше простых. Или звонок «принимается» мгновенно (метрика выполнена), но клиент 10 минут слушает музыку в ожидании.

Wells Fargo (2002–2016)
Сотрудникам банка ставили KPI на количество открытых счетов на одного клиента (cross-sell ratio). Под угрозой увольнения они открыли ~3.5 миллиона фиктивных счетов без ведома клиентов. Метрика показывала рост — реальные отношения с клиентами разрушались. Банк выплатил штрафов на $3 млрд, CEO ушёл в отставку.


Таких примеров много в корпоративном мире. Руководство любит придумать новые метрики эффективности, и сотрудники быстро адаптируются и фокусируются на этих метриках. Очевидно, они никак не влияют на качество и на конечный результат.

Вот сейчас мы активно переживаем фазу внедрения ИИ эффективности. История с месенджарами точно такая же, как и история про альтернативные методы подключения к интернету🏴‍☠️.

Возвращаемся к ИИ. Термин называется tokenmaxxing - это практика, при которой разработчики искусственно раздувают потребление токенов (единиц обработки данных в AI-моделях) ради карьерных выгод: попадания в рейтинги, признания или защиты своей должности.

Хотя большинство все равно еще не используют ИИ🛌
Please open Telegram to view this post
VIEW IN TELEGRAM
💯166🐳3