Инжиниринг Данных
23.6K subscribers
1.99K photos
57 videos
193 files
3.21K links
Делюсь новостями из мира аналитики и карьерными советами.

15 лет в Аналитике и Инжиниринге Данных, 10 лет в MAANG

🛠️ dataengineer.ru | 🏄‍♂️ Surfalytics.com

№5017813306

Реклама:
https://almond-rule-130.notion.site/1199f595f76a8030ba1be1e607c9a8ce
Download Telegram
Успех любой рекламной кампании определён качеством трафика и его анализом.

О том, как грамотно настроить трекинг рекламных кампаний в MyTracker и анализировать результаты, можно узнать на вебинаре, который пройдет 6 апреля в 15:00 по МСК.

Вебинар будет полезен маркетологам, аналитикам, владельцам мобильных приложений и сайтов.

На вебинаре вы узнаете:

— Что из себя представляет трекинг рекламы (как мобайл, так и веб);
— Как настроить трекинг рекламы сайта и приложения;
— Базовые термины: post click, post view, атрибуция, постбэк, макрос;
— Как завести кампанию, создать трекинг-ссылку, включить постбэк и многое другое.

Все вопросы будут разобраны на живых примерах в интерфейсе MyTracker.

Регистрация на вебинар

#реклама
👾7
Миграция в Yandex DataLens за 3 месяца: 36 дашбордов для 400 пользователей

Перед «Ренессанс Страхованием» стояла амбициозная задача — найти альтернативу зарубежной BI-системе и переехать в кратчайшие сроки. Благодаря cервису анализа и визуализации данных Yandex DataLens компании удалось сократить расходы на аналитику и ускорить работу с данными.

Читайте подробнее на сайте ➡️

#реклама
🙈32🤷‍♂7❤‍🔥6🌭4🌚3🍌2🗿1
Стать сотрудником Яндекса быстрее и проще, чем кажется. Участвуйте в днях быстрого найма: решите тестовое, пройдите несколько секций собеседования и получите офер за несколько дней.

Теперь дни быстрого найма будут проходить регулярно. Чтобы вам было удобно следить за расписанием, собрали его на отдельной странице.

Ближайшее мероприятие:

• 24-28 апреля — Fast Track для аналитиков и разработчиков метрик. Офер за 5 дней в отдел аналитики и метрик Поиска.

Зарегистрироваться

#реклама
🤷‍♂20🗿13❤‍🔥6🐳5🤷4🙈3🌚1🌭1🍓1😈1
Практический вебинар VK Cloud: Погружение в MLflow API. Готовые рецепты и сценарии использования

Когда: 4 мая, 16:00 по Москве
📍 Регистрация

На вебинаре спикеры покажут основные этапы работы с ML-моделями в MLflow. Вы узнаете, как оценивать и сравнивать модели и выводить их в production.

В программе:

🔹 Принципы работы с MLflow на Jupyter в облаке и решение основных задач: логирования метрик, моделей и параметров.
🔹Сравнение различных ML-моделей и экспериментов с помощью извлеченных метрик.
🔹 Разбор большинства методов MLflow API.
🔹 Деплой ML-модели и демонстрация основных сценариев использования на практике.

Спикеры:

— Александр Волынский, технический менеджер продукта Cloud ML Platform, VK Cloud
— Сергей Артюхин, преподаватель курса «Симулятор ML», karpov.courses

Вебинар будет полезен дата-сайентистам, MLOps- и DevOps-инженерам и аналитикам данных.

Зарегистрироваться

#реклама
🌚4👨‍💻3😈2🌭1
Станьте специалистом широкого профиля в работе с данными — научитесь разрабатывать архитектуру данных на курсе Яндекс Практикума.

Выпускники смогут:
◾️ проектировать хранилища и пайплайны;
◾️ использовать инструменты DE: оркестраторы, контейнеры и не только;
◾️ работать со стриминговой обработкой данных и облачными хранилищами;
◾️ создавать хранилища Data Warehouse и Data Lake.

Что будет на учёбе:
— Реальные рабочие задачи и командные проекты.
— Код-ревью и персональные советы от действующих инженеров данных.
— Вебинары и продакшн-опыт от экспертов в инженерии данных.

Приходите учиться, если хотите развить свои компетенции или перейти на должность Data Engineer.

#реклама
🙈26🍓9🍌5🗿5🦄3🐳2💅2👨‍💻1
VK Cloud Conf: как перенести лучшие практики разработки ИТ-компаний в классический бизнес

Когда: 8 июня, 12:00
📍Где: Москва и онлайн
⚡️ Регистрация

Каждая российская компания, которая стремится к росту, вынуждена развивать собственную разработку.
На VK Cloud Conf эксперты VK и крупнейших российских компаний поделятся опытом организации разработки, работы с данными и информационной безопасности в облаке.
Вы узнаете, какими инструментами и подходами можно сократить время вывода новых разработок на рынок. Спикеры обсудят архитектуру современных аналитических систем.

В программе:

🔹 Как повысить эффективность разработки с помощью облачных сервисов
🔹Подходы к работе с данными: примеры масштабных дата-решений, особенности и результаты
🔹 Тренды и примеры миграции на российские базы данных
🔹 Практики облачной безопасности в условиях требований к конфиденциальности данных
Конференция будет полезна руководителям компаний и ИТ-специалистам разных направлений.

👉 Зарегистрироваться

#реклама
🗿10🐳7🙈7🦄5👾3🫡2🍌1🍓1
Media is too big
VIEW IN TELEGRAM
🆕 Yandex Cloud добавила новый режим работы в Yandex DataSphere — Dedicated

Yandex DataSphere — это сервис для полного цикла машинного обучения, в котором есть все необходимые инструменты для разработки и интеграции с другими облачными сервисами.

Что открывает выделенный режим Dedicated:
— возможность зарезервировать виртуальную машину в облаке под свой проект и работать с ней сколько нужно;
— ускорение работы моделей машинного обучения для задач по анализу данных.

Что ещё изменилось в Yandex DataSphere:
— режим Serverless остаётся, вы также можете его выбрать и оплачивать вычислительные мощности только во время реального обучения;
— появилась новая версия Jupyter Notebook, это популярный редактор кода для ML-разработки. Обновили интерфейс и добавили предустановленные расширения.

Все подробности можете узнать по ссылке, а обсудить в сообществе разработчиков и аналитиков Yandex DataSphere➡️

#реклама
🗿15🫡7🍌4💯1
Станьте специалистом широкого профиля в работе с данными — научитесь разрабатывать архитектуру данных на курсе Яндекс Практикума.

Выпускники смогут:
◾️ проектировать хранилища и пайплайны;
◾️ использовать инструменты DE: оркестраторы, контейнеры и не только;
◾️ работать со стриминговой обработкой данных и облачными хранилищами;
◾️ создавать хранилища Data Warehouse и Data Lake.

Что будет на учёбе:
— Реальные рабочие задачи и командные проекты.
— Код-ревью и персональные советы от действующих инженеров данных.
— Вебинары и продакшн-опыт от экспертов в инженерии данных.

→ Приходите учиться, если хотите развить свои компетенции или перейти на должность Data Engineer.

#реклама
🗿43❤‍🔥6🌚4🍾2💅2🍌1
VK Cloud Conf: как перенести лучшие практики разработки ИТ-компаний в классический бизнес

Когда: 8 июня, 12:00
📍 Где: Москва
⚡️ Last call: успевайте зарегистрироваться на конференцию для руководителей компаний и ИТ-специалистов разных направлений. Регистрация закрывается 7 июня в 12:00

В программе:

🔹 Как повысить эффективность разработки ИТ-решений с помощью облачных сервисов.
🔹Подходы к работе с данными: примеры масштабных дата-решений, особенности и результаты проектов.
🔹 Тренды и примеры миграции на российские базы данных.
🔹 Лучшие практики облачной безопасности.
У вас будет возможность задать вопросы экспертам и узнать мнение коллег из других компаний. Не упустите возможность получить новую информацию, сделать свой бизнес эффективнее и повысить безопасность работы в облачной среде.

👉 Зарегистрироваться

#реклама
🌭5🍌4❤‍🔥1🙈1
7 июня пройдёт Alfa Analyze IT Meetup — встреча для системных аналитиков. Основные темы и спикеры:

🎯 Как аналитику проще погрузиться в архитектуру?

Борис Пишванов и Михаил Салахов, Solution-архитекторы из Альфы, расскажут, почему может твориться «дичь» на проекте и как из неё приготовить «шашлык»

🎯 Как вести фронтовую документацию рядом с кодом

Игорь Савинов, System Analyst, поделится тем, как ведется документация в Альфа-Банке, какие проблемы приходится решать

🎯 Метрики эффективности процессов системного анализа

С Сергеем Воробьевым, Head of Efficiency Development в Альфе, разберёмся в процессах погружения в компетенции

🎯 Куда расти системному аналитику?

Юлия Лебедева, Competency Lead в Сбере, Анатолий Олейнер, Software Architect в СИБУР диджитал и Иван Стефу, Product Owner в Альфа-Банке обсудят пути развития для аналитиков

Когда: 7 июня в 18:30
Где: Москва, пр-т Андропова, 18, к. 3 или подключайтесь онлайн

Регистрируйтесь, чтобы не пропустить! Количество мест ограничено.

#реклама
🌭6❤‍🔥3🌚1
⚡️ CockroachDB vs YDB vs YugabyteDB

Нашли ультимативный гайд по базам данных на английском языке.

В статье 🇬🇧
• исследование БД на основе популярного бенчмарк-теста YCSB;
• «сравнение яблок и апельсинов» или небольшая ретроспектива в историю исследований баз данных SQL;
• проверка производительности БД на разных сценариях.

Есть ли одна лучшая СУБД SQL, узнайте по ссылке 😉

#реклама
🗿8👾4❤‍🔥2🌚2🐳1🍾1
🚀 Хотите узнать, как собирать и анализировать данные в Telegram?

Тогда подключайтесь к бесплатному вебинару 20 июня 2023 года в 12:00.

Мы подробно расскажем и покажем, как с помощью serverless-сервисов реализовать упрощённый пайплайн поставки данных в Managed ClickHouse и визуализировать их в DataLens. На вебинаре:
• мы сделаем обзор serverless-сервисов и DataLens;
• вы узнаете, как решить задачи поставки и визуализации данных, используя связку: Managed ClickHouse, serverless-сервисов, DataLens, — и как реализовать эти задачи на примере аналитики данных Telegram-чатов.

Вебинар будет полезен бэкенд- и фронтенд-разработчикам, DevOps-специалистам, аналитикам и PM-ам.

Вебинар бесплатный — нужна только регистрация.

#реклама
❤‍🔥8🗿31
Yandex Cloud приглашает на Data Open Source Day

Это первая конференция от Yandex Cloud про Open Source инструменты для обработки данных и создания корпоративных хранилищ.

В программе Data Open Source Day:

🔹 Реальные бизнес-задачи, которые можно решать с помощью Open Source продуктов.
🔹 Эксперты из OZON, Яндекс, Битрикс24 и других компаний расскажут, как технологии с открытым исходным кодом помогают им в работе.
🔹 Какой вклад команда Yandex Cloud вносит в развитие ClickHouse® и Greenplum® .
🔹 Open Source продукты Яндекса для работы с данными: расскажем про YDB и YTsaurus.

Также вас ждёт доклад Яндекс Игр об опыте использования управляемых сервисов PostgreSQL, Redis, YDB. Рассказ о том, как Open Source помогает науке и при чём здесь озеро Байкал.

🗓 11 июля 2023, в 15:00. Участие бесплатное. Регистрация по ссылке.

#реклама
🍾12🙉5🍌1
Скидка до 22% на ресурсы управляемых баз данных Greenplum и OpenSearch в Yandex Cloud

Теперь у вас есть возможность резервировать определенный объем ресурсов — Committed volume of services, CVoS — с фиксированной ценой в течение полугода или года. Это предложение доступно для всех пользователей и позволяет существенно сократить расходы при стабильном потреблении сервисов.

Условия CVoS распространяются на Yandex Managed Service for Greenplum и Yandex Managed Service for OpenSearch, работающие на платформах с процессорами Intel Ice Lake. Размер скидки: 15% при резервировании на пол года и 22% при резервировании на 1 год.

➡️ Подробнее по ссылке.

#реклама
🤷‍♂10🌭6🗿6🐳4🍾2
А вы когда-нибудь задумывались, кто отбирает доклады на ваши любимые конференции? Познакомьтесь с программным комитетом Practical ML Conf от Яндекса.

🔊 Ребята из программного комитета сообщают: число заявок превзошло все мыслимые и немыслимые ожидания. В некоторых секциях конкурс достиг 7 человек на доклад! Эксперты в ML сейчас отбирают самые классные темы и спикеров, так что будет очень много практичных и сочных выступлений. Рассказываем в карточках, кто состоит в программном комитете.

📝 Practical ML пройдёт 7 сентября в Москве, и, конечно, мы проведем онлайн-трансляцию.

👥 Узнать полный состав программного комитета и посмотреть доклады, прошедшие отбор, можно здесь.

И подписывайтесь на @Yandex for ML, там мы скоро начнём рассказывать о программе Practical ML Conf 2023.

#реклама
❤‍🔥10🐳4🗿3🤷‍♀2🌚2
В Авито недавно выложили новые вакансии для аналитиков в разные команды.

➡️ Продуктовый аналитик в команду новостроек
➡️ Аналитик данных в команду новостроек
➡️ Старший аналитик продаж — команда Авито Авто
➡️ Аналитик данных в направление инцидент и проблем менеджмент

Как всегда, очень классные условия:
• Талантливая команда и возможность реализовать свои идеи в проекте с многомиллионной аудиторией;
• Мощное железо, дополнительные мониторы и всё, что нужно для комфортной работы;
• Прозрачная система премий;
• Личный бюджет на обучение, который можно тратить на книги, курсы и конференции;
• ДМС со стоматологией с первого дня, в офисе принимают терапевт и массажист;
• Возможность работать удалённо или сочетать работу из дома и офиса;
• Красивый комфортный офис в 2 минутах от метро «Белорусская» с панорамным видом на центр города, местами для уединённой работы, двумя спортивными залами, зонами отдыха и гамаками.

Выбирайте понравившееся направление и откликайтесь!

#реклама
🗿9❤‍🔥5🙈1
«Easy Report: российский BI, применяющий ИИ для общения с данными»

24 августа приглашаем на вебинар, на котором поговорим про ИИ, NLP в BI и поделимся опытом внедрения BI-системы в крупнейших компаниях РФ.

Что будет на вебинаре

➡️ Зачем нужны ИИ и NLP в BI? Поделимся опытом от практиков, которым удалось создать работающую систему.

➡️ Кейсы применения BI-решения с ИИ. Реальные кейсы внедрения BI-системы в крупнейших компаниях РФ (ритейл, FMCG, строительство, фармацевтика).

➡️ Магия Как работает Easy Report
- формирование отчетов "на лету" по запросу на естественном языке
- подключение к источникам в различных режимах: с кэшированием данных и без
- создание гетерогенной модели данных (Excel + Таблица в БД) и расчетных показателей

Спикеры:

Юрий Ефаров
- CEO Easy Report, генеральный директор Sapiens solutions (в ТОП-15 поставщиков аналитических решений в РФ)

Игорь Пантелеев - Соучредитель и CTO Easy Report, более 5 лет внедряет модули NLP в проекты

Регистрация по ссылке.

🗓 24 августа, 11:00 мск • Онлайн

#реклама
❤‍🔥13🗿7😭4🐳1
Ваш Airflow-кластер постоянно разваливается?

Попробуйте управляемые кластеры с Managed Apache Airflow от DoubleCloud.

В чем преимущества:
▪️ эффективность и контроль: Managed Airflow берет на себя управление инфраструктурой, чтобы вы сосредоточились на задачах;
▪️ автоматизация: автомасштабирующие рабочие инстансы сделают вашу жизнь проще;
▪️ контроль процесса: мониторинг через интуитивный интерфейс для логов и уведомлений;
▪️ мгновенное создание DAG: предустановленные библиотеки и интеграция с Git для запуска.

Сейчас мы в поиске 10 юзеров для превью. Пишите нам на почту annagrch@double.cloud, если хотите попробовать Managed Apache Airflow первыми.

#реклама
🫡5❤‍🔥2💯1
🆕 Воркбуки в Yandex DataLens!

Приглашаем на вебинар, где покажем новинку.

29 августа представим новый подход к организации объектов внутри сервиса. Рассмотрим, как функциональность упростит работу и расширит возможности использования BI-системы.

Вы узнаете:
🔹 что такое воркбуки и как их использовать;
🔹 как устроена новая ролевая модель;
🔹 как работать с группами пользователей;
🔹 какие возможности открывают воркбуки;
🔹 как перейти на воркбуки.

Также в конце спикер проведёт короткую Q&A-сессию. Для автора лучшего вопроса мы приготовили сюрприз! 🎁

Участие бесплатное, нужно только ➡️ зарегистрироваться.

#реклама
❤‍🔥11🗿7
Инструмент, который поможет сделать первые шаги для процессов DataQuality и SelfBI. Он органично встраивается в Microsoft Excel и работает с базами данных через ODBC.  

Данный тул позволят обогатить Excel PowerQuery следующими функциональными возможностями
1)  Пользователи могут видеть все объекты, работать с фильтрами для отображения только требуемых таблиц
2)  Редактор SQL запросов с подсветкой синтаксиса . Возможность изменить SQL для  Excel таблиц связанных с внешними данными
3)  PowerPivot отчет сразу над SQL (Прямой аналог Microsoft SQL Analysis Service )
4)  Параметры SQL запросов (можно делать отчетные книги для "простых пользователей" для регулярных процессов (сдача ежемесячной отчетности etc ))
5)   Возможность изменять данные в SQL таблицах

Для разработчиков DWH, специалистов DQ этот инструмент позволяет
a.      Создавать отчеты SQL для выверки данных между различными системами , выстраивая дополнительную проверку логики с помощью Excel
b.      Организовывать сквозные сценарии проверки всего проекта / решения (элементы Unit тестирования для DWH)
c.      Отчуждать результаты тестирования и показывать их заказчику без дополнительной настройки рабочих мест

Для бизнес пользователей (экономистов и финансистов )
a.      Готовить сквозные аудиторские отчеты реконсиляции, раскрывающие все этапы сбора, трансформации и расчета регуляторной и управленческой отчетности
b.      Запускать выгрузки из DWH за различные периоды используя параметризированные SQL шаблоны
c.       Создавать свои мини – дата приложения в Excel /R7 уровня отдела/подразделения без привлечения «большого ИТ» 

Здесь вы можете его скачать https://t.me/xldb7/43 
автор данного решения @datacons

#реклама
🙈15🌚52🙉2