Инжиниринг Данных
20.7K subscribers
1.55K photos
33 videos
175 files
2.84K links
Делюсь новостями из мира аналитики и вредными карьерными советами;)

8 лет в FAANG, инвестиции в недвижимость, компании и акции, solo entrepreneur🏄‍♂️

Контакты и реклама: @dimoobraznii (сам не предлагаю купить рекламу или взаимопиар за деньги).
Download Telegram
Old recommender systems before Amazon, Netflix, and Youtube
Роман Понаморов (сооснователь datalearn) поднял хорошую тему, я полностью его поддерживаю. От себя могу сказать, что на западе ситуация кардинально противоположная в хорошем смысле этого слова. Надеюсь с годами ситуацию улучшиться и люди станут добрее друг к другу.

Вот текст из нашего слака:

@channel
Ребята всем привет, пост будет эмоциональным, возможно с матом, ибо накипело и бомбануло!

Давно наблюдаю в русскоязычной IT среде очень сильную кислотность, не могу понять, откуда столько злости и желания задеть и оскорбить другого человека.
Независимо от форумов будь то Хабр, VC, Cossa, под статьями, особенно, которые пишут новички, найдется довольно таки большое количество токсичных персон, цель которых не прокомментировать пост, а унизить автора и показать собственную значимость.

Когда я это все читаю. у меня всегда в голове вопрос, который до сих пор без ответа, зачем вам это все, какую цель вы преследуете, что вам это дает или даст в жизни?
Я согласен с тем, что некомпетентную статью можно разъ*бать по фактам, критика это всегда хорошо, но зачем вектор своих комментариев направлять на личность самого автора?

Если что, мы в даталеарн за любую критику, но против бестактности и оскорблений. Если вам не нравиться материал или подача, пишите, критикуйте по пунктам, так будет продуктивно и полезно как для вас, так и для проекта.

Мы растем и на наших лекциях начали присутствовать "гости", которые пришли повыпендриваться и нагадить. Зачем писать комментарии в чате никак не связанные с темой вебинар, но направленные, на то, чтобы задеть выступающего спикера? По-моему мнению, этим, такие комментаторы демонстрирует не наличие большой пипирки, а пытаются компенсировать ее отсутствие мнимым самоутверждением.

Мы проводим огромную работу по договоренностям и организации выступлений наших спикеров и стремимся, чтобы они для вас давали максимально полезную информацию и по-возможности инстайты, о которых вам мало кто расскажет или это инфы просто нет, поэтому говорю безпипирочным: вы ошиблись и вошли не в ту дверь.

Если вы выскочки и вам не терпеться продемонстрировать свои навыки, почему вы это делаете в токсичной плоскости, а когда вас зовешь в прямой эфир, чтобы вы конструктивно и по факту высказались, вы молчите?

Да многие из вас профики и по-настоещему спецы в каких-то областях и по набору своих навыков и знаний можете вы*ебываться по праву, но делайте это с присутствием чувства такта, чтобы вас уважали и ценили.
Какая разница какие у вас навыки и заслуги, руководитель вы или большой босс, если вы ведете себя так, что вызываете отвращение у ваших коллег и подчиненных и они с вами выстраивают коммуникации не чтобы у вас чему-то поучиться, а потому что так надо, по рангу суббординации.

И если кто-то хочет померится у кого больше, то давайте линейкой будет не острота бестактности и унижений, а польза, которую вы можете передать большому количеству людей! Если у вас есть стремление и желание продемонстрировать свои скилы, то я с удовольствием предоставлю вам эфирное время и если вы расскажите так круто, что другие будут вам аплодировать, то естественно про вас будут думать: "Базару нет - там реально большой"
Если пропустили вебинары, то есть запись.

Содержание вебинара:
📌 Поиск работы в США
📌 Смена направления из Рекрутмента в Data
📌 Работа на позициях Business analyst/Business intelligence engineer

Таймлайн:
0:00 - Вступительное слово общее
2:26 - Вступления и содержание вебинара от Марины Крюковой
3:30 - Начало презентации
4:05 - Изменение карьеры: из рекрутера в BI Engineer
7:00 - Рассказывает как выиграла грин карту
7:58 - Карьерный путь
11:00 - Начало в США
12:20 - Поиск работы в США
17:00 - Как оказалась в Амазон
17:50 - HR Assistant (Payroll)
19:55 - Systems Analytics (Recruting systems)
22:50 - Systems Analytics (Financial systems)
24:40 - Путь от системного аналитика к BI Engineer
28:50 - BI Engineer
30:15 - Начало работы в retail Amazon
32:09 - Позиция BI инженера в Retail
35:00 - Переход в новую организацию и поиск команд
36:57 - Команда Prime video
37:50 - Работа в Prime video
39:00 - Смена карьеры и как определить чем вы хотите заниматься
45:00 - Что востребовано на рынке труда
45:50 - Определиться что хорошо получается и определить долгосрочные цели
48:00 - Перечень действий что нужно делать
1:00:00 - Ответы на вопросы
Всем привет! Инжиниринг данных становиться все популярней и мы решили взять инициативу в свои руки и сделать первую конференцию по Инжинирингу данных и облачной аналитике в онлайне. Решили полностью уйти от формата 1-2 дня конференции, который в режиме онлайн работает не так эффективно как офлайн. Это дает возможность сделать конференцию глобальной для русского говорящего сообщества и растянуть ее на любой время, где каждую неделю будет 1-3 доклада, что-то вроде серии вебинаров.

Раньше мне очень не хватало конференций и материалов по использованию классических хранилищ данных, BI систем. Конференцию были сдвинуты в сторону разработчиков - high load систем или в сторону определенной бизнес функции HR, маркетинг, финансы и тп. Мы хотим на первый план вынести технологии и подходы.

Другая идея, это привлечь не только супер стар спикеров, но и дать возможность всем желающим выступить со своим докладом и проектом. Будет несколько стримов:
- Data Engineering (Data Integration)
- Cloud Fundamentals
- Python for Data Analytics
- Business Intelligence and Data Visualization
- Data Warehouse
- BigData
- Data Science
- Analytics Team development
- Building Career in Analytics
- Data product management

Мы еще обдумываем концепцию и сделаем лендинг и форму подачи заявок на конференцию. Если у вас есть идеи и вы хотите вписаться в организацию конференции по инжинирингу данных для русскоговорящего сообщества, напишите мне или Роману @rspon.
Looker это облачный BI, который был куплен Google. Кстати у меня досих пор есть свой инстанс и доступ к нему, можете погонять если нужно, и получить ценный опыт еще одного BI продукта. А может быть кто-то хочет его внедрять в Канаде? (rockyourdata партнер Looker) Но я не нашел ни одного клиента:/

Сообщение про другое, они организуют в октябре конференцию JOIN, которая будет бесплатна, и можно узнать много нового про тренды аналитики, BI, BI+AI и кейсы западных компаний, и как обычно английский попрактиковать.
Вопрос, есть ли супец специ по Data Strategy + отличное знание английского? Есть opportunity в Бостоне. Именно хотят стратегию, data program, а не просто внедрить аналитику. Напишите в личку если был опыт и англ хорошо знаете.
​​#soft_skills

В корпорациях легко думать, что ты гуру софт скилов и лидерства. Но жизнь за их пределами способна сбить любую корону. Я хочу делиться с вами не просто важными моментами в аналитике. Но и тем, что оказалось критичным для меня при переходе из корпоративной работы в предпринимательство.

Мотивация. Когда у тебя ещё нет сильного бренда, умение мотивировать определяет всю судьбу. Жизнеспособность молодых продуктов не столько зависит от их юнит-экономики, сколько от энергии команды.

Хотя в книгах нас учат другому, на практике нередко самое простое - это мотивировать людей деньгами. Даже, когда в стартапе классическое состояние - "денег нет", он прибегает к так же классическому ходу: "но вы держитесь". А точнее, начинает обещать первым сотрудникам долю и большие доходы в случае успеха.

Далее только тезисы и видео от величайшего Ицхака Адизеса (кстати, рекомендую все без исключения его книги).

😎 Деньги - это не мотиватор.
😎 Деньги - это демотиватор.
😎Человек радуется повышению дохода пару дней.

Что реально мотивирует:

1. Миссия. Люди готовы на войну идти ради миссии, не то, что на работу (от себя добавлю: самое сложное - это не создание миссии, а способность её доносить без пафосного лица. Cпокойно, искренне, зажигающее).

2. Любовь к своему делу. Люди должны быть на своем месте. В небольших проектах все многостаночники. Но когда креативщик занимается рутиной, его глаза гаснут. А вслед за этим, едут сроки и качество. Кстати симптом того, что человек не на своем месте, - он чаще остальных просит (явно или через намёки) ещё больше денег.

3. Полномочия. Надо слышать людей. Надо давать им возможность решать и делегировать. Казалось бы. Как такое достижимо в маленьких командах. Важно учиться давать команде часть бюджета из оборота на покупку инструментов или найм фрилансеров. Мне и моей команде очень помогает горизонтальное делегирование. Наша аналитика похожа на парную гимнастику - это процесс непрерывной парной поддержки.

Хотите ещё такие темы в этом канале?
Случайно нашел конференцию 1го октября Пирамида Метрик, возможно вам будет интересно. Как я понял ее организует DataLatte - студия аналитики, раньше их не встречал среди всех наших аналитических сообществ. Какое милое название, я даже захотел Латте☕️, вчера как раз пришла новая кофе машина.🤗
Часто слышу - "Работать в фанге это круто" или "хочу работать в фанге". Я примерно понимал, что FANG а позднее FAANG это набор компаний:
Facebook
Amazon
Apple
Netflix
Google
Я все думал почему там так круто работать, и получается если не там, то уже не круто?🤨

Оказалось все проще, на самом деле качество работы в компании, карьерный рост или вознаграждение не зависит от компаний. Хотя это факт, эти компании могут платить много, но еще надо продать себя подороже, причем ваша базовая зарплата будет немного выше рынка (если повезет), а если нет, то точно не меньше. Основное преимущество это сток, акции компании, которые вам дают на 4 года. И каждый год вы получате по 25% акций, можете их продать или хранить. Например, я получил акции амазона в 2016, когда они стоили 700$. Сейчас они 3200$+. Если перемножить кол-во акций на их цену, то о боги, я накопил приличную сумму денег, но потом мы спускаемся на землю, и находясь в Северной Америке, на собственном опыте начинаешь понимать слово TAX и их множество, они беспощадны. Начиная от налога в 50% на акции (в Канаде), когда Амазон мне дарит, например 10 акций, государство сразу забирает половину. А если, амазон мне дарит акции по 700, а через 2 года они 3т, то 2300 это capital gains, и снова - заплати налоги. В общем, вы поняли, вся это история про total compensation часто звучит мощно, пока 1/3 от всех этих денег на руки не получите. Это вам не 13% налог на зарплату в России. Я конечно где-то утрирую, решил поделится опытом после 4,5 года в FAANG.

Возвращаюсь к FAANG -
- The term "FANG" refers to the stocks of four popular American technology companies: Facebook, Amazon, Netflix, and Alphabet.
- Each of the FANG companies has shown extraordinary growth in recent years, reflected in both their revenues and their net profits.
- Although their business models vary, they each share the use of advanced technologies to acquire and retain users.


То есть просто компании, которые показали взрывной рост. Есть и другие хорошие компании, где хорошая культура и отличный зарплаты. Ставить целью работать в FAANG это круто, но получается мы часто переоцениваем компании FAANG и недооцениваем возможности в других компаниях. А вы как думаете?
Конец сентября, Яндекс проводит большую онлайн конференцию. Можно послушать про облачную аналитику и другие полезные сессии.
Amazon стратегически развивает SageMaker - облачный сервис для ML (виртуальные машины EC2 + Jupyter Notebooks + ML Framework). В 2021 году он планируется стать основным для внутренней и внешней разработки в области ML для Amazon/AWS. Есть интересный science paper про Autopilot (имеется ввиду AutoML).

Книги про SageMaker:
1) Learn Amazon SageMaker: A guide to building, training, and deploying machine learning models for developers and data scientists
2) Data Science on AWS

Тренинг и примеры Python Notebooks по Sage Maker. Там будет одна из лаб - использование Autopilot.
Один из главных принцип лидерства (Leadership Principles) в Амазон - Любовь к Клиентам (Customer Obcession). Да и не только у Амазона, многие компании являются клиентоориентированными.

Когда мы внедряем или сопровождаем аналитическое решение, мы тоже должны быть customer obcession. Только для нас клиенты - это пользователи BI решения. Лучший способ узнать у коллег - провести опрос и визуализировать результат. Таким образом вы сможете собрать обратную связь, быть проактивным и приоритизировать или выявить ключевые проблемы у ваших пользователей, которые вы сможете решить. Таким образом, вы повысите клиентский опыт и у вас будет, что рассказать вашему руководителю или другой компании на собеседовании. 😉

В этом видео мы узнаем:
📌 Для чего нужны опросы пользователей BI
📌 Типы опросов
📌 Net Promoter Score
📌 Customer Satisfaction Score
📌 Customer Effort Score
📌 Реальные примеры опросов
📌 Пример визуализации опросов в Tableau

https://youtu.be/kKI5PMVC6A4
Для модуля 3.9 я хотел установить Tableau Server на Windows. У меня 16Гб оперативки, и я выделил 8Гб для виртуальной. Раньше этого было достаточно. Теперь Tableau попросил меня мин 32Гб оперативки. Поэтому я скачала версию 2018 года, и ей хватило 8ми.

Почему я так люблю возиться с виртуальными машинами? Для меня это единственный способ понять как все работает. Идеальная ситуация, когда на одной виртуальной машине (Windows) находиться BI Server, на другой (Linux) находится аналитическое хранилище данных (раньше можно было скачать готовую виртуалку с Teradata) или виртуальная машина Cloudera с Hadoop. Дальше, мы все это соединяем в одну сеть, и подключаемся с BI клиента и SQL клиента с локального компьютера. И когда вся эта история работает, для меня это прям ZEN. Чего и вам желаю.

К счастью или к сожалению не достаточно уметь писать SQL запрос или строить графики, нужно понимать как сервисы взаимодействуют между собой.
Если вам нужно быстро визуализовать данные, построить пару графиков, которые буду сами обновляться, то вы можете поддержать отечественного производителя Yandex DataLens.

Я его добавлю в обзор fancy BI решений для модуля 3.12.

Цена у dataleans прозрачная, платим не за пользователей, а за часы. До 166 часов в месяц бесплатно.

Из преимуществ - есть встроенные конекторы к яндекс сервисам.

Кому подойдет? В первую очередь людям, которые любят пробовать новые решения или кому нужно быстро визуализировать данные с использованием простых графиков, чтобы показать коллегам или вывести на экран в офис.

Через несколько лет появятся вакансии, где уже будет требоваться опыт Yandex Cloud, так что лучше изучить на ранней стадии все про решения в облаках, тем более все на русском.