Инженеры данных часто задают вопрос: «Грузить данные в реальном времени (real time streaming) или пачками (batch)»
Если спросить у бизнес заказчика, то мы получим ответ - «нам нужно в режиме реального времени отслеживать данные и быстро реагировать!» Иногда это правда, а иногда нет.
При выборе решения следует задавать следующие вопросы:
«Кто будет поддерживать data pipeline? Понимает ли моя команда, как починить этот datapipeline, когда он сломается? » - Стрминговые решения часто сложнее классчической загрузки данных раз в день/раз в час.
Другой вопрос - «Будет ли кто-нибудь действительно просматривать эти данные в нерабочее время?» - если это правда, то в отчетах в реальном времени больше смысла. Если нет, то им, вероятно, можно обойтись без streaming решения.
Задавать правильные вопросы при создании аналитического решения абсолютно необходимо для его успешного внедрения.
У вас есть кейсы, когда вы создавали стриминговое решение? Может быть есть история, когда бизнес просил real time metrics, а на самом деле им не нужно было?
Если спросить у бизнес заказчика, то мы получим ответ - «нам нужно в режиме реального времени отслеживать данные и быстро реагировать!» Иногда это правда, а иногда нет.
При выборе решения следует задавать следующие вопросы:
«Кто будет поддерживать data pipeline? Понимает ли моя команда, как починить этот datapipeline, когда он сломается? » - Стрминговые решения часто сложнее классчической загрузки данных раз в день/раз в час.
Другой вопрос - «Будет ли кто-нибудь действительно просматривать эти данные в нерабочее время?» - если это правда, то в отчетах в реальном времени больше смысла. Если нет, то им, вероятно, можно обойтись без streaming решения.
Задавать правильные вопросы при создании аналитического решения абсолютно необходимо для его успешного внедрения.
У вас есть кейсы, когда вы создавали стриминговое решение? Может быть есть история, когда бизнес просил real time metrics, а на самом деле им не нужно было?
Никто не пробовал? https://vc.ru/finance/162560-razrabotchik-otkrytoy-platformy-dlya-sozdaniya-servisov-analitiki-cube-dev-s-osnovatelyami-iz-rossii-privlek-6-2-mln
vc.ru
Разработчик открытой платформы для создания сервисов аналитики Cube Dev с основателями из России привлёк $6,2 млн — Финансы на…
Стартап планирует потратить деньги за запуск коммерческой версии сервиса.
Отличный совет - хочешь отдохнуть в выходные, не делай deploy на прод в пятницу. Вы не представляете сколько раз я нарушал это правило и все ломал. Иногда обновляя BI Server, иногда ETL, иногда дашборд и многое другое. Пятница для fun work можно поучиться или просто в игры настольные с коллегами поиграть🎏 А вы как по пятницам - "move fast, break things"?😎
Лично не знаком с Валерием Бабушкиным, но как я понимаю он в топ российских DS и в конце концов переехал/переезжает в Fb UK. Классное интервью, было интересно послушать. Большой респект ребятам за материал и подачу. Ну и рад за Валерия и его новые и интересные проекты в Fb. Я вот, например провалил собес в Fb. https://youtu.be/w-0NdY8y-4Y
YouTube
Валерий Бабушкин о работе в Facebook и трендах Data Science | Интервью | karpov.courses
Курс Hard ML: http://bit.ly/42icUh3
Почти по традиции завершаем понедельник под интервью с Валерием Бабушкиным, тимлидом в X5 Retail Group.
Параллельно с обсуждением новостей из мира ML, нам удалось:
● упорядочить особенности найма в такие крупные компании…
Почти по традиции завершаем понедельник под интервью с Валерием Бабушкиным, тимлидом в X5 Retail Group.
Параллельно с обсуждением новостей из мира ML, нам удалось:
● упорядочить особенности найма в такие крупные компании…
Работая из дома я заметил, что все больше сижу, даже не смотря на стол, который может пониматься и дает возможность работать стоя. После 10 лет работы за компьютером я осознал, что стул, это очень важно. Я часто слышал про коллег о стульях Herman Miller, но думал, что это все фигня. Стул за 1000+US$😖 Мне после 3х лет на ГКНПЦ им Хруничева, любой офисный стул казался удобным. То ли возраст, то ли Канада сделала меня нежным и мне стали не удобны все стулья, и я созрел на Aeron стул.
Вот, что про него пишут: "A few things about the Herman Miller Aeron chair; it will probably be the last office chair you ever purchase. They are well worth every dollar. They really are excellent. Very very comfortable and the mesh fits your body to perfection.".
Теперь я понял, почему коллеги очень тащятся от этих стульев и я созрел на такой же, надо инвестировать с себя правильно))
Ни у кого нет таких стульев?
Теперь вы знаете о чем нужно договариваться с работадателем при устройстве на работу - чтобы вам стул предоставили хороший, а иначе не получится добывать insights и строить хорошие distributed data systems и data pipelines.
Вот, что про него пишут: "A few things about the Herman Miller Aeron chair; it will probably be the last office chair you ever purchase. They are well worth every dollar. They really are excellent. Very very comfortable and the mesh fits your body to perfection.".
Теперь я понял, почему коллеги очень тащятся от этих стульев и я созрел на такой же, надо инвестировать с себя правильно))
Ни у кого нет таких стульев?
Теперь вы знаете о чем нужно договариваться с работадателем при устройстве на работу - чтобы вам стул предоставили хороший, а иначе не получится добывать insights и строить хорошие distributed data systems и data pipelines.
Hermanmiller
Aeron Chair
Aeron—the original innovative work chair, designed for all, thanks to the research of designers Bill Stumpf and Don Chadwick. Updated today with ocean-bound plastic.
Forwarded from Reveal the Data
Сегодня начинается Tableau Conference 2020. Там 103 доклада, где взять столько времени! 😱
Отобрал себе часть выступлений, но видимо буду смотреть большинство уже в записи. Мне, в этот раз, больше всего интересны темы про управление контентом и развитие культуры использования BI-системы. И конечно ещё интересно, что новенького в функционале.
Про новые фичи Табло:
Tableau Roadmap
Devs at Desks
Tableau and Einstein Analytics Coming Together
Про развитие культуры и управление контентом:
Best Practices for Content Governance
Metric Insights: Achieving a Single Source of Truth
Monitoring to the Max: Blueprint + Server = ♥️
Building a Data Culture Part
Your Data Culture - A 20:20 Vision
Про проектирование дашбордов и работу с Табло:
Adding Hidden Context to Your Dashboard
Speed Tipping Favorites
Revisiting the Signal and the Noise
Отобрал себе часть выступлений, но видимо буду смотреть большинство уже в записи. Мне, в этот раз, больше всего интересны темы про управление контентом и развитие культуры использования BI-системы. И конечно ещё интересно, что новенького в функционале.
Про новые фичи Табло:
Tableau Roadmap
Devs at Desks
Tableau and Einstein Analytics Coming Together
Про развитие культуры и управление контентом:
Best Practices for Content Governance
Metric Insights: Achieving a Single Source of Truth
Monitoring to the Max: Blueprint + Server = ♥️
Building a Data Culture Part
Your Data Culture - A 20:20 Vision
Про проектирование дашбордов и работу с Табло:
Adding Hidden Context to Your Dashboard
Speed Tipping Favorites
Revisiting the Signal and the Noise
Я бы ещё посмотрел все keynote сессии, там всегда крутые спикеры и интересные доклады!
Вчера я скинул ссылку про Azure. Потом я внимательно изучил, что они предлагают, и понял насколько это полезно и круто.
Во-первых видно, что Azure развивает российский рынок больше чем AWS и GCP.
Во-2х, после основ Azure - можно сдать бесплатный экзамен! Такого нам еще не предлагали. Не важно, что вы делаете и с чем работаете. Лет через 3-5 точно будете с облаками работать, начните сейчас, сдайте этот экзамен. На datalearn мы тоже будем про облака говорить в модуле 5.
В 3-х, на английском с русскими субтитрами, вы узнаете про облачное хранилище данных (datalearn модуль 6 похож будет про Redshift, Snowflake, Synapse). Узнаете про Azure Data Factory (cloud etl/elt), Databricks (spark), Synapse Analytics (DW).
В 4-х, вы получите кредиты, то есть ваше обучение будет бесплатно.
Опционально вы можете еще посмотреть другие сессии.
Во-первых видно, что Azure развивает российский рынок больше чем AWS и GCP.
Во-2х, после основ Azure - можно сдать бесплатный экзамен! Такого нам еще не предлагали. Не важно, что вы делаете и с чем работаете. Лет через 3-5 точно будете с облаками работать, начните сейчас, сдайте этот экзамен. На datalearn мы тоже будем про облака говорить в модуле 5.
В 3-х, на английском с русскими субтитрами, вы узнаете про облачное хранилище данных (datalearn модуль 6 похож будет про Redshift, Snowflake, Synapse). Узнаете про Azure Data Factory (cloud etl/elt), Databricks (spark), Synapse Analytics (DW).
В 4-х, вы получите кредиты, то есть ваше обучение будет бесплатно.
Опционально вы можете еще посмотреть другие сессии.
Docs
Microsoft Certified: Azure Fundamentals - Certifications
Demonstrate foundational knowledge of cloud concepts, core Azure services, plus Azure management and governance features and tools.
Когда я учил английский, я учил его через Ted Talks. Это такие презентации по 10-15 минут на разные темы, как правило очень качественные спикеры, где можно учиться у них, как выступать.
Сегодня я увидел absolutely amazing ted talk, что значит очень хороший и главное полезный для всех. У всех у нас есть большие цели, и мы слышали про
-"как съесть слона? - по частям"
-"как съесть самолет? - по частям" (и это реальная история)
В этом Ted Talk Dr. Stephen показывает на своем примере, как с помощью marginal adjustment (инкрементальных действий) можно добиться серьезные результатов. В общем очень inspiring ted talk все рекомендую.
Примеров marginal adjustment может быть много. Вот мои примеры:
-каждый день читать 10-20 страниц
-практиковать python (30мин, так как на работе мало его пока использую)
-15-20 минут спорт💪
-10-15 минут писать и читать по русски/английски со старшим сыном
К сожалению мой список маленький и надо над ним работать, начав с того, что не брать с собой телефон в комнату, где работаю и удалить все лишние приложения с рабочего компа🤦♂️ Отчасти поэтому удалил facebook, чтобы не тратить на него время.
Сегодня я увидел absolutely amazing ted talk, что значит очень хороший и главное полезный для всех. У всех у нас есть большие цели, и мы слышали про
-"как съесть слона? - по частям"
-"как съесть самолет? - по частям" (и это реальная история)
В этом Ted Talk Dr. Stephen показывает на своем примере, как с помощью marginal adjustment (инкрементальных действий) можно добиться серьезные результатов. В общем очень inspiring ted talk все рекомендую.
Примеров marginal adjustment может быть много. Вот мои примеры:
-каждый день читать 10-20 страниц
-практиковать python (30мин, так как на работе мало его пока использую)
-15-20 минут спорт💪
-10-15 минут писать и читать по русски/английски со старшим сыном
К сожалению мой список маленький и надо над ним работать, начав с того, что не брать с собой телефон в комнату, где работаю и удалить все лишние приложения с рабочего компа🤦♂️ Отчасти поэтому удалил facebook, чтобы не тратить на него время.
YouTube
How to Achieve Your Most Ambitious Goals | Stephen Duneier | TEDxTucson
How you define Stephen Duneier depends on how you came to know him. Some define him as an expert institutional investor, while others know him as a large scale installation artist, avid outdoorsman, professor, decision strategist, coach, business leader,…
Ждем похожих новостей от AWS/GCP https://ain.ua/2020/10/02/microsoft-investiruet-500-mln-v-ukraine/
AIN.UA
Microsoft вложит $500 млн в украинский рынок и построит в Украине два дата-центра
2 октября компания Microsoft подписала меморандум о сотрудничестве с украинским правительством в лице Министерства цифровой трансформации (Минцифры). По его условиям, компания вложит в развитие облачных сервисов на украинском рынке около $500 млн (эта сумма…
А это прям для всех must have! SQL Style guide. Если у вас неразбериха с именами таблиц, полей и тп, то просто внедрите подход Симона, там все по делу!
www.sqlstyle.guide
SQL style guide by Simon Holywell
A consistent code style guide for SQL to ensure legible and maintainable projects