Окей, облако это хорошо, но что делать, если существующее решение существует on-premise? Ответ прост - мигрировать. Но как? Облачные вендоры максимально решили нам помочь и предоствили огромное колличество сервисов, которые упростят нашу жизнь.
Из модуля вы узнаете:
📌 Стратегии миграции в облако
📌 Примеры миграции базы данных и аналитического решения
📌 AWS Schema Conversion Tool
📌 AWS Database Migration Service
📌 Azure Migration Services
https://youtu.be/QGgQj34JG1Q
Из модуля вы узнаете:
📌 Стратегии миграции в облако
📌 Примеры миграции базы данных и аналитического решения
📌 AWS Schema Conversion Tool
📌 AWS Database Migration Service
📌 Azure Migration Services
https://youtu.be/QGgQj34JG1Q
YouTube
DATALEARN | DE - 101 | МОДУЛЬ 5-7 МИГРАЦИЯ В ОБЛАКО
Окей, облако это хорошо, но что делать, если существующее решение существует on-premise? Ответ прост - мигрировать. Но как? Облачные вендоры максимально решили нам помочь и предоствили огромное колличество сервисов, которые упростят нашу жизнь.
Из модуля…
Из модуля…
Статья по этой теме, которую я написал 2 года назад https://medium.com/rock-your-data/cloud-analytics-migration-strategies-74af248de066
Medium
Cloud Analytics Migration Strategies
Nowadays, speed and timing matter. This agility combined with innovation has proven to be a game-changer for several organizations across…
Forwarded from Anscombe's Quartet
Немного поработал с фреймворком для написания веб-приложений на Python под названием Streamlit - и описал пример такого приложения в отдельной статейке:
https://polarpersonal.medium.com/building-data-visualization-apps-with-streamlit-and-databricks-sql-54e51bb6b0a8
https://polarpersonal.medium.com/building-data-visualization-apps-with-streamlit-and-databricks-sql-54e51bb6b0a8
Medium
Building data visualization apps with Streamlit and Databricks SQL
A quick example of building a data visualization app in almost pure Python
👍2
У AWS Glue (ETL от AWS на базе Spark) появился продукт Data Brew, с помощью которого можно чистить данные и изучать их природу. Для Data scientist должно быть очень удобно при работе с большим объемом.
Тут назрел вопрос, с удаленной работой, можно теперь “теоретически” работать full time на несколько работах. Мой хороший товарищ в Канаде😜, успешно это делает, причем у него не начальные позиции, а senior с зарплатой выше среднего. Я, например, мог бы не увольняться из Amazon и работь на Microsoft. Информация о моих общих доходах и о том, что я делаю конфиденциальна для моего работодателя. Но я перегорел и хотел просто больше времени отдыхать. Возможно в будущем я вернусь к этой затеи. Мне интересно про рынок в РФ, реально ли там удаленно работать на 2 фулл тайм работе? (конечно, если вы опытный специалист). Вариант про фул тайм + подработка я не рассматриваю, это всегда было норм.
На канале мы обсуждали про инструмент для ETL, которые делает T с помощью кода - DBT tool. Да ещё и опен сорс. 2 свежие статьи:
Julien Kervizic: Leveraging DBT as a Data Modeling tool
DBT: dbt + Materialize: Streaming to a dbt project near you
Julien Kervizic: Leveraging DBT as a Data Modeling tool
DBT: dbt + Materialize: Streaming to a dbt project near you
Medium
Leveraging DBT as a Data Modeling tool
Reflections on one year of using DBT for modeling a data warehouse
"Management is the opportunity to help people become better people. Practiced that way, it’s a magnificent profession." Clayton Christensen
Облачные вычисления дают нам много преимущест, и аналитика не исключение. Мы можем сфокусироваться на решение бизнес задач и не тратить время на создание инфраструктуры. В зависимости от задачи и доступных ресурсов мы можем использвать IaaS, PaaS или SaaS. Пару кликов и у вас есть хранилище данных, куда вы можете загружать данные и сразу их визуализировать практически в реальном времени. Если кратко, то возможности безграничны и зависят лишь от вашей фантазии и кошелька.
В этом видео вы узнаете про:
📌 Основные компоненты аналитики
📌 Роли и специалисты
📌 AWS решения для аналитики
📌 Azure решения для аналитики
📌 GCP решения для аналитики
https://youtu.be/E4kZI4-S2SY
В этом видео вы узнаете про:
📌 Основные компоненты аналитики
📌 Роли и специалисты
📌 AWS решения для аналитики
📌 Azure решения для аналитики
📌 GCP решения для аналитики
https://youtu.be/E4kZI4-S2SY
YouTube
DATALEARN | DE - 101 | МОДУЛЬ 5-8 АНАЛИТИКА В ОБЛАКЕ
Облачные вычисления дают нам много преимущест, и аналитика не исключение. Мы можем сфокусироваться на решение бизнес задач и не тратить время на создание инфраструктуры. В зависимости от задачи и доступных ресурсов мы можем использвать IaaS, PaaS или SaaS.…
Как вы считаете - сертификация помогает легче найти работу и получить зарплату выше или она бесполезна? (Можно несколько вариантов)
Anonymous Poll
25%
Однозначно помогает💯
11%
Не помогает, пустая трата время💨
46%
Не помогает с работой, но зато помогает систематизировать знания😍
2%
Является обязательным требование для моей позиции😵💫
25%
Помогает узнать best practices🧐
9%
Я могу себе написать в резюме сертификаты, все равно не проверят подлинность🤫
23%
Лучше заплатить вендору за сертификацию, чем псевдо школе за псевдознания и цветной сертификат pdf😜
Как-то давно, после внедрения Matillion ETL, мне предложили написать use case про наше решение в Amazon Subsidiary - Migrates to the cloud and increases ETL literacy within the company by 150%. Ну написал и забыл.
Оказывается, есть много венчурных компаний, которые исследуюь рынок дата и опрашивают пользователей инструментов, чтобы лучше понять инвестировать или нет. Рынок ETL не исключение, я уже много раз рассказывал про разные инструменты, их +\- и тд, даже если не работал с инструментов особо (пример это Fivetran). Одна консультация стоит 350US$ в час. И находят они меня через этот use case. И они где-то 1-2 раза в месяц. Можно их считать спонсором телеграмм канала, на котором нет рекламы за 2000 рублей😝
Теперь про фирмы, которые вы можете посмотреть и попробовать вписаться:
https://thirdbridge.com/
https://www.alphasights.com/
Есть и много других.
Оказывается, есть много венчурных компаний, которые исследуюь рынок дата и опрашивают пользователей инструментов, чтобы лучше понять инвестировать или нет. Рынок ETL не исключение, я уже много раз рассказывал про разные инструменты, их +\- и тд, даже если не работал с инструментов особо (пример это Fivetran). Одна консультация стоит 350US$ в час. И находят они меня через этот use case. И они где-то 1-2 раза в месяц. Можно их считать спонсором телеграмм канала, на котором нет рекламы за 2000 рублей😝
Теперь про фирмы, которые вы можете посмотреть и попробовать вписаться:
https://thirdbridge.com/
https://www.alphasights.com/
Есть и много других.
(Перезалил видео)
AWS, Azure и GCP предлагают нам сертификацию на любой вкус и цвет. Есть для начинающих и продвинутых. Помимо основной сертификации есть еще специализация в Аналитике, сетях, безопасности и тд.
В этом видео вы узнаете про:
📌 Сертификации и специализации в AWS, Azure, GCP
📌 Материалы подготовки
📌 Нужна ли сертификация или нет?
📌 Обзор облачных профессий на HeadHunter и Indeed
https://youtu.be/0-sbxggc9KQ
AWS, Azure и GCP предлагают нам сертификацию на любой вкус и цвет. Есть для начинающих и продвинутых. Помимо основной сертификации есть еще специализация в Аналитике, сетях, безопасности и тд.
В этом видео вы узнаете про:
📌 Сертификации и специализации в AWS, Azure, GCP
📌 Материалы подготовки
📌 Нужна ли сертификация или нет?
📌 Обзор облачных профессий на HeadHunter и Indeed
https://youtu.be/0-sbxggc9KQ
YouTube
DATALEARN | DE - 101 | МОДУЛЬ 5-9 ПРОФЕССИИ И СЕРТИФИКАЦИЯ В ОБЛАЧНЫХ ВЫЧИСЛЕНИЯХ
AWS, Azure и GCP предлагают нам сертификацию на любой вкус и цвет. Есть для начинающих и продвинутых. Помимо основной сертификации есть еще специализация в аналитике, сетях, безопасности и тд.
В этом видео вы узнаете про:
📌 Сертификации и специализации…
В этом видео вы узнаете про:
📌 Сертификации и специализации…
Все хотят строить модели, но не все хотят ковыряться в данных, чистить их, интегрировать и консолидировать. https://research.google/pubs/pub49953/
research.google
"Everyone wants to do the model work, not the data work": Data Cascades in High-Stakes AI
Крупнейшие облачные проекты в штатах:
1) Amazon, Microsoft and Google Pursue $1 Billion Cloud Deal With Boeing (пока не понятно, кто возьмет, возможно будет multicloud)
2) Pentagon Cancels Multibillion-Dollar Cloud Contract With Microsoft - изначально Microsoft выиграл контракт на Joint Enterprise Defense Infrastructure (JEDI), но Amazon подал в суд, что сделка была непрозрачная, и теперь пентагон решил тоже разделить контракт на Microsoft и Amazon. (А google совсем мимо). Акции Амазон выросли на этой волне. Теперь ждем когда Безос полетит в космос на своей ракете в конце июля
Источник The Information
1) Amazon, Microsoft and Google Pursue $1 Billion Cloud Deal With Boeing (пока не понятно, кто возьмет, возможно будет multicloud)
2) Pentagon Cancels Multibillion-Dollar Cloud Contract With Microsoft - изначально Microsoft выиграл контракт на Joint Enterprise Defense Infrastructure (JEDI), но Amazon подал в суд, что сделка была непрозрачная, и теперь пентагон решил тоже разделить контракт на Microsoft и Amazon. (А google совсем мимо). Акции Амазон выросли на этой волне. Теперь ждем когда Безос полетит в космос на своей ракете в конце июля
Источник The Information
В продолжение крупных сделок - оказывается у главного конкурента Boeing - Airbus, инфраструктура на Google Cloud.
Узнал новое выражение - "no over the fence".
Today’s comic is about that age old problem in games dev when we build fences instead of bridges and silos instead of pastures. Throwing things over that fence is something we want to work hard to move away from as a way of working. We want to foster collaboration at every stage of the game, and enable everyone to do their best creative work, as a team.
PS мне кажется я так делаю разработчикам Power BI, типа, вот вам connection string, enjoy
Today’s comic is about that age old problem in games dev when we build fences instead of bridges and silos instead of pastures. Throwing things over that fence is something we want to work hard to move away from as a way of working. We want to foster collaboration at every stage of the game, and enable everyone to do their best creative work, as a team.
PS мне кажется я так делаю разработчикам Power BI, типа, вот вам connection string, enjoy
С каким типом данных вы работаете чаще всего, когда извлекаете их для аналитики?
Anonymous Poll
29%
CSV, TXT, TSV и другие delimited файлы
15%
Excel
32%
Реляционные Базы данных (OLTP)
3%
NoSQL базы данных
8%
JSON, XML и другие semi structure данные
9%
Parquet, ORC - файлы для аналитики
4%
Другой (напишите в комментах)
А вы еще не прошли workshop по Python для AWS? Это будет модуль 5.10. Я писал недавно, что Sergii Volodarskyi сделал для вас офигенную инструкцию перевод на русском. Там очень интерсные лабы с использованием сервисов AWS. В другом месте за такой подробный воркшоп по Python с элементами ML (машинный перевод) с вас бы взяли тысяч 15-20 рублей как минимум, а у нас бесплатно. Я сам раньше не использовал облачную IDE Cloud9 и не работал с сервисами AWS Translate. Особенно мне интересно разобраться как работает Logging и есть бонус лаба с DynamoDB (NoSQL).
Вообще интересно получается, по хорошему, до модуля 7 (про Spark) нам вообще не нужен Python, с помощью SQL, баз данных и приложений drag and drop (ETL, BI) + облачных вычислений мы можем решить 90% кейсов для аналитики. Я подумал про аналогию коробки автомат в машине. Можно же на автомете ейздить и не париться, а можно быть hardcore и на механики в пробке стоять. Python конечно дает нам огромное преимущество для data engineering и data science сложно представить, но в целом для DE, BI и хранилищ данных с элементами облачного Hadoop (AWS EMR или HDInsight) мы можем обойтись тем же SQL (hive).
Вообще интересно получается, по хорошему, до модуля 7 (про Spark) нам вообще не нужен Python, с помощью SQL, баз данных и приложений drag and drop (ETL, BI) + облачных вычислений мы можем решить 90% кейсов для аналитики. Я подумал про аналогию коробки автомат в машине. Можно же на автомете ейздить и не париться, а можно быть hardcore и на механики в пробке стоять. Python конечно дает нам огромное преимущество для data engineering и data science сложно представить, но в целом для DE, BI и хранилищ данных с элементами облачного Hadoop (AWS EMR или HDInsight) мы можем обойтись тем же SQL (hive).
GitHub
data-engineering/DE-101 Modules/Module05/DE - 101 Labs/AWS - Python Workshop/aws-python-workshop.MD at master · Data-Learn/data…
Getting Started with Data Enngineering. Contribute to Data-Learn/data-engineering development by creating an account on GitHub.