Сравнение классических аналитических MPP хранилищ данных. Даже цену за ТБ указали. Опубликовано в 2015 году! Сколько всего изменилось. В это время я первый раз попробовал Redshift и использовал его для маркетингового аналитики (с маркетингом тоже в первый раз работал, модель атрибуции, мобильные приложения и много прочего)
Безопасность данных это очень важно. Особенно, если вы используете данные персональные данные personally identifiable information (PII). По умолчания в Amazon Redshift нет встроенной функциональности для маскировки данных. В этой статье описано решение для и использование стороннего продукта для безопасности персональных данных personally identifiable information (PII) https://aws.amazon.com/blogs/big-data/protect-and-audit-pii-data-in-amazon-redshift-with-datasunrise-security/ Есть и другой вариант использовать hash и python UDF функции, чтобы обезличить ваши данные.
Azure сегодня презентовала новый продукт - Azure Synapse Analytics. В общем они решили очевидную проблему, объединили озеро данных Azure Data Lake и хранилище данных Azure SQL Data Warehouse. Все для нашего удобства. https://news.microsoft.com/innovation-stories/ignite-2019-azure-synapse
Сегодня еще и день рождение Alexa https://www.technologyreview.com/s/614676/amazon-alexa-will-run-your-life-data-privacy/
MIT Technology Review
Inside Amazon’s plan for Alexa to run your entire life
I started using Alexa before it was cool. I bought a first-generation Echo a few months after its launch because Amazon.com showed me a banner ad as I was shopping for new speakers. After it arrived, my then-roommate, a software engineer at Google, eagerly…
Сегодня выступал в школе, у них была ярмарка вакансий и я рассказывал про работу в Amazon и Alexa, взял даже сына (ему 7 лет), он показывал как он взаимодойствует с Alexa. 2 счастливчиков выиграли новые устройства, которых еще нет в Канаде. Сын пропустил школу, но явно узнал много нового и теперь сидит рисуют Alexa разные устройства, я его кстати везде беру на все мероприятия, это такое у нас детский MBA:)
В Штатах говорят про сильный спад Hadoop: Цитата CEO Snowflake "Slootman: "I've never seen something crater as fast as Hadoop in all my years in the business. We see whole companies like Cloudera, MapR just falling off a damn cliff. We haven't seen that in technology, it's usually a gradual decline. This is rapid decline."
И правда, Snowflake в себе совмещает озеро данных и хранилище. В Azure есть DataBricks (Spark) вместо HDInsight (Hadoop), в AWS есть Athena, Spectrum, Glue (with Spark), которое можно использовать вместо Elastic Map Reduce (Hadoop), и так же и в Google Cloud Platform. До этого я писал, что компания Datameer, тоже уходит от Hadoop как основы своего продукта.
Поэтому хорошо знать, что такое Hadoop и основные принципы, но лучше детально изучать Spark.
И правда, Snowflake в себе совмещает озеро данных и хранилище. В Azure есть DataBricks (Spark) вместо HDInsight (Hadoop), в AWS есть Athena, Spectrum, Glue (with Spark), которое можно использовать вместо Elastic Map Reduce (Hadoop), и так же и в Google Cloud Platform. До этого я писал, что компания Datameer, тоже уходит от Hadoop как основы своего продукта.
Поэтому хорошо знать, что такое Hadoop и основные принципы, но лучше детально изучать Spark.
Всем привет, Валерий (@HardKorr) ведет в Москве несколько митапов, в том числе Moscow School of Business Analysis. Так как скоро я буду в Москве, хотелось собрать митап по аналитике и облакам, где я хотел выступить, заодно про Канаду рассказать и про эмиграцию, работу в Амазоне и тп. И только Валерий согласился все организовать, за что ему большое спасибо!
Так что, если 20 Ноября будете свободны, приходите! Обязательная регистрация.
Так что, если 20 Ноября будете свободны, приходите! Обязательная регистрация.
Meetup
Moscow School of Business Analysis (Moscow, Russia)
Изучаем новые технологии бизнес-анализа. Вебинары и оффлайн-мероприятия по архитектуре и аналитике в Москве. Бизнес и ИТ-секции.Сайт: msba.education
Learning Pandas.pdf
1.9 MB
Работаете с данными? Одна из самых популярных библиотек в Python это Pandas. В приложении ebook про Pandas. Так же это поможет освоить PySpark.
Linkedin это отличный инструмент маркетинга и самопиара. Как говорится, встречают по одежке, вом вам примеры, сегодня попались:
Enabling Large Enterprises to Unlock Innovation through Cloud Computing
Partnering To Unlock The Power Of Your Data
I help leaders and teams define and accelerate their journey from now to next.
Empowering HR professionals to transform their business through better people decisions
Driving and managing apocalyptic transformation
"Talent wins games, but teamwork and intelligence win championships." Michael Jordan
We help unlock the potential of your business, through financial insights, strategy
Helping Customers Unlock their Data Assets
Driving sustainable, value based infrastructure planning and decision making.
Helping my clients Select, Deploy and Manage Technology
Helping enterprise organizations to increase collaboration
Enabling Data Driven Organizations
Solving the issues of modern day analytics
Helping businesses become data-driven.
Working with the Enterprise to address data challenges that yesterday’s technology cannot solve.
Enabling every organization to be data driven...let's talk!
Creating more profitable streams of revenue through modern day analytics
Выбирайте любой! Уверен есть и русские аналоги, и еще много английский вариантов, мне последний понравился.
Enabling Large Enterprises to Unlock Innovation through Cloud Computing
Partnering To Unlock The Power Of Your Data
I help leaders and teams define and accelerate their journey from now to next.
Empowering HR professionals to transform their business through better people decisions
Driving and managing apocalyptic transformation
"Talent wins games, but teamwork and intelligence win championships." Michael Jordan
We help unlock the potential of your business, through financial insights, strategy
Helping Customers Unlock their Data Assets
Driving sustainable, value based infrastructure planning and decision making.
Helping my clients Select, Deploy and Manage Technology
Helping enterprise organizations to increase collaboration
Enabling Data Driven Organizations
Solving the issues of modern day analytics
Helping businesses become data-driven.
Working with the Enterprise to address data challenges that yesterday’s technology cannot solve.
Enabling every organization to be data driven...let's talk!
Creating more profitable streams of revenue through modern day analytics
Выбирайте любой! Уверен есть и русские аналоги, и еще много английский вариантов, мне последний понравился.
Google BigQuery - воркшоп, на котором можно узнать основы BigQuery и Облачного Хранилища данных.
Qwiklabs
BigQuery for Data Warehousing | Qwiklabs
Looking to build or optimize your data warehouse? Learn best practices to Extract, Transform, and Load your data into Google Cloud with BigQuery. In this series of interactive labs you will create and optimize your own data warehouse using a variety of large…
Только я воодушевился подъемом Терадата, созданием облачной аналитики, новому CEO, как его убрали https://www.teradata.com/Press-Releases/2019/Victor-L-Lund-Appointed-Interim-CEO-Succeeding-Oliver-Ratzesberger?mod=article_inline
Teradata
Teradata Announces CEO Transition
Victor L. Lund Appointed Interim CEO, Succeeding Oliver Ratzesberger; Board Commencing Search for Permanent CEO
И конечно стоимость Teradata очень сильно упала. Я застал время, когда акции были нам максимуме, но так и не купил их. Из акций у меня только был/есть Amazon, и он вырос с 600 до 2000 и потом упал до 1600. Много коллег покупают сток продуктов Tableau, Microstrategy. Коллега, скупал сток продуктовых сетей и строительных магазинов в Канаде. Медленный, но верный рост. Я бы купил бы акции Snowflake.