Инжиниринг Данных
23.4K subscribers
1.92K photos
57 videos
191 files
3.16K links
Делюсь новостями из мира аналитики и карьерными советами.

15 лет в Аналитике и Инжиниринге Данных, 10 лет в MAANG

🛠️ dataengineer.ru | 🏄‍♂️ Surfalytics.com

№5017813306

Реклама:
https://almond-rule-130.notion.site/1199f595f76a8030ba1be1e607c9a8ce
Download Telegram
Сравнение классических аналитических MPP хранилищ данных. Даже цену за ТБ указали. Опубликовано в 2015 году! Сколько всего изменилось. В это время я первый раз попробовал Redshift и использовал его для маркетингового аналитики (с маркетингом тоже в первый раз работал, модель атрибуции, мобильные приложения и много прочего)
Безопасность данных это очень важно. Особенно, если вы используете данные персональные данные personally identifiable information (PII). По умолчания в Amazon Redshift нет встроенной функциональности для маскировки данных. В этой статье описано решение для и использование стороннего продукта для безопасности персональных данных personally identifiable information (PII) https://aws.amazon.com/blogs/big-data/protect-and-audit-pii-data-in-amazon-redshift-with-datasunrise-security/ Есть и другой вариант использовать hash и python UDF функции, чтобы обезличить ваши данные.
Azure сегодня презентовала новый продукт - Azure Synapse Analytics. В общем они решили очевидную проблему, объединили озеро данных Azure Data Lake и хранилище данных Azure SQL Data Warehouse. Все для нашего удобства. https://news.microsoft.com/innovation-stories/ignite-2019-azure-synapse
В Японии Data Science нет так популярно, как Arificial Intelligence
Бизнес Amazon, это без учета дочерних предприятий, таких как IMDB, Abebooks. Очень интересно узнать как делать с данными и аналитикой обстоят в Solar и Wind Farm
Сегодня выступал в школе, у них была ярмарка вакансий и я рассказывал про работу в Amazon и Alexa, взял даже сына (ему 7 лет), он показывал как он взаимодойствует с Alexa. 2 счастливчиков выиграли новые устройства, которых еще нет в Канаде. Сын пропустил школу, но явно узнал много нового и теперь сидит рисуют Alexa разные устройства, я его кстати везде беру на все мероприятия, это такое у нас детский MBA:)
В Штатах говорят про сильный спад Hadoop: Цитата CEO Snowflake "Slootman: "I've never seen something crater as fast as Hadoop in all my years in the business. We see whole companies like Cloudera, MapR just falling off a damn cliff. We haven't seen that in technology, it's usually a gradual decline. This is rapid decline."

И правда, Snowflake в себе совмещает озеро данных и хранилище. В Azure есть DataBricks (Spark) вместо HDInsight (Hadoop), в AWS есть Athena, Spectrum, Glue (with Spark), которое можно использовать вместо Elastic Map Reduce (Hadoop), и так же и в Google Cloud Platform. До этого я писал, что компания Datameer, тоже уходит от Hadoop как основы своего продукта.

Поэтому хорошо знать, что такое Hadoop и основные принципы, но лучше детально изучать Spark.
А говорят, что китайцы все копируют))
Всем привет, Валерий (@HardKorr) ведет в Москве несколько митапов, в том числе Moscow School of Business Analysis. Так как скоро я буду в Москве, хотелось собрать митап по аналитике и облакам, где я хотел выступить, заодно про Канаду рассказать и про эмиграцию, работу в Амазоне и тп. И только Валерий согласился все организовать, за что ему большое спасибо!

Так что, если 20 Ноября будете свободны, приходите! Обязательная регистрация.
Learning Pandas.pdf
1.9 MB
Работаете с данными? Одна из самых популярных библиотек в Python это Pandas. В приложении ebook про Pandas. Так же это поможет освоить PySpark.
Linkedin это отличный инструмент маркетинга и самопиара. Как говорится, встречают по одежке, вом вам примеры, сегодня попались:

Enabling Large Enterprises to Unlock Innovation through Cloud Computing
Partnering To Unlock The Power Of Your Data
I help leaders and teams define and accelerate their journey from now to next.
Empowering HR professionals to transform their business through better people decisions
Driving and managing apocalyptic transformation
"Talent wins games, but teamwork and intelligence win championships." Michael Jordan
We help unlock the potential of your business, through financial insights, strategy
Helping Customers Unlock their Data Assets
Driving sustainable, value based infrastructure planning and decision making.
Helping my clients Select, Deploy and Manage Technology
Helping enterprise organizations to increase collaboration
Enabling Data Driven Organizations
Solving the issues of modern day analytics
Helping businesses become data-driven.
Working with the Enterprise to address data challenges that yesterday’s technology cannot solve.
Enabling every organization to be data driven...let's talk!
Creating more profitable streams of revenue through modern day analytics

Выбирайте любой! Уверен есть и русские аналоги, и еще много английский вариантов, мне последний понравился.
И конечно стоимость Teradata очень сильно упала. Я застал время, когда акции были нам максимуме, но так и не купил их. Из акций у меня только был/есть Amazon, и он вырос с 600 до 2000 и потом упал до 1600. Много коллег покупают сток продуктов Tableau, Microstrategy. Коллега, скупал сток продуктовых сетей и строительных магазинов в Канаде. Медленный, но верный рост. Я бы купил бы акции Snowflake.
Рейтинг облачных хранилищ данных.