Ivan Begtin
9.11K subscribers
2.47K photos
4 videos
113 files
5.21K links
I write about Open Data, Data Engineering, Government, Privacy, Digital Preservation and etc.

CTO&Founder of Dateno https://dateno.io

Telegram @ibegtin
Facebook - https://facebook.com/ibegtin
Email ivan@begtin.tech

Ads/promotion agent: @k0shk
Download Telegram
Несколько интересных текстов и терминов на английском языке по управлению данными:
- Data Mesh, новый термин в публикации [1] Zhamak Dehghani и продолжение дискуссии вокруг этой темы в блоге Chris Riccomini [2]. Если кратко, то Data Mesh это такая замена озеру данных когда всё связано, но не все вместе. Вместо одной команды работает множество команд и тд. Для многих идея звучит неудачно и больше похожа не оправдание корпоративных провалов (мы не смогли построить озеро данных, зато теперь у нас data mesh). Чтобы Вы не думали, чтение полезное
- Metadata lake очередной пост команды продукта Atlan на сей раз про озёра метаданных [3]. Повторение привычных истин что документированные данные ценнее данных самих по себе и что озеро метаданных - это систематизация и управляемость данных.
- Data Cascades in Machine Learning [4] в блоге Google AI о последствиях накопления "технического долга" при машинном обучении. Полезный термин, важные наблюдения.
- Ethics and governance of artificial intelligence for health [5] свежее руководство ВОЗ по этическому применению и управлению искусственным интеллектом в целях здоровья


Ссылки:
[1] https://martinfowler.com/articles/data-mesh-principles.html
[2] https://cnr.sh/essays/what-the-heck-data-mesh
[3] https://towardsdatascience.com/the-rise-of-the-metadata-lake-1e95127594de
[4] https://ai.googleblog.com/2021/06/data-cascades-in-machine-learning.html
[5] https://www.who.int/publications/i/item/9789240029200

#data #datacatalogs #datamesh #datalake
Полезное чтение про данные, технологии и не только:
- DuckLake standard 0.2 обновлённая спецификация озера данных на базе DuckDB, любопытно, всё жду обзоров сравнения нескольких технологий построения подобных озер. Они больше для корпоративной аналитики чем для работы со статическими данными, но тем не менее.
- What CoPilot Won’t Teach You About Python (Part 1) полезные трюки для тех кто программирует на Python и хочет знать новые лайфхаки. Заголовок, конечно, так себе ибо LLM многое из этого умеют
- Finding a job as a product engineer про культуру работы продуктовых инженеров и компании которые продвигают и реализуют такой подход. Если кратко то это совмещение ролей product owner'а и developer'а. Идея мне нравится, вот только найти таких людей непросто
- Notate.so ИИ помощник для рассуждений над любым текстом в сети, работает как расширение для браузера и интегрирован с Obsidian. Идея любопытная, в идеале бы local first версию интегрированную с локальной версией Obisidian

#python #readings #daata #datalake #products #notes
71🤔1