В рубрике интересных наборов данных база стоимости услуг госпиталей в США [1] размещённая на платформе Dolthub. Особенность в том что Dolthub организуют регулярные конкурсы краудсорсингового сбора данных и эта база данных также собирается волонтерами которым за это ещё и существенно платят, нельзя сказать что копейки, общий бюджет на создание такого набора данных - $15 тысяч и в списке лидеров есть те кто заработал уже более $5 тысяч.
Dolthub позиционируют себя как Git для данных и у них, действительно, хороший продукт с интересными возможностями.
Но вот свой потенциал в части организации таких конкурсов они недооценивают.
По моему скромному мнению рано или поздно их купит один из крупных международных big tech холдингов вроде MS, IBM, Oracle, Google, Amazon или кто-то вроде и поставят такие конкурсы на поток совместно с инициативами Data4Good и другими гуманитарными проектами связанными с работой с данными.
Ссылки:
[1] https://www.dolthub.com/repositories/dolthub/hospital-price-transparency-v3
#opendata #dolthub #dataplatforms #datasets
Dolthub позиционируют себя как Git для данных и у них, действительно, хороший продукт с интересными возможностями.
Но вот свой потенциал в части организации таких конкурсов они недооценивают.
По моему скромному мнению рано или поздно их купит один из крупных международных big tech холдингов вроде MS, IBM, Oracle, Google, Amazon или кто-то вроде и поставят такие конкурсы на поток совместно с инициативами Data4Good и другими гуманитарными проектами связанными с работой с данными.
Ссылки:
[1] https://www.dolthub.com/repositories/dolthub/hospital-price-transparency-v3
#opendata #dolthub #dataplatforms #datasets