Для тех кто интересуется тем как в Евросоюзе внедряется Digital Services Act (Закон о цифровых платформах), стоит посмотреть на DSA Transparency Database [1] специальный портал в виде открытой базы данных регистрации действий платформ по модерации контента. По каждому факту модерации есть зарегистрированное событие которое можно посмотреть и найти [2] можно скачать всю базу событий целиком [3]. А база там немалая, более 3.5 миллиардов записей из которых 2.9 миллиардов записей отрепорчено Google Shopping.
С одной стороны - это важный шаг ЕС в регулировании платформ и усилении давления на Bigtech.
А с другой стороны, там в целом то непонятно как провести связь между пользователями которые жалуются на Bigtech и этими зарегистрированными фактами модерации поскольку никакой дополнительной идентифицирующей информации кроме указания даты и времени, языка и UID'а события там практически нет. Миллиарды почти идентичных сообщений, по ним можно замерять их интенсивность, языка, экономическую зону, и другие стат. показатели, но никаких качественных данных не извлечь. В общем-то много вопросов есть и будет.
Тем не менее данных там много, 67GB CSV файл в последнем дампе, так что можно попробовать найти что-то интересное.
К примеру, России, там совершенно точно нет, а вот модерация контента на русском языке есть. Более 556 тысяч фактов модерации. И даже для армянского языка, 33 факта модерации.
Ссылки:
[1] https://transparency.dsa.ec.europa.eu
[2] https://transparency.dsa.ec.europa.eu/statement
[3] https://transparency.dsa.ec.europa.eu/data-download
#opendata #transparency #private
С одной стороны - это важный шаг ЕС в регулировании платформ и усилении давления на Bigtech.
А с другой стороны, там в целом то непонятно как провести связь между пользователями которые жалуются на Bigtech и этими зарегистрированными фактами модерации поскольку никакой дополнительной идентифицирующей информации кроме указания даты и времени, языка и UID'а события там практически нет. Миллиарды почти идентичных сообщений, по ним можно замерять их интенсивность, языка, экономическую зону, и другие стат. показатели, но никаких качественных данных не извлечь. В общем-то много вопросов есть и будет.
Тем не менее данных там много, 67GB CSV файл в последнем дампе, так что можно попробовать найти что-то интересное.
К примеру, России, там совершенно точно нет, а вот модерация контента на русском языке есть. Более 556 тысяч фактов модерации. И даже для армянского языка, 33 факта модерации.
Ссылки:
[1] https://transparency.dsa.ec.europa.eu
[2] https://transparency.dsa.ec.europa.eu/statement
[3] https://transparency.dsa.ec.europa.eu/data-download
#opendata #transparency #private