Ivan Begtin
8.07K subscribers
1.47K photos
3 videos
99 files
4.21K links
I write about Open Data, Data Engineering, Government, Privacy and Data Preservation and other gov and tech stuff
Telegram @ibegtin
Facebook - https://facebook.com/ibegtin
Secure contacts ivan@begtin.tech

Contact @NMBabina for ads proposals
Download Telegram
На днях прошла новость о том что проект Имхонет, состоящий из рекомендаций фильмов, книг и многого другогоб закрылся [1]. Закрылся он внезапно, без предупреждения, без возможности скачать хотя бы собственные опубликованные там материалы, теперь там просто заглушка вместо главной страницы [2].

Это довольно удручающая новость показывающая еще и уровень информационной культуры у создателей проектов основанных на материалах пользователей. В любой момент создали могут решить проект закрыть и невозможно получить собственные материалы.

Для сравнения, корпорация "Microsoft" 31 марта этого года объявила [3] о закрытии проекта хостинга открытого кода Codeplex и переносе собственных проектов на Github.
При этом они пообещали что:
• все материалы останутся на сайте в режиме для чтения с октября 2017;
• полностью сайт будет закрыт в декабре 2017;
• для переноса данных написано подробное руководство.

Итого, они предупредили за чуть менее чем 9 месяцев и достаточно время сохранить собственный код и не только. Например, команда Archiveteam уже успела отследить этот факт и отслеживает статус проекта [4]

Или, например, сервис закладов Ffound.com объявил о закрытии с 8 мая [5 ], хотя бы за 2 недели. Сейчас его также копируют участники ArchiveTeam.

Самые неприятные истории, конечно, похожи на историю с Имхонет. Например, после того как Яндекс продал хостинг Narod.ru компании uCOZ [6 ] этот хостинг сильно испортился и теперь на какой сайт на narod.ru не зайти, я вижу всегда длительную блокирующую просмотр материалов автоматическую видеорекламу.

Это вполне может быть признаком того что uCOZ нацелились на быструю монетизацию и судьба сайтов на бесплатном хостинге - это вопрос открытый.

Ссылки:
[1] https://roem.ru/29-04-2017/248903/imhonet-zakrylsya/
[2] http://imhonet.ru/
[3] https://blogs.msdn.microsoft.com/bharry/2017/03/31/shutting-down-CodePlex/
[4] http://www.archiveteam.org/index.php?title=CodePlex
[5] http://ffffound.com/
[6] https://yandex.ru/blog/company/57916

#digitalpreservation #archiving
Кто-то отдыхает в праздники, а я публикую заметку о том как проходит архивация сайтов на примере Общественной палаты - https://medium.com/@ibegtin/oprf-archival-209d9b09af3

#digitatalpresevation #opengovernment #archiving
Для всех кто интересуется о том как идет архивация сайтов в рамках проекта "Национальный цифровой архив"
http://archive.infoculture.ru и доступны ли архивы.

Последние новости проекта:
- все последние архивы собраны в виде JSON http://cdn1.sdlabs.ru/public/_packages/webcollect2017.json
- интерфейс выгрузки и поиск по всему собранному тут - https://hubofdata.ru/group/webarchive
- выкачаны следующие ресурсы:
— все сайты Агентства ипотечного жилищного кредитования в поддоменах ahml.ru
— сайты банков с отозванными лицензиями: банк Югра
— копия сайта Активный гражданин gorod.mos.ru
— все сайты относящиеся к органам власти финансового блока Правительства: Минфин России, Федеральное казначейство, ФТС России, Росалкогольрегулирование, ФНС России (за исключением fias.nalog.ru)
— множество малых ресурсов
- теперь по умолчанию на hubofdata.ru проставляются ссылки на копии архивов в ресурсе Backblaze.

Напомню что проект создан для сохранения всего того ценного цифрового наследия которое находится под угрозой исчезновения по политическим, экономическим, культурным или любым иным причинам.

Значительная часть архива состоит из копий сайтов органов власти и проектов созданных на госсредства поскольку они часто исчезают сразу после завершения их финансирования или закрытия. Сейчас копии делаются полными слепками, с сохранением всех аудио, видео файлов, изображений и документов, что отличает наш архив от "Интернет архива" который сохраняет только наиболее популярные веб страницы.

Помочь проекту можно:
- финансово, пожертвованием на http://archive.infoculture.ru
- материально, пожертвовав диски для создания физических копий архива
- содержательно, предлагая сайты которые находятся под угрозой уничтожения - пишите мне о них тут в Telegram @ibegtin или на почту ibegtin@infoculture.ru
- поиском финансирования для организации беспрерывного сохранения информации. Мы сможем развернуть Heritrix и делать копии сайтов в непрерывном режиме.


#opendata #archiving
CNews пишут о том что Yahoo закрывают Yahoo Groups [1] и что скоро материалы оттуда исчезнут. А я дополню что группа активистов из ArchiveTeam уже начала подготовку к архивации этого контента описывают это у себя в Wiki [2], а также архивы групп за 2015 год хранятся в веб архиве [3]. Всё это значит что эти данные не исчезнут и не пропадут и во многом по той причине что крупнейшие зарубежные сервисы соблюдают культуру закрытия проектов предупреждая об этом за несколько месяцев.

Для сравнения российский проект ИмхоНет [4] был закрыт в один день или когда МВД переходило на единый сайт mvd.ru [5] и в один день закрыло все сайты УВД по субъектам федерации не перенеся данные на новый сайт.

P.S.
Как же я жалею что у меня мало времени заниматься нашим проектом Национального цифрового архива (ruarxive.org) где есть попытки сохранить хоть что-то.

Ссылки:
[1] https://www.cnews.ru/news/top/2019-10-17_yahoo_ubet_ves_kontent_na
[2] https://www.archiveteam.org/index.php?title=Yahoo!_Groups
[3] https://archive.org/details/yahoo_groups
[4] https://ru.wikipedia.org/wiki/Имхонет
[5] https://ria.ru/20110221/336855197.html

#archives #archiving #yahoo