Ivan Begtin
8.07K subscribers
1.5K photos
3 videos
100 files
4.25K links
I write about Open Data, Data Engineering, Government, Privacy and Data Preservation and other gov and tech stuff
Telegram @ibegtin
Facebook - https://facebook.com/ibegtin
Secure contacts ivan@begtin.tech

Contact @NMBabina for ads proposals
Download Telegram
В рубрике больших наборов данных, подборка наборов открытых данных о сетевой инфраструктуре.

- Статистика работы сервисов Tor в проекте CollectTor [1]. В общей сложности там несколько десятков гигабайт машиночитаемых данных по инфраструктуре Tor собранные с 2005 года.

- Real world networking datasets [2] - большая коллекция ссылок на наборы данных о трафике и сетевой инфраструктуре

- Project Sonar [3] наборы открытых данных результатов сканирования серверов DNS, IP адресов, подсетей и иной сетевой инфраструктуры. Десятки терабайт данных

- Censys Datasets [4] - наборы данных коммерческого проекта Censys с результатами сканирования всех адресов IPv4 (доступно только с разрешения владельца данных)

- Greynoise [5] - "серый шум", сервис отслеживания тех кто регулярно сканирует интернет и ведущий лог/базу данных всей сканирующей активности. Бесплатный ограниченный некоммерческий доступ и очень дорогой, $25k, коммерческий.

- CRAWDAD [6] архивы беспроводных данных в колледже Dartmouth. Включают данные собранные мобильными приложниями, Wifi, Bluetooth, Zigbee и др.

- RadioML [7] - датасеты естественных и симулированных записей данных радиочастот от DeepSig

Ссылки:
[1] https://metrics.torproject.org/collector.html
[2] https://gist.github.com/stefanbschneider/96602bb3c8b256b90058d59f337a0e59
[3] https://opendata.rapid7.com/
[4] https://search.censys.io/data
[5] https://www.greynoise.io
[6] https://crawdad.org/all-bydate.html

#opendata #networks #traffic #radio #datasets
Онлайн сервис поиска по данным/сайтам Algolia позволял указывать регион при создании проекта. Например, я создавал там текстовый поисковый индекс в российском регионе. Теперь они рекомендуют перенести его в регион Германия потому что есть риски потери связи с российским сегментом.

Вот такие дела. Какой-то Цифровой обитаемый остров получается.

#sanctions #networks #networkneutrality #russia