Ivan Begtin
9.11K subscribers
2.47K photos
4 videos
113 files
5.21K links
I write about Open Data, Data Engineering, Government, Privacy, Digital Preservation and etc.

CTO&Founder of Dateno https://dateno.io

Telegram @ibegtin
Facebook - https://facebook.com/ibegtin
Email ivan@begtin.tech

Ads/promotion agent: @k0shk
Download Telegram
Небольшой шаг для человечества, но важный для тех кто думает о приватности. Cloudflare анонсировали [1] шлюз к IPFS [2], децентрализованной p2p файловой системе на основе которой могут существовать самые разные сервисы. Самый очевидный из них - это distributed web, распределённая неблокируемая сеть сайтов.

Cloudflare уже внедляют distributed web gateway [3] и себя как CDN для сайтов использующих IPFS.

Шаг важный потому что Cloudflare - это один из двух крупнейших сервисов интернет-инфраструктуры, по эффекту на Интернет они где-то рядом с Amazon'ом. Если (или когда) IPFS или ZeroNet появятся во базовых браузерах и на мобильных телефонах то вся деятельность того же Роскомнадзора в России и других ведомств в других странах по блокировки по доменам быстро поломается. Но радоваться рано, все ограничения в реализации блокировок основаны на невозможности контролировать конечные устройства пользователей. А это значит что попытки контролировать конечные устройства будут.

Ссылки:
[1] https://blog.cloudflare.com/distributed-web-gateway/
[2] https://ru.wikipedia.org/wiki/IPFS
[3] https://www.cloudflare.com/distributed-web-gateway/

#privacy #ipfs #cloudflare
В блоге Cloudflare о том как Perplexity неэтично индексируют сайты закрытые robots.txt и подменяют User-Agent, с позитивной новостью что Cloudflare от этого защищают. Мне трудно понять тут отличия Perplexity от остальных глобальных ИИ продуктов/агентов которые предпочтут тяжбы, но не этичное поведение. Как пользователю Perplexity мне удобно когда я могу получить нужны ответ оперативно, как создателю контентных проектов мне совсем не хочется потерять всю их аудиторию из-за ИИ агентов.

Проблема серьёзнее чем кажется нарастанием противостояния, пока непонятно есть ли у неё простое устраивающее всех решение. Зато я вижу как многие ресурсы огораживаются от любых ИИ агентов и иных ботов скрейпящих их материалы. Чаще всего наблюдаю это на китайских сайтах. Например, не так давно я попытался несколько разных LLM построить аналитику по объёмам и масштабам публикации датасетов в Китае на провинциальных порталах. Самый лучший результат дал анализ 3-х из более чем 50 сайтов. Проблема тут не в неспособности ИИ агентов интерпретировать результаты, а в целенаправленных блокировках по геолокации, User-Agent и любым признакам обращения от лица бота.

#ai #scraping #bots #perplexity #cloudflare
👍8