Forwarded from Сумма технологий
Обработка и извлечение данных из таблиц — давняя и актуальная задача в информатике, машинном обучении, обработке документов, интеллектуальных системах.
Алексей Шигаров из РАН создал Regular Table Language (RTL) — язык для извлечения данных из таблиц в Excel, HTML и PDF. Вместе с моделью ITM и библиотекой RegTab он упрощает обработку сложных данных. RegTab уже помогает анализировать экологические данные Байкала. Технология обещает стать стандартом для бизнеса и науки, но пока ограничена структурированными таблицами.
Подробнее — по ссылке
#программирование #данные #математика #ит
Алексей Шигаров из РАН создал Regular Table Language (RTL) — язык для извлечения данных из таблиц в Excel, HTML и PDF. Вместе с моделью ITM и библиотекой RegTab он упрощает обработку сложных данных. RegTab уже помогает анализировать экологические данные Байкала. Технология обещает стать стандартом для бизнеса и науки, но пока ограничена структурированными таблицами.
Подробнее — по ссылке
#программирование #данные #математика #ит
VK
Новая эра обработки табличных данных: Regular Table Language
В мире, где данные правят, таблицы в электронных документах — будь то Excel, веб-страницы или PDF — остаются ключевым источником информации.