Forwarded from Сергей Марков: машинное обучение, искусство и шитпостинг
А мы сделали SOTA-решение для коррекции орфографии для русского языка
SAGE (Spelling correction via Augmentation and Generative distribution Emulation) — это проект, целью которого является изучение и решение проблемы коррекции правописания. На текущий момент мы представляем:
Семейство открытых предобученных генеративных моделей для коррекции правописания на русском и на английском языках:
ruM2M100-1.2B;
ruM2M100-418M;
FredT5-large-spell;
T5-large-spell (для английского языка);
Хаб с вручную размеченными параллельными датасетами для задачи коррекции правописания с естественными (сделанными человеком) ошибками, покрывающие в общей сложности около десяти текстовых источников (далее по тексту мы также можем называть их «доменами»);
Библиотеку SAGE с открытым исходным кодом, в которой реализованы два метода аугментации текстовых данных на основе намеренного искажения правописания, доступ к нашим открытым моделям и датасетам, а также механизм валидации моделей спеллчека;
Наше лучшее решение на основе модели ruM2M100-1.2B доступно в виде Cloud AI Service , оно опережает по качеству открытые решения (Yandex.Speller, HunSpell, JamSpell) и проприетарные (на момент проведения экспериментов) модели OpenAI (gpt-3.5-turbo-0301, gpt-4-0314, text-davinci-003).
Статья на Хабре: https://habr.com/ru/companies/sberdevices/articles/763932/
SAGE (Spelling correction via Augmentation and Generative distribution Emulation) — это проект, целью которого является изучение и решение проблемы коррекции правописания. На текущий момент мы представляем:
Семейство открытых предобученных генеративных моделей для коррекции правописания на русском и на английском языках:
ruM2M100-1.2B;
ruM2M100-418M;
FredT5-large-spell;
T5-large-spell (для английского языка);
Хаб с вручную размеченными параллельными датасетами для задачи коррекции правописания с естественными (сделанными человеком) ошибками, покрывающие в общей сложности около десяти текстовых источников (далее по тексту мы также можем называть их «доменами»);
Библиотеку SAGE с открытым исходным кодом, в которой реализованы два метода аугментации текстовых данных на основе намеренного искажения правописания, доступ к нашим открытым моделям и датасетам, а также механизм валидации моделей спеллчека;
Наше лучшее решение на основе модели ruM2M100-1.2B доступно в виде Cloud AI Service , оно опережает по качеству открытые решения (Yandex.Speller, HunSpell, JamSpell) и проприетарные (на момент проведения экспериментов) модели OpenAI (gpt-3.5-turbo-0301, gpt-4-0314, text-davinci-003).
Статья на Хабре: https://habr.com/ru/companies/sberdevices/articles/763932/
🔥7👍5
Новый гравитационный анализ Марса позволяет лучше понять вероятно существовавший на нём древний океан
https://22century.ru/space/116802
https://22century.ru/space/116802
XX2 век
Новый гравитационный анализ Марса позволяет лучше понять вероятно существовавший на нём древний океан
Впервые применённый новаторский метод анализа гравитационной силы Марса поддерживает идею о том, что на планете когда-то существовал обширный северный океан. При этом метод более детально определяет масштаб явления, которое учёные именуют северным марсианским…
👍4🔥1
Forwarded from GigaChat
This media is not supported in your browser
VIEW IN TELEGRAM
🪄 В Kandinsky 2.2 появилась возможность создавать анимацию — пока только в тестовом режиме, совсем скоро мы расширим доступ к боту!
Чтобы сгенерировать ролик в режиме анимации, нужно описать текстом то, что хочется увидеть. Бот предложит на выбор 16 вариантов анимации, а после этого нейросеть сгенерирует её.
В основе подхода синтеза используется модель Kandinsky 2.2. Расширение её возможностей позволит пользователям перемещать объекты, приближать, отдалять их и оживлять статику.
Этого удалось достичь благодаря функциям inpainting/outpainting (дорисовка части изображения внутри и за его пределами) и image2image (перерисовка изображения по текстовому описанию), уже реализованным в базовой модели.
Отметим, что доступ тестовый — как и сама модель. Поэтому, если вы уже получили свой доступ (или как только получите), мы будем рады обратной связи — публично поделиться отзывом можно будет в ветке «Создаём AI-ролики c Kandinsky» нашего комьюнити.
Следите за новостями и комьюнити — скоро мы увеличим количество тестовых доступов.
Чтобы сгенерировать ролик в режиме анимации, нужно описать текстом то, что хочется увидеть. Бот предложит на выбор 16 вариантов анимации, а после этого нейросеть сгенерирует её.
В основе подхода синтеза используется модель Kandinsky 2.2. Расширение её возможностей позволит пользователям перемещать объекты, приближать, отдалять их и оживлять статику.
Этого удалось достичь благодаря функциям inpainting/outpainting (дорисовка части изображения внутри и за его пределами) и image2image (перерисовка изображения по текстовому описанию), уже реализованным в базовой модели.
Отметим, что доступ тестовый — как и сама модель. Поэтому, если вы уже получили свой доступ (или как только получите), мы будем рады обратной связи — публично поделиться отзывом можно будет в ветке «Создаём AI-ролики c Kandinsky» нашего комьюнити.
Следите за новостями и комьюнити — скоро мы увеличим количество тестовых доступов.
🔥3👍1👎1
Для защиты генома эти клетки разрушают собственную ДНК
https://22century.ru/popular-science-publications/dna-self-destruct
https://22century.ru/popular-science-publications/dna-self-destruct
XX2 век
Для защиты генома эти клетки разрушают собственную ДНК
Мари Делатр (Marie Delattre) изучала половое размножение микроскопических червей и заметила нечто неожиданное. Находящийся под микроскопом эмбрион нематоды Mesorhabditis belari делился как полагается: одна клетка—две—четыре. Но внутри некоторых клеток Мари…
👍10
Forwarded from Kali Novskaya (Tatiana Shavrina)
🌸Стрим🌸
Сегодня в 20:00 по мск — стрим на Рабкоре!
Будем говорить про то, как нейросети коммодифицируются, у кого на самом деле права на картинки, тексты для обучения, что делать и кто виноват.
Приходите!
https://www.youtube.com/live/hvGpTiC_oNw?si=ZIKK4wqfTJ6xt0a7
Сегодня в 20:00 по мск — стрим на Рабкоре!
Будем говорить про то, как нейросети коммодифицируются, у кого на самом деле права на картинки, тексты для обучения, что делать и кто виноват.
Приходите!
https://www.youtube.com/live/hvGpTiC_oNw?si=ZIKK4wqfTJ6xt0a7
YouTube
Искусственный интеллект победит человека? // Кали Новская
На сегодняшнем стриме поговорим о том, как и какой ценой искусственный интеллект решительно изменит привычный нам мир. Правда ли, что нейронки отнимут работу у художников? Может ли художник защитить свой труд, запретив ИИ учиться на его работах? Как разрешить…
❤5👍1
Установлен источник крупнейшего из зафиксированных марсотрясений
https://22century.ru/chemistry-physics-matter/116930
https://22century.ru/chemistry-physics-matter/116930
XX2 век
Установлен источник крупнейшего из зафиксированных марсотрясений
Международная команда учёных, возглавляемая Оксфордским университетом, объявила о результатах беспрецедентных международных поисков источника крупнейшего из зафиксированных на Марсе сейсмических событий. Согласно проведённому исследованию, это событие было…
🔥5
Даже синтетические формы жизни с крохотным геномом способны эволюционировать
https://22century.ru/popular-science-publications/sint-life-evolution
https://22century.ru/popular-science-publications/sint-life-evolution
XX2 век
Даже синтетические формы жизни с крохотным геномом способны эволюционировать
Семь лет назад исследователи показали, что можно разобрать клетку «до основания» и создать форму жизни с очень маленьким (но достаточным для жизни и размножения в лабораторных условиях) геномом. Такая «минимальная» клетка закономерно теряла часть своей устойчивости…
❤11👍4
20 фактов о землетрясениях и тектонике — часть 1
https://22century.ru/popular-science-publications/earthquakes-tectonics-facts-part1
https://22century.ru/popular-science-publications/earthquakes-tectonics-facts-part1
XX2 век
20 фактов о землетрясениях и тектонике — часть 1
Представляем подборку фактов о землетрясениях и их изучении — от Древнего Китая до наших дней. 1. Сколько бывает землетрясений? Ежегодно на Земле фиксируется 500 тысяч землетрясений. Большинство из них можно обнаружить только при помощи сейсмометров. Количество…
👍8
20 фактов о землетрясениях и тектонике — часть 2
https://22century.ru/popular-science-publications/earthquakes-tectonics-facts-part2
https://22century.ru/popular-science-publications/earthquakes-tectonics-facts-part2
👍2❤1
Андрогенная алопеция: причины возникновения и лечение
https://22century.ru/popular-science-publications/androgennaya-alopeciya
https://22century.ru/popular-science-publications/androgennaya-alopeciya
XX2 век
Андрогенная алопеция: причины возникновения и лечение
Подавляющее число мужчин по всему миру сталкиваются с этой проблемой. Шагая по оживлённой улице в солнечный летний день, вы с большой вероятностью увидите хотя бы одного мужчину с залысиной. Однако, несмотря на высокую распространённость среди мужчин, андрогенная…
👍10
Северное сияние от Полярного круга до субтропиков — второй раз в этом году
https://22century.ru/space/117065
https://22century.ru/space/117065
👍3
Учёные из Университета Дьюка создали мозговой имплант, который позволяет общаться посредством одних только мыслей
https://22century.ru/medicine-and-health/117132
https://22century.ru/medicine-and-health/117132
XX2 век
Учёные из Университета Дьюка создали мозговой имплант, который позволяет общаться посредством одних только мыслей
Никакой телепатии: протез декодирует сигналы речевого центра головного мозга, чтобы предсказать, какой звук пытается произнести человек. Речевой протез, разработанный совместной командой нейробиологов, нейрохирургов и инженеров Университета Дьюка, может преобразовывать…
🔥8👍5
Forwarded from Kali Novskaya (Tatiana Shavrina)
Стрим в 20:00 по мск на Рабкоре!
Увольнение Альтмана, этика ИИ при капитализме и что теперь дальше
https://www.youtube.com/live/QpRkjB_d9Ho?si=O7NQZBdlAA-57JGH
Увольнение Альтмана, этика ИИ при капитализме и что теперь дальше
https://www.youtube.com/live/QpRkjB_d9Ho?si=O7NQZBdlAA-57JGH
YouTube
OpenAI все? Искусственный интеллект при капитализме, этика ИИ || Кали Новская
Сегодня Кали Новская расскажет о том, какие ценности вкладывают корпорации в искусственный интеллект и как регулируется этика нейросетей в условиях капитализма. Какие существуют запреты и ограничения у ИИ? Какие риски открывают новые горизонты в их применении?…
👍4👎1
Космическая станция «Психея» установила лазерный канал связи с Землёй
https://22century.ru/space/117171
https://22century.ru/space/117171
👍12
Всё-таки нашли: через 60 лет удалось переоткрыть чуднóе, яйцекладущее млекопитающее
https://22century.ru/biology-and-biotechnology/117194
https://22century.ru/biology-and-biotechnology/117194
XX2 век
Всё-таки нашли: через 60 лет удалось переоткрыть чуднóе, яйцекладущее млекопитающее
В одном из самых неизученных регионов мира научная экспедиция переоткрыла культовое яйцекладущее млекопитающее — проехидну (длинноклювую ехидну) Аттенборо, названную в честь знаменитого телеведущего сэра Дэвида Аттенборо (David Attenborough). Это произошло…
❤14
❤4
20 фактов об инстинктах — часть 1
https://22century.ru/popular-science-publications/20-faktov-ob-instinktah
https://22century.ru/popular-science-publications/20-faktov-ob-instinktah
❤7👍1
20 фактов об инстинктах — часть 2
https://22century.ru/popular-science-publications/20-faktov-ob-instinktah-2
https://22century.ru/popular-science-publications/20-faktov-ob-instinktah-2
❤6👍1