Свежий ИИ инструмент от Google под названием Google AI Edge Eloquent позволяет расшифровывать речь в текст и сразу этот текст улучшать. Из особенностей, он работает в режиме local-first, вся расшифровка происходит на устройстве пользователя с помощью одной из двух локально установленных LLM, это Gemma 4 2b или Gemma 4 12b. Вторая существенно требовательнее к объёмам хранения и оперативной памяти, но дает существенно лучший результат в моих тестах версии для MacOS. Что необычно - это что продукт выпускается вначале не для экосистемы Google, а для продуктов Apple, и то что он локальный, отвязанный от многочисленных сервисов Google. Впрочем у Google есть похожие продукты вроде близкого по смыслу Google AI Edge Gallery чем-то напоминающим LM Studio для тех кому не нужно сложностей.
В любом случае этот продукт интересный, попробовать его для расшифровки голоса в текст стоит. И он бесплатен, что тоже немаловажно.
#google #ai #voice #voicetotext
В любом случае этот продукт интересный, попробовать его для расшифровки голоса в текст стоит. И он бесплатен, что тоже немаловажно.
#google #ai #voice #voicetotext
❤🔥7👍3✍1