Можно голосом

Можно голосом

В Windows есть встроенный распознаватель голосового ввода. И в принципе, я мог бы этот пост диктовать, а не писать. Но я так не делаю, и 99% пользователей так не делает – потому что сделан этот распознаватель для галочки и на технологиях далекого прошлого, 2021 или даже 2018 года.

Российский #стартапдня NovaVoice – распознаватель, каким он должен быть. Он игнорирует запинки и автоматически исправляет оговорки. После некоторой настройки он понимает и исполняет команды типа “удали последнее предложение”. Он на ходу преобразует речь в профессиональные письма в почте или форматирует текст в Notion.

Так по крайней мере на лендинге написано. Мне продукт настолько не зашел. Пост я все равно пишу, а не диктую – но я вообще голосовой ввод не признаю, было бы реально странно если б NovaVoice меня бы переубедил. Но вам понравиться он может.

Инвестиций стартап пока не привлекал, и вообще сегодня у него что-то типа дня рождения – он выходит на Product Hunt. Давайте ему там поможем, победы наших всегда приятны! Тем более, основатель ещё и член клуба ShareAI, ему тем более помочь приятно.

https://www.producthunt.com/products/novavoice
https://novavoice.app/

#ai #технология #shareai #насвои #producthunt
Стартап дня. Александр Горный.
Стартап дня. Александр Горный.

682 публикаций на visbl.me

Авторский канал о стартапах и интернет-бизнесе. Реклама на этом канале: https://docs.google.com/presentation/d/1BFSEj7FEQZpB4K83iBXo1yqIoPnwJaVGpsyKDHKSX0s/edit РКН: https://clck.ru/3FPm3j Личный аккаунт: @gornal Реклама: @Vzuhcha ВП нет

💬Discussion (19)

Danila@dgurachevskii
В это категории есть whisper flow
Работает просто шикарно
Rustam Khasanov@rustam_khasanov
В этой категории есть много других решений помимо Виспера.

у нас шире функционал, и есть вера, что впереди будет mass adoption, и емкость рынка позволит принять еще не один продукт помимо Виспера.
Alexander Buyanov@abuyanov
Их настолько много (включая бесплатные и open source решения), что куда уж больше.
Nikolas@faraich
Это ваше приложение? Поздравляю, что зафичерили вас! Интересно, сколько трафика получили?

Попробовал. Не стал на ПХ писать)) Работает отвратительно, очень медленно, в шумах путается. Вы аудио отправляете на сервер для расшифровки?
Rustam Khasanov@rustam_khasanov
Спасибо. Не только зафичерили, но и первое место взяли.

Работает хорошо, просто вчера были определенные проблемы, связанные с хотфиксами и торопливостью перед запуском.

Если правда интересно и есть боль, связанная с подобными решениями, готов лично заонбордить, показать, как работаем, показать юзкейсы.
Nikolas@faraich
Супер 🔥 Первое место - это круто!

Предложение отличное, давайте свяжемся. У меня, как у СТО, сразу мысли есть насчет диктовок))
atrant.sg@atrant
мне на windows зашла бесплатная handy с моделью gigaam
atrant.sg@atrant
она работает оффлайн
Sasha@broken_flowerz
Поздравляю с запуском!

Какая модель используется, если не секрет? Как работает с русским языком?
Rustam Khasanov@rustam_khasanov
Спасибо!

С русским языком работает отлично. Модели разные в зависимости от сценариев. У нас не только транскрибирование диктовки, но и форматирование текстов и исполнение действий в приложениях, и голосовой ассистент (спрашивать голосом на любом экране, вместо того чтобы гуглить)
Рустам Нафиков@mfisgood
Почему то ни разу при транскрипции не получилось получить в результате русский язык. Всегда возвращается английский. Да и текст по факту не транскрибируется, а пережевывается LLM, так что может сильно меняться структура и детали.

Это можно как то настрйоками поправить?
Rustam Khasanov@rustam_khasanov
Рустам, привет, ответил тебе в личке. Это чуть косяк релиза, мы это поправили.

В личке я тебе подробно объяснил, что было не так и как сделать так.

У тебя автоматически включилась наша функция предобработки диктовки в зависимости от активного приложения.
Sergey A@gsk3b
Я для такого же пользуюсь MacWhisper - даже дефолтная предложенная модель вычищает речь, убирая повторы и мычание. Можно еще добавить пост-процессинг, но мне не понравилась увеличенная задержка.

Команды Курсору/IDE теперь только надиктовываю - так быстрее, да и поорать на него можно :D
Join discussion on TelegramComments are synced from Telegram

Связанные темы

Читать далее