Можно голосом

Можно голосом

В Windows есть встроенный распознаватель голосового ввода. И в принципе, я мог бы этот пост диктовать, а не писать. Но я так не делаю, и 99% пользователей так не делает – потому что сделан этот распознаватель для галочки и на технологиях далекого прошлого, 2021 или даже 2018 года.

Российский #стартапдня NovaVoice – распознаватель, каким он должен быть. Он игнорирует запинки и автоматически исправляет оговорки. После некоторой настройки он понимает и исполняет команды типа “удали последнее предложение”. Он на ходу преобразует речь в профессиональные письма в почте или форматирует текст в Notion.

Так по крайней мере на лендинге написано. Мне продукт настолько не зашел. Пост я все равно пишу, а не диктую – но я вообще голосовой ввод не признаю, было бы реально странно если б NovaVoice меня бы переубедил. Но вам понравиться он может.

Инвестиций стартап пока не привлекал, и вообще сегодня у него что-то типа дня рождения – он выходит на Product Hunt. Давайте ему там поможем, победы наших всегда приятны! Тем более, основатель ещё и член клуба ShareAI, ему тем более помочь приятно.

https://www.producthunt.com/products/novavoice
https://novavoice.app/

#ai #технология #shareai #насвои #producthunt
Стартап дня. Александр Горный.
Стартап дня. Александр Горный.

606 публикаций на visbl.me

Авторский канал о стартапах и интернет-бизнесе. Реклама на этом канале: https://docs.google.com/presentation/d/1BFSEj7FEQZpB4K83iBXo1yqIoPnwJaVGpsyKDHKSX0s/edit РКН: https://clck.ru/3FPm3j Личный аккаунт: @gornal Реклама: @Vzuhcha ВП нет

💬Discussion (9)

Danila@dgurachevskii
В это категории есть whisper flow
Работает просто шикарно
Rustam Khasanov@rustam_khasanov
В этой категории есть много других решений помимо Виспера.

у нас шире функционал, и есть вера, что впереди будет mass adoption, и емкость рынка позволит принять еще не один продукт помимо Виспера.
Alexander Buyanov@abuyanov
Их настолько много (включая бесплатные и open source решения), что куда уж больше.
atrant.sg@atrant
мне на windows зашла бесплатная handy с моделью gigaam
atrant.sg@atrant
она работает оффлайн
Sasha@broken_flowerz
Поздравляю с запуском!

Какая модель используется, если не секрет? Как работает с русским языком?
Rustam Khasanov@rustam_khasanov
Спасибо!

С русским языком работает отлично. Модели разные в зависимости от сценариев. У нас не только транскрибирование диктовки, но и форматирование текстов и исполнение действий в приложениях, и голосовой ассистент (спрашивать голосом на любом экране, вместо того чтобы гуглить)
Sergey A@gsk3b
Я для такого же пользуюсь MacWhisper - даже дефолтная предложенная модель вычищает речь, убирая повторы и мычание. Можно еще добавить пост-процессинг, но мне не понравилась увеличенная задержка.

Команды Курсору/IDE теперь только надиктовываю - так быстрее, да и поорать на него можно :D
Join discussion on TelegramComments are synced from Telegram

Связанные темы

Читать далее