Голос для десктопа

Голос для десктопа

В плане отношения к голосовому интерфейсу люди делятся грубо пополам. Кто-то любит отправлять голосовухи, кто-то не любит. Кого больше – не знаю, тех и других много. А вот компьютерные интерфейсы в подавляющем большинстве заточены только под любителей клавиатуры. В Word, Excel, браузер, 1C или внутреннюю поделку вашей корпорации голосом не ничего не введешь, все всегда пальцами стучат.

Или используют канадский #стартапдня Superwhisper — десктопное приложение для Mac и Windows. Оно висит в фоновом режиме, а пользователь в любой момент из другой программы нажимает горячую клавишу, наговаривает что угодно, и текст оказывается в текущем поле ввода – голосовое управление возникает сразу везде.

Superwhisper разрабатывает только интерфейс, нейросети он использует чужие. На некоторых Mac стартап даже к серверу не обращается, мощности хватает, чтобы локальную модель развернуть. На моем Windows включился облачный режим. Первые пару расшифровок он сделал действительно идеально, а дальше начал автоматически переводить мои слова на английский, и как от этого избавиться я не понял. Но переводил хорошо :-)

Зарабатывает стартап на платной подписке с расширенными возможностями и продвигает её, кажется, очень мягко. Мне он даже предложить её не успел. Не считая проблемы с переводом, всё время теста Superwhisper отработал идеально, ни в какие ограничения упереться я не успел, да и на лендинге слово “unlimited” даже в бесплатном тарифе красуется.

https://superwhisper.com/

#канада #насвои #ai #продуктивность

💬Discussion (15)

Aleksei Khriachkov@xryachkoff
Пользуюсь именно им
Очень круто, но жду когда начнут думать, чтобы экономика сходилась и будут более агрессивны)
Bletusmanov@Bletusmanov
Если зайти в настройки любого телефона/компа года с примерно 2015, то там есть эта невероятная фича.
В остальном забавно, что продается то, что нынче любой может сделать примерно за день
Rustam Khasanov@rustam_khasanov
в настройках любого телефона / компа качество транскрибации будет несравнимо плохим.

+ подобные продукты делают упор на предформатирование текста, учет контекста в зависимости от окна, и другие фичи, сильно усиливающие обычную диктовку.

мы делаем конкурента описанного стартапа - https://novavoice.app
constantin bcn 🇪🇸@constantinews
Не представляю как вводить тест в Клод или дипсик без Whisper Flow.

Жаль у него пока почему-то нет аналогов на айфоне? 🤷‍♂️
Alexander Teterkin@teterkin
Есть: Spokenly
Причем наш человек пишет
Я уже пообщаться успел
constantin bcn 🇪🇸@constantinews
Я Spokenly на макбуке пользую в ситуациях когда Flow вместо транскрибации начинает сам выполнять промпт 😁
Хорошее приложение.


На телефоне пока Flow выглядит гораздо удобнее + синхронизация в облако с компом + сниппеты голосом

Сниппеты Flow позволяют например девушку пригласить на свидание в приложениях где запрещено копировать и вставлять текст 👍
Рустам Айкаев@AIRust
Win H в Винде. Нормально распознает.
Anonymous
А еще можно в настройках Macos, в разделе Keyboard, включить Dictation, можно поставить тоже на любую кнопку и двойное нажатие - БЕСПЛАТНО, и работает не хуже стартапов)

Но вообще классная идея продавать и так, то что есть в системе бесплатно
Constantine@kotchuprik
вот только whisper сильно лучше будет транскрибировать
Anonymous
можешь продолжать оправдывать трату 12 евро в месяц) я куплю поесть на них
Constantine@kotchuprik
у них в дискорд сервере 9 тыс пользователей

ворвись к ним и раскулачь главного капиталиста. а то они глупыши и платят миску супа в месяц за то, что можно накостылять эпловыми экшнами и опенсорсом
Anonymous
Какими костылями? В настройках галочку поставить и все работает нативно

Или ты имеешь виду они накостыляли, ну главное продавать умеют, это молодцы, можно сколько угодно классно делать, но видно, что главное продажи, такие смогут и кнопку пуск в виндовсе продать
Constantine@kotchuprik
лендинг изучи для начала )
Anonymous
Уже продают кнопку Пуск чтоль?
Join discussion on TelegramComments are synced from Telegram

Read next