Microsoft представил семь собственных AI-моделей

Microsoft представил семь собственных AI-моделей

MAI-Thinking-1 — флагманская рассуждающая модель Microsoft. Средний размер. В слепом сравнении достигает паритета с Sonnet 4.6. Обучена с нуля, без дистилляции чужих моделей.

MAI-Code-1-Flash — быстрая модель для разработчиков. Глубоко интегрирована в GitHub Copilot и VS Code. Сравнима с Haiku, но дешевле.

MAI-Image-2.5 (стандартная и Flash-версия) — генерация и редактирование изображений. На Арене она нравилась людям больше, чем Nano Banana Pro.

MAI Transcribe-1.5 — Microsoft пишет, что это лучшая в мире модель транскрибации. В пять раз быстрее конкурирующих моделей и имеет встроенную поддержку терминологии, специфичной для конкретной области, на 43 языках.

MAI-Voice-2 (стандартная и Flash-версия) — модель для генерации речи на 15 языках. Клонирует голос по короткому образцу.

Часть моделей уже можно попробовать на https://playground.microsoft.ai/chat

https://microsoft.ai/news/building-a-hillclimbing-machine-launching-seven-new-mai-models/

Авторский взгляд на новости технологий Реклама: https://docs.google.com/presentation/d/1glQMXYyKAYpzNP8VXzM4gl2YkEgLjkeD_Fxvzbu5QUE/edit РКН: https://clck.ru/3FPkup Личный аккаунт: @gornal О рекламе: @Vzuhcha ВП нет

💬Discussion (7)

Aloha@kardamon3
Уже смешно). В бесплатном Codex моментальный войс ту текст почти, задержка пару секунд.
Сейчас проверил эту прогу, и там перевод очень отстаёт по качеству от Того же кодекс или чат ГПТ
Megan Gallegos@MeganGallevoFTi
интересно, как семь моделей помогут предпринимателям, и как мы сохраняем человеческий подход в работе с собой и клиентами
Fun Craft@funsett
Для веб-приложений вообще Web Speech API достаточно в большинстве случаев 😉
Сергей Муравьев@Serg2000Mr
Что такое бесплатный Codex ? )
Natalia@St_e2e4
С войс ту текст который 🤫
Maxim ⁽²ʰ⁴ᵘ⁾@j2h4u
Транскрибация быстрее чем AssemblyAI/Elevenlabs, но медленнее чем Whisper large на Groq

Качество хорошее -- отлично берёт айтишный жаргон (мы смержили фичу которая файнтюнит backpressure, катим в прод) и речь на смеси английского и русского

И этот момент в ней сильно лучше, чем в gigaam-v3, которая как будто бы SOTA для русского
atrant.sg@atrant
такое мне нужно в handy ) и не только. надеюсь будет скоро доступно на попробовать
Join discussion on TelegramComments are synced from Telegram

Связанные темы

Читать далее