Какие ключевые метрики в ИИ показывают рост в 2026 году?

e/acc1 min read44 comments
Какие ключевые метрики в ИИ показывают рост в 2026 году?
Собственно, вот одна из ключевых метрик в ИИ сегодня снова пробила потолок. Больше чем х2 прирост меньше чем за месяц. Сингулярность изнутри, она такая.

💬Discussion (44)

Виктор А@viar30000
без логарифма ничего не понять
vaamartyni@vaamartyni
Согласен, без логарифмической шкалы сложнее оценить темп ускорения, но сам факт что горизонт задач удвоился за короткий период говорит о явно нелинейной динамике 😀
AntKeeper@AntKeeper
Им уже пора на 90% переключаться. 50 это как-то ни о чём.
Anonymous
В папирусе Антропика у опус 4.6 задачи с 99.9 перцентилем выполнения это около 45 минут.
Anonymous
Будет 24ч до конца года
Виктор А@viar30000
а так ли важна скорость вычислений если глубина проникновения куда важнее?
Евгений Пак@Qweasd123tg
Люди не готовы ждать месяц
AntKeeper@AntKeeper
Это круто
Valera
Ну пока что там можно внизу графика на 80% переключить. Вот такие результаты:
chief of autism@femboymilker
дак это все равно экспонента блять
Андрей@andytty
А не скинете ссылочку, где потыкать можно?
Андрей@andytty
Спасибо большое
AntKeeper@AntKeeper
Вот такое пишут на Хабре "На 80%-м горизонте, где требуется стабильная надежность, Opus 4.6 лидирует с более скромным отрывом — 1 час 3 минуты против 55 минут у GPT-5.2 (high)."
AntKeeper@AntKeeper
MIT Technology Review недавно назвал график METR "самым неправильно понимаемым графиком в ИИ" — 14,5 часов означают не "Opus работал почти день без перерыва", а "модель решает задачи, на которые у человека-эксперта ушло бы 14,5 часов".
Даниил@DennyFromMoscow
Ну хорошо, допустим я обычный работяга - программист, сижу на ипотеке, как-то живу. А сейчас эта сингулярность снесет 90% вещей, за которые обычно платят деньги и что тогда? Как-то к этому готовиться или принять неизбежное и переквалифицироваться в плиточника/сантехника?
chief of autism@femboymilker
иди в человеческие продажи, переговоры, или в физику, вообще в комплексные всякие системы физические с кучей разной вариативности
Даниил@DennyFromMoscow
А зачем нужны продажи/переговоры если один ии агент может это сделать с другим агентом? Тем более таких как я безработных миллионы попрутся туда, чего там ловить. Столько продукта не производят, чтобы столько продажников нужно было
Space@Sola47473
Ну значит тебя рыночек порешал. Не все попадут в счастливое будущее. В сингулярность
Никита@netkitkat
Только кто будет платить плиточнику/сантехнику если денег ни у кого нет
Даниил@DennyFromMoscow
Ага, вот тоже не понятно
chief of autism@femboymilker
весь мир на айтишниках сошелся?
Никита@netkitkat
так заменят же всех белых воротничков и большую часть сервисных работ, я подозреваю что это больше половины населения
chief of autism@femboymilker
не всех
diego@diegoDLmaster
Пока непонятно. Но обычным работягой - программистом ты уже зарабатывать на хлеб, скорее всего, не сможешь🤷‍♂

Возможно, если модели будут достаточно мощными, а доступ к ним будет достаточно демократичным, то есть шанс у "гаражной экономики инноваций" - когда в гаражах будут разрабатывать новые виды материалов, лекарства от неизлечимых болезней и искусственные органы.

Кто это будет делать? Ты, в принципе, наверное, мог бы🤷‍♂
Jercos@Jercos
Я как раз владелец гаража с уникальным оборудованием, в которое вложены миллионы.
Сейчас всё в коробочках лежит, а распаковывать - холодно и лень.

Гараж, даже мой, ничего не может сделать против лабораторий корпораций. Просто на порядки разные уровни.

В том числе разные уровни по возможности вычислений и предсказаний моделированием.

Не зря, когда говорят стартап, то подразумевают айти.
В айти был самый легкий вход, самый простой способ масштабирования.

Эта халява кончилась. А другой такой нет, потому что в других областях халява кончилась десятилетия назад.

Я уже выше писал, что айтишники начала 21 века были как кулаки начала 20, с ноутбуками вместо коров.

Поэтому в айтишной среде и было распространено мнение, что свободный рыночек решает.
Больше такого не будет.
diego@diegoDLmaster
Кажется, у тебя просто закончились хорошие идеи)
Jercos@Jercos
Давно.
Я каждый день вайбкодю.

А идеи в железе нереально реализовать в одиночку
Join discussion on TelegramComments are synced from Telegram

Read next