Крупнейшие IT-компании намеренно сокращают ответы ИИ до уровня «пещерного человека», чтобы экономить токены

Крупные игроки на рынке ИИ начали сознательно «урезать» ответы нейросетей до примитивных формулировок, чтобы снизить расходы на обработку запросов, пишет 404 Media. Для этого разработали специальный инструмент Caveman, который превращает длинные реплики моделей в короткие, почти телеграммные фразы.

Сервис Caveman подключают к языковым моделям вроде Claude, Codex и Gemini, чтобы те говорили максимально кратко и без вежливых вступлений. Вместо развернутых объяснений и эмоциональных признаний ответы сводятся к грубым, но ёмким. Слоган проекта звучит так: «Пещерный человек беречь твой токен, беречь твои деньги».

Авторы инструмента объясняют, что каждая лишняя фраза — это дополнительные токены, а значит прямые затраты для компаний, которые массово запускают ИИ‑сервисы.

По данным 404 Media, Caveman уже используют разработчики из крупных технологических компаний, а один из старших инженеров добавил поддержку для кода Codex. Такой подход помогает экономить десятки процентов токенов: плагин «выжимает» из моделей только самую необходимую информацию, убирая вежливости, уточнения и лишние детали. В итоге ответы становятся проще и грубее, но заметно дешевле для инфраструктуры.

Koupei Studio / Shutterstock / Fotodom

Крупнейшие IT-компании намеренно сокращают ответы ИИ до уровня «пещерного человека», чтобы экономить токены

Читайте также

«Не просто исполнитель, а арт-директор своей работы»: почему ИИ никогда не заменит профессию иллюстратора

Тренд «видео с трибуны»: почему все ваши друзья оказались на одном матче и как повторить этот трюк

«Не боюсь позориться и кринжевать»: интервью с блогером, которая озвучивает «Эйфорию» с интонациями «Реальных пацанов»

10 промтов для нейросетей, которые помогут спланировать путешествие

Что не так с ИИ-блогерами, которые вирусятся в соцсетях — и кто за ними стоит