Крупнейшие IT-компании намеренно сокращают ответы ИИ до уровня «пещерного человека», чтобы экономить токены
Крупные игроки на рынке ИИ начали сознательно «урезать» ответы нейросетей до примитивных формулировок, чтобы снизить расходы на обработку запросов, пишет 404 Media. Для этого разработали специальный инструмент Caveman, который превращает длинные реплики моделей в короткие, почти телеграммные фразы.
Сервис Caveman подключают к языковым моделям вроде Claude, Codex и Gemini, чтобы те говорили максимально кратко и без вежливых вступлений. Вместо развернутых объяснений и эмоциональных признаний ответы сводятся к грубым, но ёмким. Слоган проекта звучит так: «Пещерный человек беречь твой токен, беречь твои деньги».
Авторы инструмента объясняют, что каждая лишняя фраза — это дополнительные токены, а значит прямые затраты для компаний, которые массово запускают ИИ‑сервисы.
По данным 404 Media, Caveman уже используют разработчики из крупных технологических компаний, а один из старших инженеров добавил поддержку для кода Codex. Такой подход помогает экономить десятки процентов токенов: плагин «выжимает» из моделей только самую необходимую информацию, убирая вежливости, уточнения и лишние детали. В итоге ответы становятся проще и грубее, но заметно дешевле для инфраструктуры.
Koupei Studio / Shutterstock / Fotodom