Есть паттерн, который я заметил почти в каждой команде, впервые создающей ИИ-агентов. Они тратят первые несколько недель, одержимо следя за стоимостью токенов. Затем приходит облачный счёт.
Он выше, чем ожидалось. Иногда значительно выше. И когда они разбираются, стоимость токенов именно там, где они предсказывали. Сюрприз — всё остальное.
Пять уровней затрат на ИИ-агента
Первый уровень — стоимость токенов: то, что вы платите провайдеру ИИ за запрос. Это тот, о котором все говорят, который оптимизируют первым, и во многих случаях наименьшая часть вашего общего счёта.
Второй уровень — стоимость вычислений: ОЗУ, CPU и серверная инфраструктура, на которой размещена ваша среда выполнения агента. Среда выполнения, простаивающая при 1,2 ГБ ОЗУ, не просто стоит дороже в хостинге — она ограничивает каждое архитектурное решение, которое вы принимаете.
Третий уровень — стоимость холодного старта. Время холодного старта — это задержка между получением сообщения и готовностью агента его обработать. Когда эта задержка составляет 8 секунд, некоторые пользователи решат, что бот сломан, и уйдут.
Четвёртый уровень — операционные затраты: инженерные часы на мониторинг, отладку, обновления зависимостей и реагирование на инциденты.
Пятый уровень — альтернативные издержки: то, что вы не можете построить, потому что ваша инфраструктура уже перегружена.
Налог на ОЗУ: что реально стоит 1,2 ГБ
OpenClaw простаивает примерно при 1,2 ГБ ОЗУ. VPS с 1 ГБ ОЗУ — самый дешёвый уровень у большинства провайдеров, обычно -6 в месяц — вообще не может запустить OpenClaw. VPS с 2 ГБ ОЗУ ( -12/месяц) технически может запустить OpenClaw, но вы используете 60% доступной памяти в режиме ожидания. VPS с 4 ГБ ОЗУ ( -24/месяц) — это место, где OpenClaw реально работает комфортно.
ZeroClaw, построенный на Rust, простаивает примерно при 4 МБ ОЗУ. Тот же VPS за /месяц с 1 ГБ ОЗУ запускает ZeroClaw с 99,6% ОЗУ, всё ещё доступным для вашей реальной рабочей нагрузки.
Холодные старты: стоимость, которая не появляется в счетах
Для OpenClaw штраф холодного старта составляет примерно 8 секунд. Для пользователя, только что отправившего сообщение и ожидающего ответа, 8 секунд — это вечность. В исследованиях пользовательского опыта время ответа выше 3 секунд вызывает измеримое увеличение отказов.
ZeroClaw запускается менее чем за 10 миллисекунд. Разница между рабочим процессом, который кажется мгновенным, и тем, который кажется сломанным, часто просто время холодного старта среды выполнения.
Налог на зависимости: 1200 пакетов и что они реально стоят
node_modules OpenClaw содержит более 1200 пакетов. Каждый из них — реальная, текущая стоимость. С точки зрения безопасности, каждый пакет — потенциальная уязвимость. Атаки на цепочку поставок ClawHub начала 2026 года эксплуатировали именно это.
ZeroClaw поставляется как единый статически скомпонованный бинарный файл. Нет менеджера пакетов. Нет lockfile. Нет разрешения зависимостей. Развёртывание — это копирование одного файла размером 12 МБ на ваш сервер.
Подсчёт цифр
| Категория затрат | OpenClaw | ZeroClaw | |--------------|----------|----------| | Хостинг (VPS) | 88/год (нужно 4 ГБ) | /год (достаточно 1 ГБ) | | Стоимость токенов | 80/год | 80/год | | Инженерное обслуживание | ~/год | ~(/год | | Влияние холодного старта | ~ /год | Незначительно | | Итого | ~868/год | ~90/год |
Стоимость токенов идентична. Годовой разрыв в '8 — это полностью инфраструктурные и операционные накладные расходы.
Архитектурные последствия
Среда выполнения, которой нужно 4 ГБ ОЗУ, не может работать на Raspberry Pi. Не может работать на VPS за /месяц. Не может быть развёрнута на периферийных узлах рядом с вашими пользователями. Каждое из этих ограничений — продуктовое решение, принятое за вас требованиями к ресурсам вашей среды выполнения.
Среда выполнения, использующая 4 МБ ОЗУ и запускающаяся за 10 миллисекунд, может работать где угодно. Архитектура становится выбором, а не ограничением.