Есть момент, который происходит почти с каждой командой, впервые создающей ИИ-агента. Демо работает прекрасно. Агент отвечает на вопросы, использует инструменты, помнит контекст. Затем кто-то спрашивает: «Можем ли мы запустить это в производство?»
Этот вопрос обнажает разрыв, который большинство команд недооценивает. Демо-агенты созданы для однократной работы в контролируемой среде. Производственные агенты должны работать тысячи раз в непредсказуемых условиях без наблюдения.
Ловушка демо
Демо-агенты обычно не имеют состояния. Перезапустите их — ничего не потеряно, потому что ничего не было сохранено. У них нет аутентификации, нет ограничения частоты запросов, нет мониторинга, нет обработки ошибок.
Производство убирает каждое из этих допущений. Пользователи теряют контекст при перезапуске агента. Неавторизованные пользователи находят эндпоинт. Кто-то отправляет тысячу сообщений в минуту. Агент даёт неправильный ответ, и никто не знает почему.
Что реально требует производство
Первое требование — постоянное, надёжное состояние. Производственный агент управляет текущими разговорами, накопленными предпочтениями пользователей, очередями задач и изученным контекстом. Это состояние должно переживать перезапуски и сбои.
ZeroClaw обрабатывает это с SQLite в режиме WAL: ACID-совместимый, однофайловый, переживает отключения питания. Всё состояние агента живёт в одном файле. Резервное копирование — это .
Второе требование — модель безопасности, не основанная на доверии. Производственные агенты обрабатывают реальные учётные данные, обращаются к реальным файловым системам и взаимодействуют с реальными пользователями. Модель безопасности должна быть запрет по умолчанию: каждый инструмент, каждый путь к файлу, каждый сетевой эндпоинт должны быть явно разрешены.
Третье требование — наблюдаемость. Когда агент даёт неправильный ответ в производстве, вам нужна трассировка запросов, отслеживание использования токенов, журналы выполнения инструментов и журналы поиска памяти.
Четвёртое требование — надёжность. Производство означает ожидания доступности 24/7: автоматический перезапуск при сбое, плавная деградация при недоступности провайдера ИИ, повторные попытки подключения с экспоненциальной задержкой.
Пятое требование — контроль затрат. Неконтролируемые ИИ-агенты сжигают токены непредсказуемыми способами. Производство требует бюджетов токенов на пользователя и на канал, ограничения частоты запросов и маршрутизации моделей.
Что большинство фреймворков делают неправильно
Паттерн последователен в фреймворках, не разработанных для производства: они оптимизируют для демо и недоинвестируют во всё остальное. Счастливый путь получает всё внимание. Обработка ошибок — это try-catch, который логирует в консоль. Логика повторных попыток оставлена как упражнение для читателя.
Эффективность ресурсов рассматривается как приятное дополнение, а не как множитель затрат. Фреймворк, использующий 1 ГБ ОЗУ для одного экземпляра агента, не может масштабироваться до многоарендных развёртываний без дорогой инфраструктуры.
Производственная история ZeroClaw
ZeroClaw был разработан для производства с самого начала. Единый бинарный файл означает, что развёртывание — это копирование одного файла размером 12 МБ. 4 МБ ОЗУ означает, что вы можете запустить 50 экземпляров агентов на одном VPS с 1 ГБ ОЗУ. Холодный старт менее 10 мс означает, что перезапуски невидимы для пользователей.
Безопасность памяти Rust устраняет целые классы уязвимостей на этапе компиляции. Модель белого списка с запретом по умолчанию означает, что каждый инструмент, путь к файлу и сетевой эндпоинт должны быть явно разрешены в config.toml.
Производственный чеклист
Для команд, выводящих ИИ-агентов в производство, чеклист касается меньше функций и больше операционной зрелости. Явно определите разрешения инструментов. Установите бюджеты токенов на пользователя и на канал. Настройте мониторинг и оповещения. Настройте автоматические резервные копии базы данных памяти. Намеренно протестируйте сценарии отказов. Задокументируйте возможности и ограничения агента для конечных пользователей.
Разрыв между демо и производством — это операционная зрелость. Фреймворк, который вы выбираете, определяет, сколько этой зрелости встроено, а сколько прикручено снаружи.