Если вы посмотрите на то, как архитектурированы большинство производственных систем памяти ИИ-агентов, вы найдёте знакомый паттерн: векторная база данных вроде Pinecone или Weaviate для семантического поиска, Elasticsearch для поиска по ключевым словам, Redis для кэширования горячих воспоминаний и Postgres для структурированных данных. Четыре сервиса для развёртывания, четыре сервиса для мониторинга, четыре счёта в конце месяца.
Сложность воспринимается как неизбежная — цена, которую вы платите за способную память. Но это не неизбежно. Это следствие использования инструментов распределённых систем для решения проблемы, которая их не требует.
Память ZeroClaw — это единый файл SQLite. Вот почему это не компромисс.
Ловушка инфраструктуры
Векторные базы данных — действительно мощные инструменты. Для RAG-системы над миллионами документов они правильный выбор. Но память ИИ-агента — другая проблема.
Большинство агентов хранят тысячи воспоминаний, а не миллионы. Год ежедневных разговоров может произвести 50 000 ходов разговора. Это не проблема больших данных — это проблема малых данных, которую лечат как проблему больших данных.
Стоимость этого несоответствия реальна. Pinecone начинается от $70/месяц для производственного использования. Каждый поиск памяти — это сетевой round-trip, обычно 10-50 мс, добавляющий задержку к каждому ответу.
Почему SQLite — правильная основа
SQLite — самая развёрнутая база данных в мире. Она работает на каждом смартфоне, каждом браузере, каждом встроенном устройстве. Она в непрерывной разработке с 2000 года и используется в производстве компаниями, обрабатывающими миллиарды транзакций.
ZeroClaw использует два расширения SQLite вместе для построения системы памяти, обрабатывающей обе вещи, которые нужны агентам: точное воспроизведение и семантическое понимание.
FTS5: полнотекстовый поиск
Расширение FTS5 SQLite обеспечивает быстрый поиск по ключевым словам с ранжированием BM25:
FTS5 обрабатывает токенизацию, стемминг и ранжирование автоматически. Он быстрый — субмиллисекундный для типичных размеров памяти агента.
Векторный поиск: семантическое сходство
ZeroClaw хранит векторы эмбеддингов рядом с текстом и выполняет поиск косинусного сходства непосредственно в SQLite. Это обрабатывает случаи, когда поиск по ключевым словам не справляется: поиск воспоминаний, концептуально связанных, даже когда они не разделяют точных слов.
Гибридный поиск: правильное получение обоих
Ни один подход в одиночку не достаточен. Поиск по ключевым словам пропускает семантические связи. Векторный поиск пропускает точные совпадения.
ZeroClaw запускает оба поиска параллельно и объединяет результаты с использованием Reciprocal Rank Fusion:
Документы, высоко ранжированные в обоих поисках, всплывают наверх. Результат — поиск памяти, правильно обрабатывающий как «что именно я сказал о X», так и «что я сказал, связанное с X».
Цифры производительности
На Raspberry Pi Zero 2 W поиск памяти занимает менее 3 мс в общей сложности: примерно 0,3 мс для поиска FTS5, 2 мс для векторного поиска и 0,1 мс для объединения результатов. Для сравнения, сетевой round-trip к Pinecone или Weaviate обычно занимает 10-50 мс.
Ваша память — просто файл
Практическое следствие памяти на основе SQLite: вся история разговоров, весь изученный контекст вашего агента, всё, что он знает о вас — живёт в одном файле под названием .
Резервное копирование — это . Перемещение на новую машину — это копирование файла. Проверка — это открытие его любым клиентом SQLite. Нет инструментов экспорта, нет скриптов миграции, нет API-вызовов.
Нулевая инфраструктура, нулевая стоимость, нулевая сложность и производительность, которую внешние базы данных не могут сравнить, потому что нет сети на пути. Для памяти ИИ-агента это не компромисс — это правильный дизайн.