engineering deep-dive

Как работает гибридная память ZeroClaw: SQLite Vector + FTS5

ZeroClaws.io

ZeroClaws.io

@zeroclaws

February 25, 2026

9 мин. чтения

Как работает гибридная память ZeroClaw: SQLite Vector + FTS5

Если вы посмотрите на то, как архитектурированы большинство производственных систем памяти ИИ-агентов, вы найдёте знакомый паттерн: векторная база данных вроде Pinecone или Weaviate для семантического поиска, Elasticsearch для поиска по ключевым словам, Redis для кэширования горячих воспоминаний и Postgres для структурированных данных. Четыре сервиса для развёртывания, четыре сервиса для мониторинга, четыре счёта в конце месяца.

Сложность воспринимается как неизбежная — цена, которую вы платите за способную память. Но это не неизбежно. Это следствие использования инструментов распределённых систем для решения проблемы, которая их не требует.

Память ZeroClaw — это единый файл SQLite. Вот почему это не компромисс.

Ловушка инфраструктуры

Векторные базы данных — действительно мощные инструменты. Для RAG-системы над миллионами документов они правильный выбор. Но память ИИ-агента — другая проблема.

Большинство агентов хранят тысячи воспоминаний, а не миллионы. Год ежедневных разговоров может произвести 50 000 ходов разговора. Это не проблема больших данных — это проблема малых данных, которую лечат как проблему больших данных.

Стоимость этого несоответствия реальна. Pinecone начинается от $70/месяц для производственного использования. Каждый поиск памяти — это сетевой round-trip, обычно 10-50 мс, добавляющий задержку к каждому ответу.

Почему SQLite — правильная основа

SQLite — самая развёрнутая база данных в мире. Она работает на каждом смартфоне, каждом браузере, каждом встроенном устройстве. Она в непрерывной разработке с 2000 года и используется в производстве компаниями, обрабатывающими миллиарды транзакций.

ZeroClaw использует два расширения SQLite вместе для построения системы памяти, обрабатывающей обе вещи, которые нужны агентам: точное воспроизведение и семантическое понимание.

FTS5: полнотекстовый поиск

Расширение FTS5 SQLite обеспечивает быстрый поиск по ключевым словам с ранжированием BM25:

FTS5 обрабатывает токенизацию, стемминг и ранжирование автоматически. Он быстрый — субмиллисекундный для типичных размеров памяти агента.

Векторный поиск: семантическое сходство

ZeroClaw хранит векторы эмбеддингов рядом с текстом и выполняет поиск косинусного сходства непосредственно в SQLite. Это обрабатывает случаи, когда поиск по ключевым словам не справляется: поиск воспоминаний, концептуально связанных, даже когда они не разделяют точных слов.

Гибридный поиск: правильное получение обоих

Ни один подход в одиночку не достаточен. Поиск по ключевым словам пропускает семантические связи. Векторный поиск пропускает точные совпадения.

ZeroClaw запускает оба поиска параллельно и объединяет результаты с использованием Reciprocal Rank Fusion:

Документы, высоко ранжированные в обоих поисках, всплывают наверх. Результат — поиск памяти, правильно обрабатывающий как «что именно я сказал о X», так и «что я сказал, связанное с X».

Цифры производительности

На Raspberry Pi Zero 2 W поиск памяти занимает менее 3 мс в общей сложности: примерно 0,3 мс для поиска FTS5, 2 мс для векторного поиска и 0,1 мс для объединения результатов. Для сравнения, сетевой round-trip к Pinecone или Weaviate обычно занимает 10-50 мс.

Ваша память — просто файл

Практическое следствие памяти на основе SQLite: вся история разговоров, весь изученный контекст вашего агента, всё, что он знает о вас — живёт в одном файле под названием .

Резервное копирование — это . Перемещение на новую машину — это копирование файла. Проверка — это открытие его любым клиентом SQLite. Нет инструментов экспорта, нет скриптов миграции, нет API-вызовов.

Нулевая инфраструктура, нулевая стоимость, нулевая сложность и производительность, которую внешние базы данных не могут сравнить, потому что нет сети на пути. Для памяти ИИ-агента это не компромисс — это правильный дизайн.

Поделиться в: share code
star Star on GitHub

Будь в курсе

Получай обновления о новых релизах, интеграциях и инфраструктуре AI-агентов на Rust. Без спама, отписка в любой момент.