Jesli spojrzysz na to, jak zbudowana jest wiekszosc architektur pamieci dla agentow AI w produkcji, znajdziesz znajomy wzorzec: baza danych wektorow jak Pinecone do wyszukiwania semantycznego, Elasticsearch do wyszukiwania slow kluczowych, Redis do cachowania. Cztery uslugi do wdrozenia, cztery rachunki na koniec miesiaca.
Zlozonos jest traktowana jako nieunikniona. Ale tak nie jest. Jest wynikiem uzywania narzedzi dla systemow rozproszonych do rozwiazania problemu, ktory ich nie wymaga.
Pamiec ZeroClaw to pojedynczy plik SQLite. Oto dlaczego to nie jest kompromis.
Pulapka infrastruktury
Bazy danych wektorow sa naprawde poteznym narzedziem dla systemow RAG na milionach dokumentow. Ale pamiec agenta AI to inny problem. Wiekszosc agentow przechowuje tysiace wspomnien, nie miliony. Rok codziennych rozmow moze wygenerowac 50 000 tur konwersacji. To nie jest problem big data.
Koszty tego niedopasowania sa realne. Pinecone zaczyna od 70 euro miesiecznie dla uzytkowania produkcyjnego. Kazde wyszukiwanie pamieci to round-trip sieciowy, typowo 10-50 ms, ktory dodaje opoznienie do kazdej odpowiedzi.
Dlaczego SQLite jest wlasciwa podstawa
SQLite to najbardziej rozpowszechniona baza danych na swiecie. Jest w ciaglym rozwoju od 2000 roku i jest uzywana w produkcji przez firmy przetwarzajace miliardy transakcji.
ZeroClaw uzywa dwoch rozszerzen SQLite razem, aby zbudowac system pamieci obslugujacy obie rzeczy, ktorych agenty potrzebuja: dokladne przypominanie i semantyczne rozumienie.
FTS5: wyszukiwanie pelnotekstowe
FTS5 automatycznie obsluguje tokenizacje, stemming i ranking. Jest szybki: submilisekundowy dla typowych rozmiarow pamieci agenta.
Wyszukiwanie wektorowe: podobienstwo semantyczne
ZeroClaw przechowuje wektory osadzen obok tekstu i wykonuje wyszukiwanie podobienstwa cosinusowego bezposrednio w SQLite. Obsluguje przypadki, gdy wyszukiwanie slow kluczowych nie wystarcza.
Wyszukiwanie hybrydowe
ZeroClaw wykonuje oba wyszukiwania rownolegle i laczy wyniki uzywajac Reciprocal Rank Fusion. Dokumenty, ktore dobrze sie plasuja w obu wyszukiwaniach, pojawiaja sie na gorze.
Liczby wydajnosci
Na Raspberry Pi Zero 2 W pobieranie pamieci trwa lacznie mniej niz 3 ms. Dla porownania, round-trip sieciowy do Pinecone lub Weaviate trwa typowo 10-50 ms.
Twoja pamiec to tylko plik
Cala historia rozmow, caly kontekst nauczony przez twojego agenta, zyje w pojedynczym pliku o nazwie memory.db.
Kopia zapasowa to cp memory.db memory.db.bak. Przeniesienie na nowa maszyne to skopiowanie pliku. Inspekcja to otwarcie go dowolnym klientem SQLite.
Zero infrastruktury, zero kosztow, zero zlozonosci i wydajnosc, ktorej zewnetrzne bazy danych nie moga dorownac, bo nie ma sieci posrodku.