Als je kijkt naar hoe de meeste geheugenarchitecturen voor AI-agents in productie zijn opgezet, vind je een bekend patroon: een vectordatabase zoals Pinecone voor semantisch zoeken, Elasticsearch voor trefwoordzoeken, Redis voor caching. Vier services om te deployen, vier facturen aan het einde van de maand.
De complexiteit wordt behandeld als onvermijdelijk. Maar dat is het niet. Het is het gevolg van het gebruik van tools voor gedistribueerde systemen om een probleem op te lossen dat ze niet vereist.
Het geheugen van ZeroClaw is een enkel SQLite-bestand. Dit is waarom dat geen compromis is.
De infrastructuurval
Vectordatabases zijn genuinement krachtige tools voor RAG-systemen op miljoenen documenten. Maar AI-agentgeheugen is een ander probleem. De meeste agents slaan duizenden herinneringen op, niet miljoenen. Een jaar dagelijkse gesprekken kan 50.000 conversatieteurns produceren. Dat is geen big data-probleem.
De kosten van deze mismatch zijn reëel. Pinecone begint bij 70 euro per maand voor productiegebruik. Elke geheugenopzoeking is een netwerk-round-trip van typisch 10-50 ms die latentie toevoegt aan elke respons.
Waarom SQLite de juiste basis is
SQLite is de meest gedistribueerde database ter wereld. Het is in continue ontwikkeling sinds 2000 en wordt in productie gebruikt door bedrijven die miljarden transacties verwerken.
ZeroClaw gebruikt twee SQLite-extensies samen om een geheugensysteem te bouwen dat beide dingen aankan: exacte herinnering en semantisch begrip.
FTS5: full-text zoeken
FTS5 verwerkt tokenisatie, stemming en ranking automatisch. Het is snel: submilliseconde voor typische agentgeheugengroottes.
Vectorzoeken: semantische gelijkenis
ZeroClaw slaat embedding-vectoren op naast de tekst en voert cosinus-gelijkeniszoeken direct in SQLite uit. Dit verwerkt gevallen waar trefwoordzoeken tekortschiet.
Hybride zoeken
ZeroClaw voert beide zoekopdrachten parallel uit en combineert de resultaten met Reciprocal Rank Fusion. Documenten die goed scoren in beide zoekopdrachten komen bovenaan.
Prestatiecijfers
Op een Raspberry Pi Zero 2 W duurt het ophalen van geheugen minder dan 3 ms in totaal. Ter vergelijking: een netwerk-round-trip naar Pinecone of Weaviate duurt typisch 10-50 ms.
Je geheugen is slechts een bestand
De volledige conversatiegeschiedenis leeft in een enkel bestand genaamd memory.db. Back-up is cp memory.db memory.db.bak. Verplaatsen naar een nieuwe machine is het bestand kopiëren. Inspecteren is het openen met elke SQLite-client.
Nul infrastructuur, nul kosten, nul complexiteit en prestaties die externe databases niet kunnen evenaren omdat er geen netwerk tussenin zit.