engineering deep-dive

Hoe het hybride geheugen van ZeroClaw werkt: SQLite Vector + FTS5 uitgelegd

ZeroClaws.io

ZeroClaws.io

@zeroclaws

February 25, 2026

9 min lezen

Hoe het hybride geheugen van ZeroClaw werkt: SQLite Vector + FTS5 uitgelegd

Als je kijkt naar hoe de meeste geheugenarchitecturen voor AI-agents in productie zijn opgezet, vind je een bekend patroon: een vectordatabase zoals Pinecone voor semantisch zoeken, Elasticsearch voor trefwoordzoeken, Redis voor caching. Vier services om te deployen, vier facturen aan het einde van de maand.

De complexiteit wordt behandeld als onvermijdelijk. Maar dat is het niet. Het is het gevolg van het gebruik van tools voor gedistribueerde systemen om een probleem op te lossen dat ze niet vereist.

Het geheugen van ZeroClaw is een enkel SQLite-bestand. Dit is waarom dat geen compromis is.

De infrastructuurval

Vectordatabases zijn genuinement krachtige tools voor RAG-systemen op miljoenen documenten. Maar AI-agentgeheugen is een ander probleem. De meeste agents slaan duizenden herinneringen op, niet miljoenen. Een jaar dagelijkse gesprekken kan 50.000 conversatieteurns produceren. Dat is geen big data-probleem.

De kosten van deze mismatch zijn reëel. Pinecone begint bij 70 euro per maand voor productiegebruik. Elke geheugenopzoeking is een netwerk-round-trip van typisch 10-50 ms die latentie toevoegt aan elke respons.

Waarom SQLite de juiste basis is

SQLite is de meest gedistribueerde database ter wereld. Het is in continue ontwikkeling sinds 2000 en wordt in productie gebruikt door bedrijven die miljarden transacties verwerken.

ZeroClaw gebruikt twee SQLite-extensies samen om een geheugensysteem te bouwen dat beide dingen aankan: exacte herinnering en semantisch begrip.

FTS5: full-text zoeken

FTS5 verwerkt tokenisatie, stemming en ranking automatisch. Het is snel: submilliseconde voor typische agentgeheugengroottes.

Vectorzoeken: semantische gelijkenis

ZeroClaw slaat embedding-vectoren op naast de tekst en voert cosinus-gelijkeniszoeken direct in SQLite uit. Dit verwerkt gevallen waar trefwoordzoeken tekortschiet.

Hybride zoeken

ZeroClaw voert beide zoekopdrachten parallel uit en combineert de resultaten met Reciprocal Rank Fusion. Documenten die goed scoren in beide zoekopdrachten komen bovenaan.

Prestatiecijfers

Op een Raspberry Pi Zero 2 W duurt het ophalen van geheugen minder dan 3 ms in totaal. Ter vergelijking: een netwerk-round-trip naar Pinecone of Weaviate duurt typisch 10-50 ms.

Je geheugen is slechts een bestand

De volledige conversatiegeschiedenis leeft in een enkel bestand genaamd memory.db. Back-up is cp memory.db memory.db.bak. Verplaatsen naar een nieuwe machine is het bestand kopiëren. Inspecteren is het openen met elke SQLite-client.

Nul infrastructuur, nul kosten, nul complexiteit en prestaties die externe databases niet kunnen evenaren omdat er geen netwerk tussenin zit.

Blijf op de Hoogte

Ontvang updates over nieuwe releases, integraties en Rust-powered agent-infrastructuur. Geen spam, altijd opzegbaar.