Se guardi come sono architettati la maggior parte dei sistemi di memoria per agenti AI in produzione, troverai un pattern familiare: un database vettoriale come Pinecone per la ricerca semantica, Elasticsearch per la ricerca per parole chiave, Redis per il caching. Quattro servizi da deployare, quattro fatture a fine mese.
La complessita e trattata come inevitabile. Ma non lo e. E la conseguenza dell'uso di strumenti per sistemi distribuiti per risolvere un problema che non li richiede.
La memoria di ZeroClaw e un singolo file SQLite. Ecco perche non e un compromesso.
La trappola dell'infrastruttura
I database vettoriali sono strumenti genuinamente potenti per sistemi RAG su milioni di documenti. Ma la memoria degli agenti AI e un problema diverso. La maggior parte degli agenti memorizza migliaia di ricordi, non milioni. Un anno di conversazioni quotidiane potrebbe produrre 50.000 turni di conversazione. Non e un problema di big data.
Il costo di questo disallineamento e reale. Pinecone parte da 0/mese per uso in produzione. Ogni ricerca in memoria e un round-trip di rete — tipicamente 10-50 ms — che aggiunge latenza a ogni risposta.
Perche SQLite e la base giusta
SQLite e il database piu distribuito al mondo. E in sviluppo continuo dal 2000 e viene usato in produzione da aziende che gestiscono miliardi di transazioni.
ZeroClaw usa due estensioni SQLite insieme per costruire un sistema di memoria che gestisce entrambe le cose di cui gli agenti hanno bisogno: richiamo esatto e comprensione semantica.
FTS5: ricerca full-text
FTS5 gestisce tokenizzazione, stemming e ranking automaticamente. E veloce — submillisecondo per le dimensioni tipiche della memoria degli agenti.
Ricerca vettoriale: similarita semantica
ZeroClaw memorizza vettori di embedding accanto al testo ed esegue la ricerca per similarita del coseno direttamente in SQLite. Questo gestisce i casi in cui la ricerca per parole chiave non basta.
Ricerca ibrida
ZeroClaw esegue entrambe le ricerche in parallelo e unisce i risultati usando Reciprocal Rank Fusion:
I documenti che si classificano bene in entrambe le ricerche emergono in cima.
I numeri delle prestazioni
Su un Raspberry Pi Zero 2 W, il recupero della memoria richiede meno di 3 ms in totale. Per confronto, un round-trip di rete a Pinecone o Weaviate richiede tipicamente 10-50 ms.
La tua memoria e solo un file
L'intera cronologia delle conversazioni, tutto il contesto appreso dal tuo agente — vive in un singolo file chiamato memory.db.
Il backup e cp memory.db memory.db.bak. Spostarlo su una nuova macchina e copiare il file. Ispezionarlo e aprirlo con qualsiasi client SQLite.
Zero infrastruttura, zero costo, zero complessita e prestazioni che i database esterni non possono eguagliare perche non c'e rete in mezzo.