In 2026 is de vraag niet meer of je AI kunt self-hosten, maar welke stack je kiest. De tools zijn volwassen geworden. De drempel is laag genoeg dat iedereen die een tutorial kan volgen een privé AI-stack kan draaien op hardware die ze al bezitten.
Waarom Self-Hosting
Elke vraag die je stelt aan een cloud AI-service wordt opgeslagen op servers die je niet beheert, onderworpen aan databeleid dat je waarschijnlijk nooit hebt gelezen, en mogelijk gebruikt voor modeltraining.
Self-hosting keert dit model om. Je conversatiegeschiedenis leeft op jouw hardware, in een SQLite-bestand dat je kunt back-uppen, inspecteren of verwijderen wanneer je wilt.
De Stack
De aanbevolen privé AI-stack in 2026 bestaat uit drie lagen.
De eerste laag is de runtime: ZeroClaw. Het verbindt je chatkanalen met je AI-provider, beheert geheugen en verwerkt berichten. 4 MB RAM, single binary, nul CVEs.
De tweede laag is de inferentie: Ollama. Het voert grote taalmodellen lokaal uit op je eigen hardware. Ondersteunt llama3.1, mistral, gemma2 en tientallen andere modellen. Geen API-kosten, geen data die je machine verlaat.
De derde laag is de hardware: wat je al hebt. Een oude laptop, een Raspberry Pi 4 of 5, een Mac Mini die is vervangen door een nieuwer model. ZeroClaw heeft zo weinig resources nodig dat bijna elke hardware werkt.
Hybride aanpak
De praktische sweet spot voor de meeste mensen is een hybride aanpak: lokaal model voor eenvoudige vragen, cloud model voor complexe. ZeroClaw verwerkt de routing automatisch op basis van een complexiteitsdrempel die je configureert.
In de praktijk wordt 80-90% van typische persoonlijke queries lokaal afgehandeld voor nul kosten. De queries die echt frontier-niveau redenering vereisen vallen terug op de cloud.
Kosten
Volledig lokaal: nul lopende kosten na de initiële hardware-investering. Hybride: 5-15 euro per maand in API-kosten voor typisch gebruik. Cloud-only: 20 euro per maand per persoon voor premium diensten.
De tools om dit te laten werken bestaan al een tijdje, maar vereisten aanzienlijke technische expertise. ZeroClaw heeft de drempel verlaagd tot het punt waarop iedereen die een tutorial kan volgen een privé AI-stack kan draaien.