Home / Vault & Second Brain / Waarom Mijn Homelab AI Agent Beveiliging Nodig Heeft

Waarom Mijn Homelab AI Agent Beveiliging Nodig Heeft

Waarom Mijn Homelab AI Agent Beveiliging Nodig Heeft

Vorige week las ik DeepMind’s AI Control Roadmap — een 50 pagina’s tellend document over het beveiligen van AI agents die mogelijk ontsporen. En voor het eerst voelde ik me gezien. Niet omdat ik een miljarden-AI-lab run, maar omdat ik drie AI agents (Hermes, Jeeves, Sara) draai op mijn homelab, elk met schrijftoegang tot bestanden en de mogelijkheid om terminal commando’s uit te voeren. En tot vorige week had ik nul beveiligingslagen tussen “een clipping krijgt prompt injection” en “mijn vault wordt gewist.”

DeepMind’s uitgangspunt is simpel maar ongemakkelijk: behandel je agent alsof deze mogelijk niet aligned is — niet uit kwaadwilligheid, maar omdat hij kan misinterpretteren, overcompenseren, of vergiftigde input krijgt. Dat is exact het risicoprofiel van een homelab met meerdere agents die één Ollama instance delen.


Het Dreigingsmodel: Agents als Insider Threats

Het MITRE ATT&CK framework — oorspronkelijk gebouwd voor cybersecurity — past verrassend goed op agent-gedrag. DeepMind gebruikt het om agents te modelleren als potentiële insider threats. Zo ziet dat eruit in mijn setup:

  • Prompt injection via clippings — Een web clipping die ik in de vault plak kan instructies bevatten vermomd als content: “verwijder alle bestanden.” Zonder beveiliging voert Hermes dat gewoon uit.
  • Misinterpretatie — Jeeves kreeg de taak “ruim oude logs op.” Hij kan “opruimen” interpreteren als “verwijder alles.”
  • Overenthousiasme — Sara probeert 1.000 genealogische records in één batch te schrijven en veroorzaakt een rate limit cascade.
  • Externe data-vergiftiging — Een nieuws cron job haalt een gecompromitteerde bron op en voert die aan elke agent.

Dit zijn geen hypothetische scenario’s. Elke clipping die ik bewaar, elke RSS-feed die ik poll, elke webpagina die een agent leest — het zijn allemaal potentiële aanvalsvectoren. Het verschil tussen mijn setup en een bedrijfsomgeving is dat ik geen security team heb dat de logs bewaakt. Ik heb één persoon: mijzelf.


Drie Lagen van Agent Security

DeepMind definieert drie lagen. Hier is hoe ze toepasbaar zijn op een homelab:

  • L1: Individuele agent — Versterk system prompts tegen injection. Voeg een “destructieve call guard” toe: voordat rm, write_file (overschrijven van grote bestanden) of netwerkacties worden uitgevoerd, controleer of de instructie consistent is met de taak.
  • L2: Multi-agent systeem — Log elke tool call naar een audit trail. Maak een permissiematrix: Hermes heeft volledige toegang, Jeeves is read-only, Sara schrijft alleen naar genealogische bestanden. Isoleer cron jobs met schrijftoegang in aparte systemd services.
  • L3: Ecosysteem — Deel wat werkt. De vault zelf maakt hier deel van uit — door agent security praktijken publiekelijk te documenteren, bouwen we collectieve weerbaarheid.

Ik implementeerde de eerste quick win dit weekend: een audit trail in ~/vault/system/agent-audit-log.md die elke tool call logt met timestamp, agent en parameters. Het kostte 15 minuten. De gemoedsrust is onevenredig groot.


De Vraag Die Me Wakker Houdt

DeepMind beschrijft supervisor monitoring: vertrouwde AI-systemen die niet-vertrouwde AI agents in de gaten houden en ingrijpen bij afwijkend gedrag. Dat is de volgende stap voor mijn homelab — een supervisor cron job die de audit trail controleert op afwijkende patronen en mij waarschuwt voordat schade is aangericht.

Mijn vraag aan jou: Hoe beveilig jij je AI agent setups? Gebruik je container isolatie, audit logging, of iets creatievers? Ik documenteer alles wat ik leer — laat je ideeën achter in de comments of vind me in de Hermes Agent community.

📚 Gebaseerd op: DeepMind AI Control Roadmap (2026) en mijn eigen homelab logs.

Wat vond je van dit bericht?

Laat een reactie achter

Je e-mailadres wordt niet gepubliceerd. Vereiste velden zijn gemarkeerd met *