🌍 Digital Nomad · DMS

Automatische Dokumentenverarbeitung

OpenClaw Agent + Paperless-ngx: Wie ich mit KI-Agenten >80% meiner Dokumente automatisch verarbeite – von der E-Mail bis zum archivierten, getaggten Beleg.

Warum automatisierte Dokumentenverarbeitung?

Als Digitalnomade bin ich drei bis vier Wochen am Stück unterwegs – quer durch Europa, im E-Auto, auf Inseln, in Skandinavien. Trotzdem muss ich jederzeit Zugriff auf alle relevanten Dokumente haben: Rechnungen, Kreditkartenabrechnungen, Kontoauszüge, Steuerunterlagen. Kein Papierstapel im Büro, kein hektisches Suchen vor der Steuererklärung.

Die Lösung: Ein vollautomatisierter Workflow aus OpenClaw Agenten, die meine E-Mail-Konten auf PDF-Anhänge scannen, diese klassifizieren und dann an Paperless-ngx übergeben – einem selbstgehosteten DMS, das per OCR alle Dokumente durchsuchbar macht. Das Ganze skaliert auf beliebig viele E-Mail-Konten und läuft seit Monaten störungsfrei.

Wichtiger Hinweis: Da in Paperless-ngx alle Dokumente automatisch einen OCR-Durchlauf durchlaufen, sind sie vollständig Volltext-indiziert und können per Volltext-Funktionalität auch wieder durch einen Agenten – also OpenClaw, Hermes oder jeden anderen – komplett ausgelesen und weiterverarbeitet werden. Dadurch entfällt die Notwendigkeit, Dokumente zusätzlich in ein separates RAG-System (Retrieval-Augmented Generation) abzulegen. Die RAG-Funktionalität ist praktisch direkt in den Workflow integriert.

Der Workflow im Detail

1

📥 E-Mail-Import & Scan

Der OpenClaw Agent prüft in regelmäßigen Abständen alle meine E-Mail-Konten auf den IceWarp-Servern. Jede eingehende E-Mail wird auf PDF-Anhänge untersucht.

2

🔍 KI-gestützte Klassifizierung

Anhand von Schlüsselbegriffen wie Rechnung, Invoice, Lieferschein (etc.) wird der Inhalt kategorisiert. Der Agent entscheidet, ob und wie das Dokument weiterverarbeitet wird.

3

📄 PDF-Extraktion & Transfer

Der Agent hängt das PDF aus der E-Mail heraus, bereitet es auf und überführt es per API-Token direkt in die Paperless-ngx-Instanz (gehostet als Docker-Container bei Hetzner).

4

🏷️ OCR & Auto-Tagging in Paperless

Paperless führt beim Import automatisch eine OCR-Erkennung durch und taggt die Dokumente anhand ihres Inhalts. Eine Hetzner-Rechnung wird automatisch erkannt und mit "Steuerrelevant" getaggt.

5

📂 Archivierung & Ordnerlogik

Verarbeitete E-Mails werden in den Ordner "Moved to Paperless" verschoben – für den Fall, dass ich sie später noch einmal im Postfach finden möchte. Die Original-Dokumente sind trotzdem in Paperless per Volltextsuche jederzeit griffbereit.

6

🔄 Fallback: Manuelle Prüfung

Nicht automatisch klassifizierbare Dokumente landen im "Move to Paperless"-Ordner. Der Agent prüft auch diesen Ordner regelmäßig, importiert die Funde und lernt aus den manuellen Korrekturen für künftige Durchläufe.

💡 Negativliste nicht vergessen!

Trage unbedingt AGBs in die Negativliste ein – sonst hast du nach kurzer Zeit jede Allgemeine Geschäftsbedingung auch automatisch in Paperless. Der Lerneffekt ist enorm: Je mehr Dokumente du manuell korrigierst, desto besser werden die automatischen Treffer.

Warum dieser Workflow so wertvoll ist

📈

>80% Automatisierung

Mehr als 80% aller eingehenden Dokumente werden vollautomatisch verarbeitet – vom E-Mail-Eingang bis zum getaggten, OCR-durchsuchbaren Archiv. Kein manuelles Sortieren, kein Drag & Drop.

🌍

Ortsunabhängig

Ob von einer portugiesischen Insel, aus Skandinavien oder unterwegs im E-Auto – ich habe per mobilen Browser oder App jederzeit Volltextzugriff auf alle Dokumente. Kein Papierkram im Rucksack.

🧾

Steuerfertig vorbereitet

Dank intelligentem Auto-Tagging sind steuerrelevante Belege, Rechnungen und Kontoauszüge bereits kategorisiert. Zur Steuererklärung muss ich nur noch nach Tags filtern – alles andere erledigt der Workflow.

📸

Briefpost per Foto

Selbst klassische Briefpost wird digital: Meine Frau fotografiert eingehende Dokumente kurz ab und mailt sie mir als Anhang. Der Workflow verarbeitet sie genauso wie digitale Rechnungen – vollautomatisch.

🔗

Skalierbar auf n Accounts

Anders als die interne E-Mail-Funktion von Paperless (die nur einen Account unterstützt) skaliert dieser agentenbasierte Ansatz auf beliebig viele E-Mail-Konten und Domains.

🤖

Agent-unabhängig

Der Workflow funktioniert mit OpenClaw, Hermes Agent, OpenCode CLI oder jedem anderen agentenbasierten Ansatz. Die Logik ist universell – nur die Skills müssen angepasst werden.

Die Komponenten

🤖 OpenClaw Agent Factory

  • E-Mail-Skill – Zugriff auf alle IceWarp-Konten via IMAP
  • Paperless-Skill – API-Integration mit API-Token
  • Klassifizierungs-Logik – Prüft auf Rechnung, Invoice, Lieferschein, etc.
  • Ordner-Management – Verschiebt verarbeitete Mails in "Moved to Paperless"
  • Lernfähig – Positive- & Negativliste verbessern Trefferquote

📄 Paperless-ngx

  • Docker-Container – Gehostet bei Hetzner
  • Automatische OCR – Volltextsuche über alle Dokumente
  • Auto-Tagging – Erkennt Rechnungen, Kontoauszüge, etc.
  • API-Token – Dedizierter API-User für den Agent-Zugriff
  • Konsumenten-Verzeichnis für direkte PDF-Importe

📧 IceWarp ePOS

  • Mehrere E-Mail-Konten – Unterschiedliche Domains, ein System
  • IMAP-Zugriff – Ermöglicht agentenbasierten Mail-Abruf
  • Ordnerstruktur – "Moved to Paperless" als Arbeitsordner
  • Deutlich einfacher zu implementieren als vergleichbare Lösungen mit Google Mail

Vom Altpapier zum digitalen Archiv

Natürlich ist nicht jeder Beleg digital. Meine Altlast an Papierdokumenten habe ich mit einem günstigen Dokumentenscanner (79 € bei eBay) digitalisiert. Die Funktionsweise ist einfach: Man legt Trennblätter mit Barcode zwischen die Dokumente, scannt das gesamte Konvolut en bloc ein – und Paperless zerlegt die Einzeldokumente automatisch anhand der Trennblätter.

Hinweis: Der von mir genutzte Scanner ist ein günstiges Einsteigermodell von eBay. Paperless-ngx arbeitet mit nahezu jedem Dokumentenscanner zusammen, der mehrseitiges PDF und Barcode-Trennblätter unterstützt.

Nach dem ersten Anlernen der Dokumente erkennt Paperless die meisten Rechnungen, Briefe und Verträge automatisch. Neue physische Post, die während meiner Reisen eingeht? Meine Frau fotografiert sie kurz ab, mailt sie mir – und der Workflow erledigt den Rest.

Zusammenfassung

  • Agent-basierte E-Mail-Überwachung – OpenClaw scannt alle Postfächer auf PDF-Anhänge mit Relevanz
  • Automatische Klassifizierung – Rechnung, Lieferschein, Kontoauszug – der Agent entscheidet
  • Direkte Paperless-API-Anbindung – PDF-Transfer inkl. OCR, Tagging & Archivierung
  • Move-to-Paperless-Fallback – Manuelle Prüfung & Positivliste für kontinuierliche Verbesserung
  • Digitalisierung Altbestand – Barcode-Trennblätter + günstiger Scanner für den Papierstapel
  • Briefpost-Digitalisierung – Einfach abfotografieren, mailen – fertig
  • Steuerfertig – Tags für Steuerrelevanz, Kategorien & Zeiträume
  • Skalierbar – Funktioniert mit n E-Mail-Konten, n Domains, n Agenten

Disclaimer: Bei diesem Artikel handelt es sich um meine persönliche Erfahrung und subjektive Einschätzung. Paperless-ngx ist ein Open-Source-Projekt, das ich selbst betreibe. Ich erhalte keine Vorteile oder Provisionen von den genannten Diensten. Die Konfiguration und Einrichtung erfordert grundlegende Kenntnisse in Docker, API-Integration und agentenbasierter Automatisierung.

Project Details

Status

Active

In Betrieb & verarbeitet täglich Dokumente

Kategorie

🌍 Digital Nomad 🤖 Automation

Automatisierungsrate

>80%

der eingehenden Dokumente werden vollautomatisch verarbeitet

Komponenten

  • 🤖 OpenClaw Agent (E-Mail & Paperless Skills)
  • 📄 Paperless-ngx (Docker bei Hetzner)
  • 📧 IceWarp ePOS (E-Mail-Konten)
  • 🖨️ Dokumentenscanner (79 €, eBay)

Voraussetzungen

  • ✓ OpenClaw, Hermes oder beliebiger Agent
  • ✓ IceWarp oder IMAP-fähige E-Mail-Konten
  • ✓ Paperless-ngx Instanz (Docker)
  • ✓ API-Token für Paperless