Warum automatisierte Dokumentenverarbeitung?
Als Digitalnomade bin ich drei bis vier Wochen am Stück unterwegs –
quer durch Europa, im E-Auto, auf Inseln, in Skandinavien. Trotzdem muss ich
jederzeit Zugriff auf alle relevanten Dokumente haben: Rechnungen,
Kreditkartenabrechnungen, Kontoauszüge, Steuerunterlagen. Kein Papierstapel
im Büro, kein hektisches Suchen vor der Steuererklärung.
As a digital nomad, I'm on the road for three to four weeks at a time –
across Europe, in my EV, on islands, in Scandinavia. Yet I need
access to all relevant documents at all times: invoices,
credit card statements, bank statements, tax documents. No paper pile
in the office, no frantic searching before tax season.
Die Lösung: Ein vollautomatisierter Workflow aus OpenClaw Agenten,
die meine E-Mail-Konten auf PDF-Anhänge scannen, diese klassifizieren und dann an
Paperless-ngx übergeben – einem selbstgehosteten DMS, das per
OCR alle Dokumente durchsuchbar macht. Das Ganze skaliert auf beliebig viele
E-Mail-Konten und läuft seit Monaten störungsfrei.
The solution: A fully automated workflow using OpenClaw Agents
that scan my email accounts for PDF attachments, classify them, and then pass them to
Paperless-ngx – a self-hosted DMS that makes all documents
searchable via OCR. It scales to any number of
email accounts and has been running flawlessly for months.
Wichtiger Hinweis: Da in Paperless-ngx alle Dokumente automatisch
einen OCR-Durchlauf durchlaufen, sind sie vollständig
Volltext-indiziert und können per Volltext-Funktionalität auch
wieder durch einen Agenten – also OpenClaw, Hermes oder jeden anderen –
komplett ausgelesen und weiterverarbeitet werden. Dadurch entfällt
die Notwendigkeit, Dokumente zusätzlich in ein separates RAG-System
(Retrieval-Augmented Generation) abzulegen. Die RAG-Funktionalität ist praktisch
direkt in den Workflow integriert.
Important note: Since all documents in Paperless-ngx automatically
undergo an OCR pass, they are fully
full-text indexed and can be
completely read and further processed via full-text search
by an agent – OpenClaw, Hermes, or any other. This eliminates
the need to additionally store documents in a separate RAG system
(Retrieval-Augmented Generation). The RAG functionality is practically
built directly into the workflow.
Der Workflow im Detail
1
📥 E-Mail-Import & Scan
Der OpenClaw Agent prüft in regelmäßigen Abständen alle meine E-Mail-Konten auf den IceWarp-Servern. Jede eingehende E-Mail wird auf PDF-Anhänge untersucht.
The OpenClaw Agent periodically checks all my email accounts on the IceWarp servers. Every incoming email is scanned for PDF attachments.
2
🔍 KI-gestützte Klassifizierung
Anhand von Schlüsselbegriffen wie Rechnung, Invoice, Lieferschein (etc.) wird der Inhalt kategorisiert. Der Agent entscheidet, ob und wie das Dokument weiterverarbeitet wird.
Based on keywords such as invoice, packing slip, statement (etc.), the content is categorized. The agent decides whether and how the document is further processed.
3
📄 PDF-Extraktion & Transfer
Der Agent hängt das PDF aus der E-Mail heraus, bereitet es auf und überführt es per API-Token direkt in die Paperless-ngx-Instanz (gehostet als Docker-Container bei Hetzner).
The agent extracts the PDF from the email, prepares it, and transfers it via API token directly to the Paperless-ngx instance (hosted as a Docker container at Hetzner).
4
🏷️ OCR & Auto-Tagging in Paperless
Paperless führt beim Import automatisch eine OCR-Erkennung durch und taggt die Dokumente anhand ihres Inhalts. Eine Hetzner-Rechnung wird automatisch erkannt und mit "Steuerrelevant" getaggt.
Paperless automatically performs OCR recognition during import and tags documents based on their content. A Hetzner invoice is automatically recognized and tagged as "Tax Relevant".
5
📂 Archivierung & Ordnerlogik
Verarbeitete E-Mails werden in den Ordner "Moved to Paperless" verschoben – für den Fall, dass ich sie später noch einmal im Postfach finden möchte. Die Original-Dokumente sind trotzdem in Paperless per Volltextsuche jederzeit griffbereit.
Processed emails are moved to the "Moved to Paperless" folder – in case I want to find them again in my mailbox later. The original documents are still always accessible in Paperless via full-text search.
6
🔄 Fallback: Manuelle Prüfung
Nicht automatisch klassifizierbare Dokumente landen im "Move to Paperless"-Ordner. Der Agent prüft auch diesen Ordner regelmäßig, importiert die Funde und lernt aus den manuellen Korrekturen für künftige Durchläufe.
Documents that cannot be automatically classified land in the "Move to Paperless" folder. The agent also checks this folder regularly, imports the finds, and learns from manual corrections for future runs.
💡 Negativliste nicht vergessen!
Trage unbedingt AGBs in die Negativliste ein – sonst hast du nach kurzer Zeit jede Allgemeine Geschäftsbedingung auch automatisch in Paperless. Der Lerneffekt ist enorm: Je mehr Dokumente du manuell korrigierst, desto besser werden die automatischen Treffer.
💡 Don't forget the negative list!
Be sure to add terms & conditions to the negative list – otherwise you'll soon have every T&C automatically in Paperless. The learning effect is enormous: the more documents you manually correct, the better the automatic matches become.
Warum dieser Workflow so wertvoll ist
📈
>80% Automatisierung
Mehr als 80% aller eingehenden Dokumente werden vollautomatisch verarbeitet – vom E-Mail-Eingang bis zum getaggten, OCR-durchsuchbaren Archiv. Kein manuelles Sortieren, kein Drag & Drop.
>80% Automation
More than 80% of all incoming documents are processed fully automatically – from email receipt to tagged, OCR-searchable archive. No manual sorting, no drag & drop.
🌍
Ortsunabhängig
Ob von einer portugiesischen Insel, aus Skandinavien oder unterwegs im E-Auto – ich habe per mobilen Browser oder App jederzeit Volltextzugriff auf alle Dokumente. Kein Papierkram im Rucksack.
Location Independent
Whether from a Portuguese island, Scandinavia, or on the road in my EV – I have full-text access to all documents at any time via mobile browser or app. No paperwork in my backpack.
🧾
Steuerfertig vorbereitet
Dank intelligentem Auto-Tagging sind steuerrelevante Belege, Rechnungen und Kontoauszüge bereits kategorisiert. Zur Steuererklärung muss ich nur noch nach Tags filtern – alles andere erledigt der Workflow.
Tax-Ready Preparation
Thanks to intelligent auto-tagging, tax-relevant receipts, invoices, and bank statements are already categorized. For my tax return, I just need to filter by tags – the workflow handles everything else.
📸
Briefpost per Foto
Selbst klassische Briefpost wird digital: Meine Frau fotografiert eingehende Dokumente kurz ab und mailt sie mir als Anhang. Der Workflow verarbeitet sie genauso wie digitale Rechnungen – vollautomatisch.
Snail Mail via Photo
Even traditional postal mail goes digital: My wife quickly photographs incoming documents and emails them to me as attachments. The workflow processes them just like digital invoices – fully automatic.
🔗
Skalierbar auf n Accounts
Anders als die interne E-Mail-Funktion von Paperless (die nur einen Account unterstützt) skaliert dieser agentenbasierte Ansatz auf beliebig viele E-Mail-Konten und Domains.
Scalable to n Accounts
Unlike Paperless's internal email function (which only supports one account), this agent-based approach scales to any number of email accounts and domains.
🤖
Agent-unabhängig
Der Workflow funktioniert mit OpenClaw, Hermes Agent, OpenCode CLI oder jedem anderen agentenbasierten Ansatz. Die Logik ist universell – nur die Skills müssen angepasst werden.
Agent Independent
The workflow works with OpenClaw, Hermes Agent, OpenCode CLI, or any other agent-based approach. The logic is universal – only the skills need to be adapted.
Die Komponenten
🤖 OpenClaw Agent Factory
- E-Mail-Skill – Zugriff auf alle IceWarp-Konten via IMAP
- Paperless-Skill – API-Integration mit API-Token
- Klassifizierungs-Logik – Prüft auf Rechnung, Invoice, Lieferschein, etc.
- Ordner-Management – Verschiebt verarbeitete Mails in "Moved to Paperless"
- Lernfähig – Positive- & Negativliste verbessern Trefferquote
- Email Skill – Access to all IceWarp accounts via IMAP
- Paperless Skill – API integration with API token
- Classification Logic – Checks for invoice, packing slip, etc.
- Folder Management – Moves processed emails to "Moved to Paperless"
- Learnable – Positive & negative lists improve hit rate
📄 Paperless-ngx
- Docker-Container – Gehostet bei Hetzner
- Automatische OCR – Volltextsuche über alle Dokumente
- Auto-Tagging – Erkennt Rechnungen, Kontoauszüge, etc.
- API-Token – Dedizierter API-User für den Agent-Zugriff
- Konsumenten-Verzeichnis für direkte PDF-Importe
- Docker Container – Hosted at Hetzner
- Automatic OCR – Full-text search across all documents
- Auto-Tagging – Recognizes invoices, bank statements, etc.
- API Token – Dedicated API user for agent access
- Consumption directory for direct PDF imports
📧 IceWarp ePOS
- Mehrere E-Mail-Konten – Unterschiedliche Domains, ein System
- IMAP-Zugriff – Ermöglicht agentenbasierten Mail-Abruf
- Ordnerstruktur – "Moved to Paperless" als Arbeitsordner
- Deutlich einfacher zu implementieren als vergleichbare Lösungen mit Google Mail
- Multiple Email Accounts – Different domains, one system
- IMAP Access – Enables agent-based mail retrieval
- Folder Structure – "Moved to Paperless" as working folder
- Significantly easier to implement than comparable solutions with Gmail
Vom Altpapier zum digitalen Archiv
Natürlich ist nicht jeder Beleg digital. Meine Altlast an Papierdokumenten habe ich mit einem
günstigen Dokumentenscanner (79 € bei eBay) digitalisiert. Die
Funktionsweise ist einfach: Man legt Trennblätter mit Barcode zwischen die
Dokumente, scannt das gesamte Konvolut en bloc ein – und Paperless zerlegt die Einzeldokumente
automatisch anhand der Trennblätter.
Of course, not every receipt is digital. I digitized my legacy paper documents with an
inexpensive document scanner (€79 on eBay). The
process is simple: place separator sheets with barcodes between the
documents, scan the entire batch en bloc – and Paperless automatically splits the individual
documents based on the separator sheets.
Hinweis: Der von mir genutzte Scanner ist ein günstiges Einsteigermodell von eBay.
Paperless-ngx arbeitet mit nahezu jedem Dokumentenscanner zusammen, der mehrseitiges PDF
und Barcode-Trennblätter unterstützt.
Note: The scanner I use is an inexpensive entry-level model from eBay.
Paperless-ngx works with almost any document scanner that supports multi-page PDF
and barcode separator sheets.
Nach dem ersten Anlernen der Dokumente erkennt Paperless die meisten Rechnungen,
Briefe und Verträge automatisch. Neue physische Post, die während meiner Reisen eingeht?
Meine Frau fotografiert sie kurz ab, mailt sie mir – und der Workflow erledigt den Rest.
After the initial training phase, Paperless automatically recognizes most invoices,
letters, and contracts. New physical mail that arrives during my travels?
My wife quickly photographs it, emails it to me – and the workflow handles the rest.
Zusammenfassung
- Agent-basierte E-Mail-Überwachung – OpenClaw scannt alle Postfächer auf PDF-Anhänge mit Relevanz
- Automatische Klassifizierung – Rechnung, Lieferschein, Kontoauszug – der Agent entscheidet
- Direkte Paperless-API-Anbindung – PDF-Transfer inkl. OCR, Tagging & Archivierung
- Move-to-Paperless-Fallback – Manuelle Prüfung & Positivliste für kontinuierliche Verbesserung
- Digitalisierung Altbestand – Barcode-Trennblätter + günstiger Scanner für den Papierstapel
- Briefpost-Digitalisierung – Einfach abfotografieren, mailen – fertig
- Steuerfertig – Tags für Steuerrelevanz, Kategorien & Zeiträume
- Skalierbar – Funktioniert mit n E-Mail-Konten, n Domains, n Agenten
- Agent-Based Email Monitoring – OpenClaw scans all mailboxes for relevant PDF attachments
- Automatic Classification – Invoice, packing slip, bank statement – the agent decides
- Direct Paperless API Integration – PDF transfer including OCR, tagging & archiving
- Move-to-Paperless Fallback – Manual review & positive list for continuous improvement
- Legacy Digitization – Barcode separator sheets + inexpensive scanner for paper piles
- Snail Mail Digitization – Simply photograph, email – done
- Tax Ready – Tags for tax relevance, categories & time periods
- Scalable – Works with n email accounts, n domains, n agents
Disclaimer: Bei diesem Artikel handelt es sich um meine persönliche Erfahrung
und subjektive Einschätzung. Paperless-ngx ist ein Open-Source-Projekt, das ich
selbst betreibe. Ich erhalte keine Vorteile oder Provisionen von den genannten
Diensten. Die Konfiguration und Einrichtung erfordert grundlegende Kenntnisse in
Docker, API-Integration und agentenbasierter Automatisierung.
Disclaimer: This article represents my personal experience
and subjective assessment. Paperless-ngx is an open-source project that I
operate myself. I receive no benefits or commissions from the mentioned
services. Configuration and setup require basic knowledge of
Docker, API integration, and agent-based automation.