Bild mit dem Schriftzug: Paperless-ngx

Paperless auf Windwos 11 installieren

Ich habe bereits die Vorteile sowie die vollständige Installationsanleitung für Paperless-ngx auf einem Linux-System in einer virtuellen Maschine als Artikel und Video veröffentlicht. Dort zeige ich, wie Paperless mit Docker Compose sauber läuft und wie man alle Dienste korrekt einrichtet.

Mit diesem Artikel und einem weiteren Video möchte ich nun eine ergänzende Anleitung bereitstellen – diesmal speziell für alle, die Paperless-ngx unter Windows nutzen wollen, und zwar mithilfe von Docker Desktop und WSL (Windows Subsystem for Linux).

Paperless ist eine mächtige Anwendung zur digitalen Dokumentenverwaltung, aber der Einstieg unter Windows ist für viele etwas ungewohnt. Deshalb führe ich Schritt für Schritt durch die Einrichtung. In meinem Video zeige ich:

  • wie Docker Desktop korrekt installiert und eingerichtet wird
  • wie WSL aktiviert und konfiguriert wird
  • welche Dateien benötigt werden
  • wie man das gesamte System per Docker Compose startet

Zusätzlich stelle ich hier im Artikel die passende docker-compose.yml zur Verfügung, die alle nötigen Dienste enthält: PostgreSQL als Datenbank, Redis als Nachrichtenwarteschlange, Tika und Gotenberg für die Dokumentenverarbeitung und natürlich Paperless selbst als zentrale Anwendung.

Der consume-Ordner, in den Sie später Ihre Dokumente hineinlegen können, wird so eingerichtet, dass Paperless automatisch mit dem Import beginnt. Alle Komponenten sind fertig vorkonfiguriert und laufen miteinander vernetzt – Sie müssen die Datei nur in Docker Desktop einbinden oder im Terminal per Befehl starten.

Dieses Setup ist besonders für alle geeignet, die nicht auf ein separates Linux-System ausweichen wollen, sondern Paperless direkt auf ihrem Windows-Rechner betreiben möchten – und das stabil, lokal und ohne Cloud-Zwang.

Im Video erkläre ich alles ganz genau. Hier im Artikel bekommst du die Konfigurationsdatei, die Befehle und wichtige Hinweise zur Performance – vor allem im Umgang mit dem consume-Ordner und der Windows-Integration.

Kostenlose IT-Sicherheits-Bücher & Information via Newsletter

Bleiben Sie informiert, wann es meine Bücher kostenlos in einer Aktion gibt: Mit meinem Newsletter erfahren Sie viermal im Jahr von Aktionen auf Amazon und anderen Plattformen, bei denen meine IT-Sicherheits-Bücher gratis erhältlich sind. Sie verpassen keine Gelegenheit und erhalten zusätzlich hilfreiche Tipps zur IT-Sicherheit. Der Newsletter ist kostenlos und unverbindlich – einfach abonnieren und profitieren!

Zur Anmeldung

Proxmox VE 8 Praxisbuch

Informationen, Tipps und Tricks für Proxmox-Einsteiger und Fortgeschrittene - umfassend überarbeitete Ausgabe 4 mit 450 Seiten Proxmox-Wissen

Buch auf Amazon

NEU

Proxmox Fachbuch von Ralf-Peter Kleinert Auflage 3

Paperless in Docker Desktop Windows

Hier ist die Datei docker-compose.yml. 

Diese Datei kann einfach kopiert werden. Da Paperless nicht nur aus einer einzigen Software besteht, sondern aus mehreren miteinander verbundenen Komponenten, benötigen wir eine sogenannte Komposition. Docker Compose erlaubt es, all diese Dienste in einer Datei zu definieren und sie gemeinsam zu starten. Dadurch wird sichergestellt, dass alle benötigten Teile korrekt zusammenarbeiten. In dieser Compose-Datei werden verschiedene Dienste orchestriert – also automatisch miteinander verknüpft und gestartet. Dazu zählen unter anderem die Datenbank (db), der Texterkennungsdienst Tika, der PDF-Konvertierungsdienst Gotenberg, der Nachrichtenvermittler (broker) sowie der eigentliche Paperless-Dienst mit Weboberfläche. 

Die Erklärung der einzelnen Dienste finden Sie weiter unten im Artikel.


              
            

Erklärung der Einträge in der docker-compose.yml

Services und Dienste in der docker-compose Datei

broker ist der Dienst, der Redis bereitstellt. Redis ist ein In-Memory-Datenspeicher, der von Paperless-ngx für die interne Kommunikation genutzt wird. Genauer gesagt übernimmt Redis das sogenannte Message Brokering. Wenn ein neues Dokument importiert wird, legt Paperless einen Job in der Warteschlange ab. Ein sogenannter Worker holt sich diesen Job aus Redis, verarbeitet ihn und meldet den Abschluss zurück. Ohne diesen Dienst könnten die Hintergrundaufgaben nicht funktionieren, was Paperless langsamer oder funktionsunfähig machen würde. 

db ist die Datenbank, konkret eine PostgreSQL-Datenbank. Sie speichert alle strukturierten Informationen, also Metadaten zu Dokumenten, Benutzerdaten, Schlagwörter, archivierte Statusinformationen und vieles mehr. Die Datenbank ist das Rückgrat für alle Such- und Verwaltungsfunktionen in Paperless. Ohne sie wäre keine Benutzeranmeldung, kein Dokumentenabruf und keine OCR-Auswertung möglich. Alles, was nicht in den Dateien selbst steckt, wird in der Datenbank verwaltet.

gotenberg ist ein Dienst, der Office-Dateien wie Word oder Excel in PDF-Dateien umwandelt. Paperless kann nicht direkt mit diesen Formaten umgehen, sondern braucht eine einheitliche Struktur. Sobald ein Word-Dokument importiert wird, schickt Paperless es an Gotenberg. Dieser wandelt das Dokument in ein PDF um, das dann durchsuchbar gemacht und verarbeitet werden kann. Gotenberg ist also ein Konverter, der alle Office-Formate auf das PDF-Format bringt, damit Paperless sie sauber handhaben kann.

tika ist ein Texterkennungs- und Analysewerkzeug. Der Dienst basiert auf Apache Tika und wird von Paperless genutzt, um Text aus PDF-Dateien zu extrahieren. Wenn ein Dokument eingelesen wird, wird es an Tika übergeben. Dieser erkennt den enthaltenen Text und gibt ihn an Paperless zurück, sodass das Dokument durchsuchbar wird. Tika erkennt auch Metadaten und Dateitypen. Damit ist Tika ein zentraler Bestandteil der OCR-Funktion von Paperless.

paperless ist der Hauptdienst, also die eigentliche Anwendung. Dieser Dienst stellt die Weboberfläche bereit, verwaltet die Nutzeranmeldung, zeigt die hochgeladenen Dokumente an und sorgt für die Kommunikation mit allen anderen Diensten. Wenn ein Nutzer ein PDF hochlädt, wird es vom Paperless-Dienst angenommen, analysiert, an die anderen Dienste weitergereicht und im System abgelegt. Paperless ist die Schaltzentrale, die alles steuert und die Oberfläche liefert, über die man später auf seine Dokumente zugreifen kann.

Ralf-Peter Kleinert - Buchautor für IT-Sichereit, Computersicherheit und Cybersecurity

Über den Autor: Ralf-Peter Kleinert

Über 30 Jahre Erfahrung in der IT legen meinen Fokus auf die Computer- und IT-Sicherheit. Auf meiner Website biete ich detaillierte Informationen zu aktuellen IT-Themen. Mein Ziel ist es, komplexe Konzepte verständlich zu vermitteln und meine Leserinnen und Leser für die Herausforderungen und Lösungen in der IT-Sicherheit zu sensibilisieren.

Mehr über mich, Ausbildung, Zertifizierungen

Meine Amazon Autorenseite

Aktualisiert: Ralf-Peter Kleinert 20.07.2025