Dokumentenmanagementsystem für den privaten Gebrauch

Hat jemand einen Tipp für ein gutes Dokumentenmanagementsystem im privaten Gebrauch, bestenfalls komplett FOSS und ohne Schnickschnack?

In dieses System sollen nach Möglichkeit alle Dateien abgelegt werden können, sodass auch die Nextcloud Instanz rausfliegen kann. Letztere ist mir völlig überladen und nimmt bereits in der Installation des Kerns erheblichen Speicherplatz in Anspruch. Das DMS sollte optimalerweise auch eine Synchronisation mit Desktop-Clients für den Offline-Zugriff ermöglichen.

https://github.com/paperless-ngx/paperless-ngx

FOSS, webbasiert, kann auch OCR.
Ob es dafür allerdings Desktop-Clients gibt mit Offline-Support, bezweifele ich aber.

Hallo,
ich hoste auf meiner Synology auch paperless ngx seit ca. einem Jahr.
Desktop Zugriff via Browser, mobiler Zugriff über die Android App.
OCR funktioniert sehr gut und zuverlässig.
Daten liegen dann zentral auf dem NAS.
Grüße

Ich verwende Paperless-ngx. Finde es nicht optimal, aber habe bisher auch nichts besseres zum Selbsthosten gefunden. Um die Synchronisation der Dokumente mit dem Desktop-OS musst du dich aber separat kümmern, bspw via Nextcloud, Samba, oder Syncthing, eine Desktop-App gibt es nicht. Wenn du es öffentlich exponierten willst, würde ich etwas wie Keycloak vorlagern.

was fehlt GIT?

Die FOSS-Notizen-App Joplin hat seit einigen Wochen auch ein OCR-Feature für angehängte Bild- und PDF-Dateien. Ob man seine Dateien aber als Attachment zu einer Notiz verwalten sollte (die kann auch nur aus dem Dateinamen und dem Anhang bestehen), da bin ich mir nicht sicher. Mit genau diesem Claim (one place for everything) ist damals Evernote gestartet, aber der Erfolg hat ihnen nicht unbedingt recht gegeben…

Wenn man den deutschen Mittelstand unterstützen will, könnte man auch ein Docutain-Abo abschließen, aber das läuft AFAIK nur auf Android, iOS und Windows (und ist nicht FOSS).

Kann man mit Paperless-ngx ganze Order indizieren, oder müssen Dateien in Paperless-ngx „importiert“ werden?

Letzteres fände ich nicht optimal, weil man doch immer wieder neuen Dateien
ablegt (im Dateisystem) und Dokumente ergänzt… Wie soll man da noch wissen, was jetzt wieder importiert werden muss…

Man zieht Dokumente in den Consumption-Ordner (oder ins Webinterface), von da werden sie automatisch verschoben und weiterverarbeitet, also geht deine alte Ordnerstruktur verloren. Genaueres siehe: https://docs.paperless-ngx.com/usage/#the-consumption-directory . Die Überlegung dahinter ist, dass Tags statt Ordnerstruktur viel flexibler sind.

1 „Gefällt mir“

Das mit der verlorenen Ordnerstruktur würde ich so nicht zu 100% stehen lassen wollen. Man kann keine bereits vorhandenen Ordner einfach indizieren oder importieren. Das stimmt schon. Und natürlich muss man jedes Dokument einzeln importieren. Ob man das als Original behält muss man selbst entscheiden. braucht man aber eigentlich nicht.

Wenn man bei der Erstkonfiguration von paperless als Docker unter Linux die Ordner von paperless ins Dateisystem des Hosts verlegt und dann sinnvolle Ablagepfade und Dateinamen einstellt, bekommt man durchaus eine sinnvolle Ordnerstruktur hin. Aber dazu natürlich schon als sehr gute Draufgabe die Tags, Korrespondenten und Dokumenttypen. Da lässt sich schon äußerst komfortabel mit arbeiten.

Aber man findet notfalls auch was, wenn paperless mal gar nicht will. Wobei man sich dann tunlichst auf das Lesen beschränken sollte. Das ist auch der Grund, warum man in diesem Fall eigentlich die „alten Originale“ nicht mehr zwingend braucht.

1 „Gefällt mir“

Wie ist es eigentlich, wenn man erweiterte Dokumente und unveränderte Dateien mit GLEICHEN Dateinamen vom Windows-Explorer in das Web-Interface von Paperless-ngx dropped?

Gibt es danach zwei/mehrere Versionen der Dokumente in Paperless-ngx oder wird die alte Version ungefragt überschrieben?

Vielen Dank!

Die Dateinamen werden von Paperless-ngx angepasst: https://docs.paperless-ngx.com/advanced_usage/#file-name-handling

Wenn das Dokument inhaltlich komplett gleich ist, wird es als Duplikat behandelt und nicht erneut verarbeitet. Selbst fuzzy matching ist möglich: https://docs.paperless-ngx.com/administration/#fuzzy_duplicate

1 „Gefällt mir“

Hat jemand von Euch Paperless-ngx schon einmal auf eine Linux System „nativ“ installiert, will heissen ohne Docker?

Ich weiss, dass der „normale“ Weg über Docker auf einem NAS ist. Aber meine alte DS213
unterstützt Docker nicht mehr.

Nein, aber es gibt eine Anleitung:
docs.paperless-ngx.com | bare_metal

1 „Gefällt mir“

Ganz bare-metal - im Sinn von direkt auf Blech - nicht, aber in einem LXC unter Proxmox. Läuft.
Wenn du auch „Office“ Dateien verarbeiten lassen willt, kommst aber um Docker wahrscheinlich nicht herum. Das dazu u.a. notwendige Gotenberg kommt offiziell nur als Docker- Image.

https://github.com/paperless-ngx/paperless-ngx/discussions/5822

Guter Thread.
Ich überlege schon lange wie ich mein Büro digitaler bekomm.
Aktuell scanne ich bon Hand und lege in meine Ordner Struktur ab.

Da beim Multifunktionsdrucker (MFD) den Geist aufgegeben hat, möchte ich gleich das gesamte System umkrempeln.

Ist es möglich eine MFD z.B. von Brother so zu konfigurieren, dass ich nur den Drucker anschalten muss, ein Blatt Scanner und Paperless die Datei dann verarbeitet?
Ohne das ein PC an sein muss?

Und kann man das System dann einfach auf ein neues NAS umziehen?
Also nur Docker Ordner sichern und im neuen System, nach der Installation einspielen?

Evtl. starte ich dann noch einen passenden Thread für einen brauchbaren MFD/ Netzwerkdrucker/ Scanner der recht Sicher und Datensparsam ist.

Danke.

Mein Dokumentenmanagementsystem betreibe ich auch noch „von Hand“.
Mein NAS mit OMV stellt eine Sambafreigabe „Scannen“ im Netz bereit. Es gibt viele Brother MuFus, die auf eine Sambafreigabe oder einen FTP-Server scannen können.
Man steht an seinem Brother, legt das zu scannende Papier ein, drückt auf Scannen und bestätigt noch, dass man an eine Sambafreigabe scannen will. Dann wird das Blatt eingezogen und an einer Stelle auf dem NAS abgelegt.
Dort jage ich es noch einmal durch ocrmypdf und schon habe ich mein pdf, das ich mit Datum und Titel versehe und abspeichere.
Ich hatte bei dem Kauf des Brothers nicht auf das Netzwerkscannen geachtet, bin heute aber sehr froh, es zu haben.

2 „Gefällt mir“

Wichtig wäre hier vielleicht noch echter Duplex-Scan, da es doch mehr doppelseitig bedruckte Dokumente gibt als erwartet.

Es gibt im Synology-Forum einen extra Thread zu Paperless, wenn du ein Synology besitzt, schau da mal vorbei…

1 „Gefällt mir“