Dokumentenscanner für Windows - Eure Empfehlungen, auch hinsichtlich Datenschutz

Die Windows / Mac Software kann man sich von der Herstellerseite laden. Unter Linux kannst du den auch nutzen, er ist auf der Seite des SANE Projekts gelistet (Sane Projekt - Compatibilität von Canon Scannern). Die anderen Foristen haben ja schon Linux Programme genannt.

Die Profile steuerst du nicht über den Scanner sondern bei der Windows / Mac über das Programm (neudeutsch App). Unter Linux kommt es dann darauf an, ob man in dem jeweiligen Programm Profile anlegen kann.

Diese Aussage (Windows Software = Spyware) ist mir zu pauschal. Im übrigen kann das unter anderen OS auch passieren.

Frage mal @plop.

1 „Gefällt mir“

Danke für den Hinweis. Ich hatte bislang immer gedacht, das wäre kostenpflichtig. Aber ich hab tatsächlich Win10 Pro, weil ich seit über 20 Jahren ausgemusterte Firmen-Thinkpads vom Arbeitgeber meines Bruders nutze.

Mal schauen, ob ich damit klarkomme, ich bin zwar kein Dumm-Anwender, aber mit VM bislang nicht in Kontakt gekommen. Wäre dann aber Gegenstand eines eigenen Threads.

Ja, das ist mir bewusst, aber grade bei unterschiedlichen Dokumenten (mal schwarzweiß, mal farbig, mal hohe Auflösung etc.) ist es schon auch schön, wenn man das passende Profil auch am Gerät selbst auswählen kann. Nach dem Motto: dieses Blatt ist mit Profil Nullachtfünfzehn schwarzweiß niedrige Auflösung okay, das nächste braucht aber Farbe für die Handschrift usw.

Also dann traue ich mich und bestelle den gebrauchten. Wenn der nicht taugt, bist Du schuld :wink:

Ich wollte das an der Stelle nicht vertiefen, hätte ja sein können, dass Miss-Piggy schon Bescheid weiß. Ich meinte sowas wie Recall/Co-Pilot auf Windows 11, Windows 10 soll das wohl nachträglich bekommen haben, statt Cortana. Das ist das, von dem ich weiß.

Hier hatte ich schon mal zu dem Problem geschriebben und auf eine Anleitung verlinkt: https://www.kuketz-forum.de/t/tipps-fuer-mehr-datenschutz-sicherheit-was-kann-ich-noch-optimieren/12119/3
https://www.kuketz-forum.de/t/tipps-fuer-mehr-datenschutz-sicherheit-was-kann-ich-noch-optimieren/12119/14

Das habe ich gestern noch gefunden: https://linuxnews.de/das-papierlose-buero-paperwork-und-paperless-ngx/
Paperwork ist das einfachere, gibt es für Linux UND Windows (und Mac), ist aber mehr als eine Scansoftware.

2 „Gefällt mir“

Dolphin (Datei Explorer von Fedora KDE)

Einfach im Suchfeld ein Teil des Namens des gewünschten Dokuments suchen.

Klappt auch bei eingehängten Festplatten.

Denke, dass ist eine Grundfunktion in jeden Betriebssystem?

Klappt glaube ich sogar im Startmenü sofern das Laufwerk eingehängt ist.

Linux hat echt viele Möglichkeiten.

da triffst Du den Punkt. Ich hatte nicht geschrieben, dass ich Dokumente benenne oder tage, weil die Windows-Suche (bei bekannten Formaten) Inhalte indiziert und darüber die Suche gestattet. Und das auch remote über SMB wenn der Server das unterstützt (Samba halt nicht).
Also zwei Unterschiede: Suche nach Inhalten und remote Suche, die Deine Lösung wohl nicht kann.

Ah ich verstehe.

Nein, dass war bis jetzt für mich nicht nötig.

Ich arbeite so oder so Oldschool.

Habe eine Ordnerstruktur und klicke in den richtigen Ordner.

Langfristig würde ich gerne Paperless oder der gleichen implementieren.

Zur Suche in KDE, die ist mit dem KRunner wesentlich einfacher, und zeigt die entsprechend Datei oder Program an und es kann sofort gestartet werden.

Einfach [Alt] + [F2] drücken und anfangen zu tippen, da braucht es eigentlich kein Dolphin oder ähnliches mehr :grin:

1 „Gefällt mir“

Ich krieg leider ein 403 forbidden zurück, wenn ich den Link versuche. Waybackmachine hat anscheinend auch nichts …

Deine Frage hat mich bewogen, ein bissel von meinen Senf dazu zugeben. Muss es unbedingt ein “dummer” Dokumentenscanner sein? Ja, blöd ausgedrückt, aber ein Dokumentenscanner ist halt nur auf das Scannen von Dokumenten ausgelegt und mehr nicht. Dafür sind sie schneller als andere Scanner, da halt auf eine Aufgabe spezialisiert.

Ich stehe nämlich vor einen ähnlichen Problem wegen dem Umstieg zu Linux. Aber der Reihe nach:

Ich betreibe ein Hobby, für das ich alte Vorschriften doppelt kaufe. Das eine Exemplar wandert ins Archiv, das andere wird am Rücken aufgetrennt und digitalisiert. Da kommt bei 100 bis 300 Seiten so einiges zusammen. Ich hatte mir 2018 den Epson WF 7610 gekauft für 180 EUR. Ist zwar A3, aber ich scanne auch großformatige Pläne. Nach 26000 Seiten hat das duale Scannen versagt. Der Einzug hat nur noch einseitig funktioniert. Aber 26000 Seiten bei 180 EUR Kaufpreis ist nicht zu verachten. Jetzt habe ich den WF 7840, also einen Nachfolger des 7610 und bin sehr zufrieden. Epson kam auch deshalb in Frage, weil es echte Linux-Treiber von Epson gibt. Es gibt diese Geräte auch für A4. Hier ist der Pendant zu meinen Gerät: https://www.epson.de/de_DE/produkte/drucker/inkjet/microbusiness/workforce-pro-wf-4830dtwf-a4-kabelloser-multifunktions-tintenstrahldrucker/p/29624 Und 180 EUR Listenpreis ist nicht zu viel verlangt.

Als Dokumentenverwaltungssystem kommt ELO Office Professional Version 10 zum Einsatz. Und genau hier sehe ich für mich ein Problem: Es gibt meines Wissens kein adäquaten Ersatz für ELO Office für Linux. Irgendwelche Clint-Server-Lösungen kommen nicht in Frage. Also werde ich für mein Archiv weiterhin mit Windows 10 arbeiten. Irgendwann teste ich, ob ELO auch in einer VM arbeitet oder eine VM zu leistungsschwach dafür ist. Es gibt für Linux sehr viele Programme, die die Windows Lösungen komplett ersetzen. Aber “sehr viel” bedeutet nicht “alles”

1 „Gefällt mir“

Was ist der Vorteil von ELO gegenüber anderen Lösungen wie die hier schon erwähnten Paperwork oder Paperless? Ansonsten würde ich als kommerzielle, aber noch bezahlbare Lösung auch für Linux ecoDMS vorschlagen.

1 „Gefällt mir“

Deshalb kommt ecoDMS nicht in Frage. Und dann erwarte ich beim Programm gleich welcher Art ein Symbolleise, egal ob Ribbon oder klassisch. Und nicht diesen “App-Verschnitt”, der sich leider immer mehr auch bei Desktopprogrammen verbeitet.

Ich möchte hier zu dem Thema auch noch meinen “Senf” dazugeben.

Kurz vorweg:

Linux nutze ich mittlerweile auf allen meinen Rechnern. Anfangs (vor 25 Jahren) als Dualboot, Spätestens mit dem Auftauchen der Verschlüsselungstrojaner habe ich dann rigoros auf Linux umgestellt. Von daher bin ich natürlich kein Laie mehr auf dem Gebiet, wenn auch noch lange kein Profi.

Ich benutze paperless-ngx in der Docker-Installation direkt auf meinem PC. Man kann paperless mühelos so konfigurieren, das alle Speicherbereiche (Datenbank, Dokumente usw.) sich direkt im Dateisystem des Wirts (des PC selbst) befinden. Das ist insbesondere für die Dokumente selbst wichtig. Man kommt nämlich notfalls an die gescannten PDF’s heran. Allerdings nur, wenn man in paperless saubere Speicherpfade anlegt. Die befinden sich bei meiner Installation unterhalb von /opt/paperless/. Dort gibt es einen Ordner media und auch einen Ordner consume. Letzeren habe ich mit SAMBA freigegebene (SMB-Freigabe). Dort speichert mein Brother-Drucker alle eingescannten Dokumente als PDF/A ab.

OCR-Scan Verschlagwortung, eintragen von Dokumentenart, Korrespondent usw. macht paperless ziemlich gut alleine. Kann man alles recht gut konfigurieren und auch später noch einiges anpassen.

Mein Dokumentenscanner ist von Brother. Er kann über USB (nicht probiert ) SMB-Freigabe (läuft super) oder auch per FTP (nicht probiert) seinen Scans bei paperless abliefern. Soweit ich das anhand meiner Firewall feststellen kann, braucht der nur beim Einschalten mal eine Internetverbindung zu einem NTP-Server, um die Uhrzeit zu stellen. Alles andere bleibt in meinem geschlossenen Netzwerk. Ich habe mir bei meinem Brother Scanner keine Mühe gemacht, USB oder FTP auszuprobieren. Wozu auch? SMB funktioniert unter Linux schnell und stabil.

Die Menüführung / Benutzung ist bei paperless sehr übersichtlich und schnell. Der Scanner macht 2-seitige Scan’s mit Leerseitenerkennung. Das kann man alles am Scanner mittels WEB-UI einstellen bzw. anpassen. Alles was man als Stapel in den Scanner einlegt, kommt als ein PDF-Dokument in paperless an. Trennen kann paperless das mittels Aufklebern. Ist im Projekt gut beschrieben.

Insgesamt kein Vergleich mit ecoDMS. ecoDMS ist preislich recht gut mit seinen ca. 90,- Euro als lebenslange Preisgarantie. ABER Bedienung deutlich träger und umständlicher als paperless und am Wichtigsten, was auch mir mir nach 2 Jahren der Grund war ecoDMs “abzuschießen”. ecoDMS lässt keinen Zugriff auf die PDF’s direkt zu, was aber bei einer revisionssichern Lösung auch unzulässig ist. Wenn also ecoDMS spinnt, kommt man an nichts heran. Was mir bei ecoDMS auch sauer aufgestoßen ist, ist die Preisgestaltung beim Support.

.

Der einzige Nachteil von paperless:

Die Entwickler haben erklärt, das es unter keinen Umständen eine Version für Windows geben soll. Also nur mit Linux als Wirt. Und den Standpunkt vertreten sie m. W. immer noch.

1 „Gefällt mir“

Das sehe ich nicht unbedingt als Nachteil. Man kann paperless-ngx auf ‘nem Raspberry-Pi oder auch auf ‘nem (Synology-)NAS installieren und dann kann man von überall im Netzwerk per Browser darauf zugreifen.

Das das auch auf einer Synology oder anderen NAS geht ist logisch. Die Dinger laufen ja fast alle auf entsprechend angepassten Linux-Varianten.

Was die Installation auf einem raspi angeht. Das habe ich auf einem raspi5 mit 8GB RAM und nvme-SSD ausprobiert. Die Installation problemlos, OCR mittels über den consume eingespielten PDF’s ging auch. Wenn auch deutlich langsamer als bei meinem PC (AMD Ryzen 7 3700X ).
ABER: ich hatte bereits beim Test auf dem raspi gute 2.500 Dokumente in paperless. Jedesmal beim Aufbau der Dokumentenliste (Button „Dokumente“ ) fuhr sich der raspi fest.
Der raspi ist also für große Datenmengen nicht geeignet.

Möglicherweise trifft das auch auf die Docker-Installation auf einem fertig-NAS zu. Die Geräte fallen ja meist auch nicht gerade durch opulente Rechenleistung auf.

Ich hatte paperless-ngx vorher auf einem WD-NAS laufen. Das war wirklich recht langsam. Seit ich damit aber auf einen Raspi 400 umgezogen bin, läufts recht flüssig und ich habe auch schon mehr als 1000 Dokumente darin.

Das hätte ich jetzt nicht so erwartet. Der Raspi 5 ist ja hinsichtlich Speicher und CPU deutlich leistungsfähiger als der Raspi 400. Aber du hast natürlich auch noch wesentlich weniger Doukumente in paperless. Ich bin ja mal gespannt, wann dein Setup leistungsmäßig wegen der Menge an Dokumenten einbricht.

Nebenbei mal eine Frage, wie sicherst du die Daten? Ich lasse sämtliche Sicherungen (nicht nur paperless) spät Abends mittels cron automatisiert durchführen und sichere die Daten alle auf einem TrueNAS-System. Was paperless betrifft, nutze ich die Sicherung über den WEB-Server.

Ich sichere die Daten z.Zt. noch per Hand (File-Manager auch über Docker auf dem Raspi installiert). Ich müsste das auch mal automatisieren.

Sorry, dass ich mich erst jetzt melde, hatte kein Internet!

Also bei mir geht der Link im Torbrowser, mit Librewolf+VPN bekomme ich auch forbidden.

Auch ich nutze paperless-ngx direkt im Container auf meinem PC. Dadurch muss ich mich nicht extra um die Diskverschlüsselung auf Serverseite kümmern, da mein PC bereits LUKS verschlüsselt ist. Das macht das ganze sehr viel einfacher.

Allerdings sollte man wirklich nicht mehr Docker nutzen wenn möglich, sondern das Ganze mit Podman rootless aufsetzen. Ich habe mich dazu an dieser Anleitung hier orientiert. Das funktioniert prima.

Alles Linux DEs haben einen Fileindexer, bei KDE ist das Baloo. Dieser wird dann auch direkt von den jeweiligen Fileexplorern mit Suchfeld verwendet. Ordner außerhalb von HOME kann man manuell zur automatischen Indixierung hinzufügen.