Niaxa Posted January 4, 2021 Share Posted January 4, 2021 (edited) Hallo zusammen, da ich mein Papermerge jetzt so eingerichtet habe, wie ich es haben möchte, dachte ich mir ich gebe euch eine Kurzanleitung für die Grundkonfiguration. Problem: Der worker von PM scannt Verzeichnisse wie die Inbox nach Dokumenten. Liegt dieses auf einer HDD, wird diese nicht mehr ins Standby wechseln bzw. immer wieder geweckt. Lösung: 1. Wir legen Papermerge komplett auf in den Cache. Da Papermerge eher dafür gedacht ist, ein digitaler Ordner für fertige Unterlagen zu sein, sehe ich da kein Platzproblem. Hier landen Unterlagen im PDF Format, die eben rein zur Ablage gedacht sind. 2. Wir müssen die "Inbox" von Papermerge in ein anderes Verzeichnis umlenken. Dazu gleich mehr. Eins nach dem Anderen. Anleitung: 1. Installation Papermerge über die Community Apps Wenn ihr die Installation ausführt, kommt ihr zur Abfrage der Parameter. Hier ändern wir bei Bedarf, den Port (Standard = 8000, im Beispiel auf 9000 geändert, falls Port 8000 schon in Benutzung ist) und die Verzeichnisse. Wenn PM installiert ist, können wir uns nun mit http://Server-IP:Port an der Webgui anmelden. User: admin Passwort: admin 2. Admin User ändern - Ich benutze für Papermerge den Adminuser. Hier ändere ich lediglich das Passwort und den Namen des Admin. Beachtet, dass das Passwort nicht in diesem Fenster geändert werden kann. Obersten Satz im Bild lesen und auf den Link klicken. 3. Sprache auf Deutsch ändern und INBOX Verzeichnis umsetzen. Inbox Verzeichnis erstellen In unserem Beispiel, melden wir uns auf der Konsole unseres Unraid Servers an und erstellen das Verzeichnis "import" mit folgendem Befehl: "mkdir /mnt/user/appdata/papermerge/data/import" Das muss dann so aussehen: Alle Dateien, die wir nun über ein Script, manuell oder sonst wie, in dieses Verzeichnis "import" schieben, werden in unserer Inbox von Papermerge zur weiteren Verarbeitung angezeigt. Somit können wir alles Automatisieren was nötig ist. * Abholen der Daten aus z.B. der Cloud. Ich nutze "Scanner Pro" um z.B. mit dem Smartphone Dokumente einzuscannen und in die Dropbox zu legen. Von dort werden Sie auf den Server automatisch heruntergeladen. * Ablage über ein RSYNC Script im "import" Verzeichnis. * Automatische Einsortierung der Unterlagen, über den Workerprozess von Papermerge. Das Verzeichnis muss noch in das Konfigurationsfile von Papermerge eingetragen werden. Das machen wir aber in einem Zug, wenn wir gleich die Sprache von Papermerge umstellen. Papermerge auf Deutsch umstellen - Als erstes öffnen wir die Konsole des Papermerge "Containers" (nicht die des Unraid Servers). - Jetzt geben wir nachfolgenden Befehl ein und warten, bis die Installation des OCR in Deutsch fertig ist. "apt-get install tesseract-ocr-deu" (ohne Anführungszeichen). - Nun müssen wir die Konfigurationsdatei von Papermerge abändern. Wir tragen die Werte für die deutsche Sprache und für das Inbox Verzeichnis ein, bez ändern diese ab. IMPORTER_DIR ="/data/import" (Ändert das Inbox Verzeichnis. Ab nun werden Dokumente aus "import" in die Inbox des Superusers gesendet) OCR_DEFAULT_LANGUAGE = "deu" (Ändert die Sprache des OCR in Deutsch) OCR_LANGUAGES = { "deu": "Deutsch", } LANGUAGE_CODE = "de-DE" (Ändert die Anzeigesprache von Papermerge in Deutsch) So muss das am Ende aussehen... Jetzt können wir Papermerge neustarten und uns anschließend an der Webgui erneut anmelden. Damit ist Papermerge für die Verwendung auf Deutsch, auf der Cache-SSD, mit abgeänderter INBOX, vorbereitet. Sollte noch Interesse bestehen, wie man die Automatisierung in Papermerge verwendet... einfach bescheid geben. Die Anleitung wird noch überarbeitet. Ich wollte das jetzt einfach mal schnell schnell zusammenfassen. Ich hoffe es ist verständlich und hilft dem ein oder anderem weiter. Gruß P.S. Ich habe jetzt mal keine Sicherheitsrelevanten Dinge angesprochen, wie Verzeichnisberechtigungen ändern, oder DB Kennwörter. Darüber kann man gesondert diskutieren. Edited January 4, 2021 by Niaxa Bild entfernen 1 1 Quote Link to comment
Ford Prefect Posted January 4, 2021 Share Posted January 4, 2021 ...die manuelle Installation des deutschen OCR mit "apt-get ...." ist nicht notwendig, wenn man den "Dockermod" im template einstellt: ...dann macht/prüft der Docker das beim Start "automagisch". Quote Link to comment
Niaxa Posted January 4, 2021 Author Share Posted January 4, 2021 (edited) Danke für die Ergänzung. Der Parameter für die INBOX, kann ebenfalls dort hinterlegt werden. Irgendwie will das unterste Bild sich nicht aus der Anleitung entfernen lassen. Jetzt hat es geklappt. Edited January 4, 2021 by Niaxa Quote Link to comment
Zip Posted January 19, 2021 Share Posted January 19, 2021 On 1/4/2021 at 12:07 PM, Niaxa said: - Nun müssen wir die Konfigurationsdatei von Papermerge abändern. Wir tragen die Werte für die deutsche Sprache und für das Inbox Verzeichnis ein, bez ändern diese ab. Sorry für die blöde Frage, aber wie mache ich das am einfachsten? Kann ich das direkt aus Unraid ändern? die conf.py Datei kann Unraid nicht direkt öffnen? Quote Link to comment
Niaxa Posted January 19, 2021 Author Share Posted January 19, 2021 Das machst mit dem Terminal. Beachte aber auch, das es einfacher geht, wie es @Ford Prefect schon beschrieben hat. Ich war bis dahin nur noch nicht der Checker, was Docker angeht. Aber wie gesagt, kannst du beides machen. Gruß Chris Quote Link to comment
Zip Posted January 19, 2021 Share Posted January 19, 2021 (edited) Also ich habe es wie @Ford Prefect eingetragen (DOCKER_MODS, OCRLANG und TZ), allerdings ist in der Datei papermerge.conf.py noch Englisch hinterlegt. Daher muss ich diese noch ändern? Nur das herunterladen ("apt-get install tesseract-ocr-deu") kann ich mir doch sparen und den zweiten Schritt muss ich noch vornehmen? Und das ganze dann in der Console von papermerge? Einfach die die Befehle in die Console eingeben reicht nicht aus, da lässt er mich nicht weiter. Daher, was muss ich als blutiger Anfänger genau eingeben? Danke vorab! Edited January 19, 2021 by Zip Quote Link to comment
Niaxa Posted January 19, 2021 Author Share Posted January 19, 2021 Hi, Ich geb dir den Tipp... nimm die Parameter raus und mach alles wie ich es beschrieben habe. Erst die Docker Console öffnen. Dann gibst du den Befehl apt-get install tesseract-ocr-deu ein und anschließend öffnest du die Console von Unraid und bearbeitest das configfile. Das geht über nano oder vi. Weist du was das ist? Andernfalls können wir gerne was ausmachen und ich schalt mich per Teamviewer oder so kurz bei dir auf. vi papermerge.conf.py wenn di Datei offen ist "i" einmal drücken (der Insert Bearbeitungsmodus ist jetzt aktiv) OCR_DEFAULT_LANGUAGE = "deu" OCR_LANGUAGES = { "deu": "Deutsch", } LANGUAGE_CODE = "de-DE" einfügen. ESC drücken :wq! eingeben fertig Wenn du wie ich, deine Daten nicht immer manuell in der Weboberfläche hochladen willst, kannst du noch das Import Dir mit IMPORTER_DIR ="/deinVerzeichniss" angeben. Der Pfad beginnt ab deinem Papermerge Verzeichnis. Du musst also keine /mnt/user/appdata/papermerge davor setzen. Ich habe mir unter Papermerge einen Ordner data und darunter einen Ordner import erstellt. Damit lautet dann meine Variante IMPORTER_DIR ="/data/import" Gruß 1 Quote Link to comment
Ford Prefect Posted January 19, 2021 Share Posted January 19, 2021 ...der Template Parameter mit dem Docker-mod erspart Dir nur das apt-get Das wird, bei Eingabe im laufenden Container, ja nur dort gespeichert und nicht im Image. Bei einem Update des Image im Docker-Hub wäre das weg, da der Container gelöscht wird. ....die Umstellbarkeit, das DEU auch als Auswahl erscheint, macht man in der Tat nochmals extra in der papermerge.conf.py Quote Link to comment
Niaxa Posted January 19, 2021 Author Share Posted January 19, 2021 Stimmt. Deswegen die Parameter setzen und die Docker Anpassungen im Teplate hat er ja schon gemacht. Quote Link to comment
Zip Posted January 19, 2021 Share Posted January 19, 2021 Tausend Dank! Das Importverzeichnis werde ich gesondert einrichten. Quote Link to comment
Niaxa Posted January 19, 2021 Author Share Posted January 19, 2021 Verwechsle das import Verzeichnis nicht. Es handelt sich nicht um die Struktur in Papermerge. Sondern um das Verzeichnis, dass dann deine "inbox" ist. Auf dieses Verzeichnis, laufen deine Automatismen, welche dann deine Dateien, weiter verteilt. Quote Link to comment
Zip Posted January 20, 2021 Share Posted January 20, 2021 (edited) Ich habe nun auch das Inboxverzeichnis wie in deiner Anleitung geändert. Wenn ich eine passende Automatik in Papermerge hinterlegt habe, habe ich nun eine "One Touch" Lösung. Dafür habe ich mir einen scan User eingerichtet, der "nur" Zugriff auf appdata erhält. Dafür musste ich bei dem appdata Ordner noch unter Export --> Yes (hidden) einstellen. 1. Dokument einscannen ins Netzwerklaufwerk /data/import (Ich habe den Scanner Brother ADS-2800W per LAN bei mir Zuhause angeschlossen) 2. Papermerge erkennt den Beleg und legt ihn automatisch in den jeweiligen Ordner ab. 3. Fertig 🙂 Ist es eigentlich für SSD (=Cache) problematisch / schädlich, dass Papermerge darauf ständig zugreift und scannt ob neuen Dokumente vorhanden sind? Es soll ja bald Version 2.0 erscheinen. Hat schon jemand eine Info, ob der Abfrageintervall vielleicht sogar einstellbar ist? Edited January 20, 2021 by Zip Quote Link to comment
mgutt Posted January 21, 2021 Share Posted January 21, 2021 On 1/20/2021 at 10:45 AM, Zip said: Ist es eigentlich für SSD (=Cache) problematisch / schädlich, dass Papermerge darauf ständig zugreift und scannt ob neuen Dokumente vorhanden sind? Nein, weil nur gelesen wird. Quote Link to comment
hundsboog Posted January 25, 2021 Share Posted January 25, 2021 (edited) Hallo liebe Freunde, ich bin erst jetzt auf PM aufmerksam geworden. Ich habe mal ein paar grundsätzliche Fragen zur Etablierung von PM in meine bestehende Umgebung. Derzeit haben wir in unserem Office auf UnRaid Share-Freigaben (bspw. "Management" u. "Mitarbeiter"). Jetzt ist es so, dass ich gerne einen bestehenden Ordner, nennen wir ihn mal "Rechnungen", durchsuchbar machen möchte. Wenn ich es jetzt richtig verstanden habe, erreiche ich doch eben jenes mit Papermerge. Ich gebe also den Ordner Rechnungen im Docker Template an, PM jagt das OCR drüber, macht die Dateien durchsuchbar und lässt aber sonst alles wie es ist. Richtig? Ich habe jetzt mal wirklich ausgiebig in einem Testcontainer herumgespielt. Ich beantworte mir die Fragen mal selber, vielleicht hilft es ja jemanden, der eventuell die gleichen hat ;-). Hier ist es so, man lädt Dateien hoch oder lässt sie in ein "import" Verzeichnis schieben. Die Ursprungsdateien verbleiben aber wie in meinen Fall am Originalort. Es wird also eine neue Datenbank angelegt. Wenn dann mal eine Prüfung kommen sollte, bietet Papermerge aber in deŕ Webansicht an, einen Ordner im kompletten als .tar Datei herunter zu laden. Super! Wenn ich dann das richtige Dokument gefunden habe, kann ich auf Aktion->Download und bekomme das Dokument vom Urpsrungsordner heruntergeladen, korrekt? Nein, es wird aus der oben erwähnten Datenbank geladen. Wahlweise einzeln oder als .tar Archiv. Zweiter Use Case wäre folgender, wie es User @Zip macht: Ich habe Genius Scan, mit dem ich Belege und Quittungen auf meine Nextcloud hochlade in einen Ordner, der wiederum als external storage auf ein UnRaid Share verweist. Kann ich PM über die Automatisierung dann so einstellen, dass er die Quittung direkt aktiv weiterverschiebt? Also tatsächlich diesmal die Datei anfasst und physisch verschiebt? Das ist der eigentliche Sinn des Import Ordners. Habe ich noch nicht getestet, sollte ich aber! Bleibt mir alle gesund! hundsboog Edited January 25, 2021 by hundsboog 1 Quote Link to comment
Sedixo Posted February 21, 2021 Share Posted February 21, 2021 Hallo alle zusammen, ich komme hier leider nicht weiter. der Import Ordner ist angelegt und "apt-get install tesseract-ocr-deu" habe ich auch erfolgreich durchgeführt. Passwort ADMIN konnte ich ändern. Zum Problem: Ich habe keinen Eintrag mit "Docker Mode" oder "OCR Language" Wenn ich dann über den unraid Terminal gehe und "vi papermerge.conf.py" ausführe, erhalte ich eine gänzlich leeres Ergebnis. Weiter unten steht dann papermerge.conf.py [NEW FILE] Mein Weg zum Papierlosem Büro erschwert sich 😞 Kann mir vielleicht jemand sagen was ich falsch mache? Grüße Quote Link to comment
Ford Prefect Posted February 21, 2021 Share Posted February 21, 2021 1 hour ago, Sedixo said: Hallo alle zusammen, ich komme hier leider nicht weiter. der Import Ordner ist angelegt und "apt-get install tesseract-ocr-deu" habe ich auch erfolgreich durchgeführt. Passwort ADMIN konnte ich ändern. Zum Problem: Ich habe keinen Eintrag mit "Docker Mode" oder "OCR Language" ...warum nicht? Erspart einiges an Problemen....wird das Dockjer Image durch ein Update geändert, ist die tesseract installation erstmal weg und Du musst es noch mal machen. Mit dem Docker-mod macht es das System für Dich automagisch. 1 hour ago, Sedixo said: Wenn ich dann über den unraid Terminal gehe und "vi papermerge.conf.py" ausführe, erhalte ich eine gänzlich leeres Ergebnis. Weiter unten steht dann papermerge.conf.py [NEW FILE] ...dann bist Du schlicht im falschen Verzeichnis und die Datei liegt nicht dort, von wo aus Du den Editor aufrufst. Du musst ins Verzeichnis wechseln, dass im Template unter "Appdata" eingestellt ist (/wahrscheinlich /mnt/users/appdata/papermerge). Ein "ls -la" um mal zu sehen, ob die Datei auch da liegt kann auch nicht schaden. Quote Link to comment
Sedixo Posted February 21, 2021 Share Posted February 21, 2021 Vielen Dank für die Antwort. Was ich meine ist, das ich bei der papermerge Installation Keine docker Konfiguration habe wo docker Mode oder ocr language steht. Diese Menü Einträge sind bei mir nicht vorhanden, auch Timezone ist nicht vorhanden. Ich schau mir das nochmal wegen der config Datei Quote Link to comment
Ford Prefect Posted February 21, 2021 Share Posted February 21, 2021 ....ja, wenn Du die Parameter im Template nicht hast, dann erstelle diese einfach selbst/füge sie hinzu...screenshot hast Du ja oben Quote Link to comment
Hoddl Posted February 21, 2021 Share Posted February 21, 2021 (edited) bei mir ist es auch so wie bei Sedixo... ich hab zwar englisch zum auswählen doch leider nix anderes. Die papermerge.conf.py wollte ich erweitern doch ich finde diese einfach nicht... ich weis nicht wo ich sie finden kann. Im unraid oder im Docker-Container? so sieht es bei mir aus wenn ich ls -la ausführe im unraid terminal hier habe ich versehentlich die py datei erstellt :-) nun weis ich nicht wie ich diese löschen kann :-( Edited February 21, 2021 by Hoddl Quote Link to comment
Ford Prefect Posted February 21, 2021 Share Posted February 21, 2021 ...die config liegt irgendwo im Verzeichnisbaum unter dem Verzeichnis, welches im Template als "Appdata" bezeichnet ist...sie ist also lokal von unRAID aus sichtbar, aber auch in den Docker-Container gemappt. Man könnte sie also von beiden Seiten aus editieren, wenn man will ...unter unRaid, in der Shell, begebe man sich dorthin, zu dem Pfad, "welcher im eigenen, lokalen Template dort als Pfad konfiguriert ist" und mache *dort* das "ls -la" 1 Quote Link to comment
Hoddl Posted February 21, 2021 Share Posted February 21, 2021 danke hat funktioniert.... 1 Quote Link to comment
Hoddl Posted February 21, 2021 Share Posted February 21, 2021 On 1/4/2021 at 12:07 PM, Niaxa said: Sollte noch Interesse bestehen, wie man die Automatisierung in Papermerge verwendet... einfach bescheid geben. Die Anleitung wird noch überarbeitet. Ich wollte das jetzt einfach mal schnell schnell zusammenfassen. Ich hoffe es ist verständlich und hilft dem ein oder anderem weiter. Das wäre perfekt wenn Du hier noch weitere mit Deiner Anleitung machen kannst :-) Quote Link to comment
MartinG Posted February 22, 2021 Share Posted February 22, 2021 Interessantes Thema. Interessantes Programm. Aber too much to read. Frage: Wie greift ihr von unterwegs auf die gebrauchten Dokumente zu? Über die Weboberfläche des Dockers? Oder kann man das irgendwie mit Nextcloud/Owncloud/whatever verlinken? Quote Link to comment
Sedixo Posted February 25, 2021 Share Posted February 25, 2021 Ich habe es hinbekommen. Vielen Dank für eure Tipps. Am WE teste ich dann mal die ersten Scanns. Noch ne Frage. Wenn ich das richtig verstanden habe, landen die Scans innerhalb von Papermerge und diese werde auch dort organisiert. Oder habe ich das falsch verstanden? Ich hätte gerne zwar das Ganze innerhalb von Papermerge organisiert, möchte aber auch Zugriff per SMB auf die Inhalte. Wie kann ich das realisieren? Grüße Quote Link to comment
Ford Prefect Posted February 25, 2021 Share Posted February 25, 2021 ...die rohen scans bleiben natürlich auch erhalten. Papermerge macht einfach zusätzlich ein paar Informationen "auf" und verwaltet diese in der eigenen Datenbank. Der Scan (pdf, jpg, ...) wird beim import von papermerge vom Inbound- in das Data-Verzeichnis verschoben....das sollte ein share sein auf das Du auch "manuell" per SMB zugreifen kannst. Ich habe den Docker nicht mehr laufen, kann also nicht nachgucken...aber Du solltest mal im Verzeichnis(-Baum) des "Data Path" nachgucken (wohin dies auch immer zeigt im Docker-Template). Quote Link to comment
Recommended Posts
Join the conversation
You can post now and register later. If you have an account, sign in now to post with your account.
Note: Your post will require moderator approval before it will be visible.