Papermerge Anleitung


Recommended Posts

Hallo zusammen,

 

da ich mein Papermerge jetzt so eingerichtet habe, wie ich es haben möchte, dachte ich mir ich gebe euch eine Kurzanleitung für die Grundkonfiguration.

 

Problem:

Der worker von PM scannt Verzeichnisse wie die Inbox nach Dokumenten. Liegt dieses auf einer HDD, wird diese nicht mehr ins Standby wechseln bzw. immer wieder geweckt.

 

Lösung:

1. Wir legen Papermerge komplett auf in den Cache. Da Papermerge eher dafür gedacht ist, ein digitaler Ordner für fertige Unterlagen zu sein, sehe ich da kein Platzproblem. Hier landen Unterlagen im PDF Format, die eben rein zur Ablage gedacht sind.

 

2. Wir müssen die "Inbox" von Papermerge in ein anderes Verzeichnis umlenken. Dazu gleich mehr. Eins nach dem Anderen.

 

Anleitung:

 

1. Installation Papermerge über die Community Apps

 

Wenn ihr die Installation ausführt, kommt ihr zur Abfrage der Parameter. Hier ändern wir bei Bedarf, den Port (Standard = 8000, im Beispiel auf 9000 geändert, falls Port 8000 schon in Benutzung ist) und die Verzeichnisse. 

 

image.thumb.png.eeb1fe83409037fc38276c07225f06bd.png

 

Wenn PM installiert ist, können wir uns nun mit http://Server-IP:Port an der Webgui anmelden. 

User: admin

Passwort: admin

 

2. Admin User ändern

 

- Ich benutze für Papermerge den Adminuser. Hier ändere ich lediglich das Passwort und den Namen des Admin.

image.thumb.png.ba6389cdec68acaca82cfa5cf96a2fc8.png

 

Beachtet, dass das Passwort nicht in diesem Fenster geändert werden kann. Obersten Satz im Bild lesen und auf den Link klicken.

 

3. Sprache auf Deutsch ändern und INBOX Verzeichnis umsetzen.

 

Inbox Verzeichnis erstellen

 

In unserem Beispiel, melden wir uns auf der Konsole unseres Unraid Servers an und erstellen das Verzeichnis "import" mit folgendem Befehl:

"mkdir /mnt/user/appdata/papermerge/data/import"

 

Das muss dann so aussehen:

 

image.png.4714413343a8b89d66b68483ebb02368.png

 

Alle Dateien, die wir nun über ein Script, manuell oder sonst wie, in dieses Verzeichnis "import" schieben, werden in unserer Inbox von Papermerge zur weiteren Verarbeitung angezeigt. Somit können wir alles Automatisieren was nötig ist.

 

* Abholen der Daten aus z.B. der Cloud.

Ich nutze "Scanner Pro" um z.B. mit dem Smartphone Dokumente einzuscannen und in die Dropbox zu legen. Von dort werden Sie auf den Server automatisch heruntergeladen.

* Ablage über ein RSYNC Script im "import" Verzeichnis.

* Automatische Einsortierung der Unterlagen, über den Workerprozess von Papermerge. 

 

Das Verzeichnis muss noch in das Konfigurationsfile von Papermerge eingetragen werden. Das machen wir aber in einem Zug, wenn wir gleich die Sprache von Papermerge umstellen.

 

Papermerge auf Deutsch umstellen

 

- Als erstes öffnen wir die Konsole des Papermerge "Containers" (nicht die des Unraid Servers).

image.png.5653a82daa95f223ce87a25cc8823914.png

 

- Jetzt geben wir nachfolgenden Befehl ein und warten, bis die Installation des OCR in Deutsch fertig ist. 

"apt-get install tesseract-ocr-deu" (ohne Anführungszeichen).

 

- Nun müssen wir die Konfigurationsdatei von Papermerge abändern. Wir tragen die Werte für die deutsche Sprache und für das Inbox Verzeichnis ein, bez ändern diese ab.

 

IMPORTER_DIR ="/data/import" (Ändert das Inbox Verzeichnis. Ab nun werden Dokumente aus "import" in die Inbox des Superusers gesendet)

OCR_DEFAULT_LANGUAGE = "deu" (Ändert die Sprache des OCR in Deutsch)

OCR_LANGUAGES = {
    "deu": "Deutsch",
}
LANGUAGE_CODE = "de-DE"
(Ändert die Anzeigesprache von Papermerge in Deutsch)

 

So muss das am Ende aussehen...

 

image.png.a005ccd92cfe05830e34a17c58744fa0.png

 

Jetzt können wir Papermerge neustarten und uns anschließend an der Webgui erneut anmelden. Damit ist Papermerge für die Verwendung auf Deutsch, auf der Cache-SSD, mit abgeänderter INBOX, vorbereitet.

 

Sollte noch Interesse bestehen, wie man die Automatisierung in Papermerge verwendet... einfach bescheid geben. Die Anleitung wird noch überarbeitet. Ich wollte das jetzt einfach mal schnell schnell zusammenfassen. Ich hoffe es ist verständlich und hilft dem ein oder anderem weiter. 

 

Gruß 

 

P.S. Ich habe jetzt mal keine Sicherheitsrelevanten Dinge angesprochen, wie Verzeichnisberechtigungen ändern, oder DB Kennwörter. Darüber kann man gesondert diskutieren.

 

 

Edited by Niaxa
Bild entfernen
  • Like 1
  • Thanks 1
Link to comment
  • 2 weeks later...
On 1/4/2021 at 12:07 PM, Niaxa said:

- Nun müssen wir die Konfigurationsdatei von Papermerge abändern. Wir tragen die Werte für die deutsche Sprache und für das Inbox Verzeichnis ein, bez ändern diese ab.

Sorry für die blöde Frage, aber wie mache ich das am einfachsten? Kann ich das direkt aus Unraid ändern? die conf.py Datei kann Unraid nicht direkt öffnen?

Link to comment

Also ich habe es wie @Ford Prefect eingetragen (DOCKER_MODS, OCRLANG und TZ), allerdings ist in der Datei papermerge.conf.py noch Englisch hinterlegt. Daher muss ich diese noch ändern? Nur das herunterladen ("apt-get install tesseract-ocr-deu") kann ich mir doch sparen und den zweiten Schritt muss ich noch vornehmen? Und das ganze dann in der Console von papermerge? Einfach die die Befehle in die Console eingeben reicht nicht aus, da lässt er mich nicht weiter. Daher, was muss ich als blutiger Anfänger genau eingeben?

 

Danke vorab! 

 

 

image.thumb.png.d268fa520df88342800f3881e9aafdf7.png

 

 

 

Edited by Zip
Link to comment

Hi,

 

Ich geb dir den Tipp... nimm die Parameter raus und mach alles wie ich es beschrieben habe. Erst die Docker Console öffnen. Dann gibst du den Befehl apt-get install tesseract-ocr-deu ein und anschließend öffnest du die Console von Unraid und bearbeitest das configfile. Das geht über nano oder vi. Weist du was das ist? Andernfalls können wir gerne was ausmachen und ich schalt mich per Teamviewer oder so kurz bei dir auf.

 

  • vi papermerge.conf.py
  • wenn di Datei offen ist "i" einmal drücken (der Insert Bearbeitungsmodus ist jetzt aktiv)
  • OCR_DEFAULT_LANGUAGE = "deu"

    OCR_LANGUAGES = {
        "deu": "Deutsch",
    }
    LANGUAGE_CODE = "de-DE" 
    einfügen.

  • ESC drücken

  • :wq! eingeben

  • fertig

Wenn du wie ich, deine Daten nicht immer manuell in der Weboberfläche hochladen willst, kannst du noch das Import Dir mit IMPORTER_DIR ="/deinVerzeichniss" angeben. Der Pfad beginnt ab deinem Papermerge Verzeichnis. Du musst also keine /mnt/user/appdata/papermerge davor setzen. Ich habe mir unter Papermerge einen Ordner data und darunter einen Ordner import erstellt. Damit lautet dann meine Variante IMPORTER_DIR ="/data/import"

 

Gruß

 

 

  • Like 1
Link to comment

...der Template Parameter mit dem Docker-mod erspart Dir nur das apt-get

Das wird, bei Eingabe im laufenden Container, ja nur dort gespeichert und nicht im Image.

Bei einem Update des Image im Docker-Hub wäre das weg, da der Container gelöscht wird.

 

....die Umstellbarkeit, das DEU auch als Auswahl erscheint, macht man in der Tat nochmals extra in der papermerge.conf.py

Link to comment

Ich habe nun auch das Inboxverzeichnis wie in deiner Anleitung geändert.

 

Wenn ich eine passende Automatik in Papermerge hinterlegt habe, habe ich nun eine "One Touch" Lösung. Dafür habe ich mir einen scan User eingerichtet, der "nur" Zugriff auf appdata erhält. Dafür musste ich bei dem appdata Ordner noch unter Export --> Yes (hidden) einstellen.

 

1. Dokument einscannen ins Netzwerklaufwerk /data/import (Ich habe den Scanner Brother ADS-2800W per LAN bei mir Zuhause angeschlossen)

2. Papermerge erkennt den Beleg und legt ihn automatisch in den jeweiligen Ordner ab.

3. Fertig 🙂

 

Ist es eigentlich für SSD (=Cache) problematisch / schädlich, dass Papermerge darauf ständig zugreift und scannt ob neuen Dokumente vorhanden sind? Es soll ja bald Version 2.0 erscheinen. Hat schon jemand eine Info, ob der Abfrageintervall vielleicht sogar einstellbar ist?

 

 

 

Edited by Zip
Link to comment

Hallo liebe Freunde,

 

ich bin erst jetzt auf PM aufmerksam geworden. Ich habe mal ein paar grundsätzliche Fragen zur Etablierung von PM in meine bestehende Umgebung. Derzeit haben wir in unserem Office auf UnRaid Share-Freigaben (bspw. "Management" u. "Mitarbeiter"). Jetzt ist es so, dass ich gerne einen bestehenden Ordner, nennen wir ihn mal "Rechnungen", durchsuchbar machen möchte.

 

 

Wenn ich es jetzt richtig verstanden habe, erreiche ich doch eben jenes mit Papermerge. Ich gebe also den Ordner Rechnungen im Docker Template an, PM jagt das OCR drüber, macht die Dateien durchsuchbar und lässt aber sonst alles wie es ist. Richtig?

 

Ich habe jetzt mal wirklich ausgiebig in einem Testcontainer herumgespielt. Ich beantworte mir die Fragen mal selber, vielleicht hilft es ja jemanden, der eventuell die gleichen hat ;-). Hier ist es so, man lädt Dateien hoch oder lässt sie in ein "import" Verzeichnis schieben. Die Ursprungsdateien verbleiben aber wie in meinen Fall am Originalort. Es wird also eine neue Datenbank angelegt. Wenn dann mal eine Prüfung kommen sollte, bietet Papermerge aber in deŕ Webansicht an, einen Ordner im kompletten als .tar Datei herunter zu laden. Super!

 

Wenn ich dann das richtige Dokument gefunden habe, kann ich auf Aktion->Download und bekomme das Dokument vom Urpsrungsordner heruntergeladen, korrekt?

 

Nein, es wird aus der oben erwähnten Datenbank geladen. Wahlweise einzeln oder als .tar Archiv.

 

Zweiter Use Case wäre folgender, wie es User @Zip macht: Ich habe Genius Scan, mit dem ich Belege und Quittungen auf meine Nextcloud hochlade in einen Ordner, der wiederum als external storage auf ein UnRaid Share verweist. Kann ich PM über die Automatisierung dann so einstellen, dass er die Quittung direkt aktiv weiterverschiebt? Also tatsächlich diesmal die Datei anfasst und physisch verschiebt?

 

Das ist der eigentliche Sinn des Import Ordners. Habe ich noch nicht getestet, sollte ich aber!

 

Bleibt mir alle gesund!

 

hundsboog

Edited by hundsboog
  • Like 1
Link to comment
  • 4 weeks later...

Hallo alle zusammen,

 

ich komme hier leider nicht weiter.

der Import Ordner ist angelegt und "apt-get install tesseract-ocr-deu" habe ich auch erfolgreich durchgeführt.

Passwort ADMIN konnte ich ändern.

 

Zum Problem:

Ich habe keinen Eintrag mit "Docker Mode" oder "OCR Language"

Wenn ich dann über den unraid Terminal gehe und "vi papermerge.conf.py" ausführe, erhalte ich eine gänzlich leeres Ergebnis. Weiter unten steht dann papermerge.conf.py [NEW FILE]

 

Mein Weg zum Papierlosem Büro erschwert sich 😞

 

Kann mir vielleicht jemand sagen was ich falsch mache?

 

Grüße

Link to comment
1 hour ago, Sedixo said:

Hallo alle zusammen,

 

ich komme hier leider nicht weiter.

der Import Ordner ist angelegt und "apt-get install tesseract-ocr-deu" habe ich auch erfolgreich durchgeführt.

Passwort ADMIN konnte ich ändern.

 

Zum Problem:

Ich habe keinen Eintrag mit "Docker Mode" oder "OCR Language"

...warum nicht? Erspart einiges an Problemen....wird das Dockjer Image durch ein Update geändert, ist die tesseract installation erstmal weg und Du musst es noch mal machen.

Mit dem Docker-mod macht es das System für Dich automagisch.

 

1 hour ago, Sedixo said:

Wenn ich dann über den unraid Terminal gehe und "vi papermerge.conf.py" ausführe, erhalte ich eine gänzlich leeres Ergebnis. Weiter unten steht dann papermerge.conf.py [NEW FILE]

...dann bist Du schlicht im falschen Verzeichnis und die Datei liegt nicht dort, von wo aus Du den Editor aufrufst.

Du musst ins Verzeichnis wechseln, dass im Template unter "Appdata" eingestellt ist (/wahrscheinlich /mnt/users/appdata/papermerge).

Ein "ls -la" um mal zu sehen, ob die Datei auch da liegt kann auch nicht schaden.;-)

 

Link to comment

Vielen Dank für die Antwort. 

Was ich meine ist, das ich bei der papermerge Installation Keine docker Konfiguration habe wo docker Mode oder ocr language steht. 

Diese Menü Einträge sind bei mir nicht vorhanden, auch Timezone ist nicht vorhanden. 

 

Ich schau mir das nochmal wegen der config Datei 

Link to comment

bei mir ist es auch so wie bei Sedixo... ich hab zwar englisch zum auswählen doch leider nix anderes.

Die papermerge.conf.py wollte ich erweitern doch ich finde diese einfach nicht... ich weis nicht wo ich sie finden kann. Im unraid oder im Docker-Container? 

 

so sieht es bei mir aus wenn ich ls -la ausführe im unraid terminal

 

hier habe ich versehentlich die py datei erstellt :-) nun weis ich nicht wie ich diese löschen kann :-(

image.thumb.png.88db1f84159c1ecda3f81aef1cb39ccd.png

Edited by Hoddl
Link to comment

...die config liegt irgendwo im Verzeichnisbaum unter dem Verzeichnis, welches im Template als "Appdata" bezeichnet ist...sie ist also lokal von unRAID aus sichtbar, aber auch in den Docker-Container gemappt.

Man könnte sie also von beiden Seiten aus editieren, wenn man will ;-)

 

image.thumb.png.c48d5fd7cf06860650bf805abe56fca9.png

 

...unter unRaid, in der Shell, begebe man sich dorthin, zu dem Pfad, "welcher im eigenen, lokalen Template dort als Pfad konfiguriert ist" und mache *dort* das "ls -la" ;-)

  • Haha 1
Link to comment
On 1/4/2021 at 12:07 PM, Niaxa said:

 

 

Sollte noch Interesse bestehen, wie man die Automatisierung in Papermerge verwendet... einfach bescheid geben. Die Anleitung wird noch überarbeitet. Ich wollte das jetzt einfach mal schnell schnell zusammenfassen. Ich hoffe es ist verständlich und hilft dem ein oder anderem weiter. 

 

 

 

 Das wäre perfekt wenn Du hier noch weitere mit Deiner Anleitung machen kannst :-)

Link to comment

Ich habe es hinbekommen.

Vielen Dank für eure Tipps.

 

Am WE teste ich dann mal die ersten Scanns.

Noch ne Frage. 

Wenn ich das richtig verstanden habe, landen die Scans innerhalb von Papermerge und diese werde auch dort organisiert.

Oder habe ich das falsch verstanden?

Ich hätte gerne zwar das Ganze innerhalb von Papermerge organisiert, möchte aber auch Zugriff per SMB auf die Inhalte.

Wie kann ich das realisieren?

 

Grüße

 

 

Link to comment

...die rohen scans bleiben natürlich auch erhalten.

Papermerge macht einfach zusätzlich ein paar Informationen "auf" und verwaltet diese in der eigenen Datenbank.

Der Scan  (pdf, jpg, ...) wird beim import von papermerge vom Inbound- in das Data-Verzeichnis verschoben....das sollte ein share sein auf das Du auch "manuell" per SMB zugreifen kannst.

 

Ich habe den Docker nicht mehr laufen, kann also nicht nachgucken...aber Du solltest mal im Verzeichnis(-Baum) des "Data Path" nachgucken (wohin dies auch immer zeigt im Docker-Template).

Link to comment

Join the conversation

You can post now and register later. If you have an account, sign in now to post with your account.
Note: Your post will require moderator approval before it will be visible.

Guest
Reply to this topic...

×   Pasted as rich text.   Restore formatting

  Only 75 emoji are allowed.

×   Your link has been automatically embedded.   Display as a link instead

×   Your previous content has been restored.   Clear editor

×   You cannot paste images directly. Upload or insert images from URL.