Kategorien
Software

Mehrere PDFs auf einmal durchsuchen!

Da stand ich gerade vor dem Problem, dass ich eine relativ komplexe Beschaffung nach einem bestimmten Produkt und dessen Lieferanten durchsuchen wollte. Jetzt umfasst dieser Beschaffungsantrag aber nicht einen Auftrag, sondern rund 18 Einzelaufträge an die verschiedensten Firmen. Versuche mit der Windows Suche schlugen fehl, diese indexiert wohl keine PDF inhaltlich – oder zumindest bei mir tut sie das nicht. Aber siehe da, der Acrobat Reader kann das:

  1. Mit der Tastenkombination [Strg] + [Shift] + [F] ruft man die Suchmaske auf
  2. Auswahl von “Alle PDF-Dokuemnte in”
  3. Ordner oder Pfad mit den PDFs auswählen
  4. Suchwort eingeben und ggfs. Optionen entsprechend setzen.
  5. Suchen & hoffentlich finden! 🙂
Suchmaske im Acrobat Reader

Von Christian Nölle

Christian Nölle ist Abteilungsleiter im ZIM an der Uni Wuppertal und verantwortlich für die Bereiche Anwendungen, E-Learning, Qualifizierung und Support.

2 Antworten auf „Mehrere PDFs auf einmal durchsuchen!“

Vielleicht einmal für Menschen, die unixoide OS in Gebrauch haben:
Installieren Sie pdfgrep mit Ihrem Paketmanager. Die folgenden Beispiele stammen aus dem Manual (man pdfgrep). Dies alles ist möglich, ohne ein Anzeigeprogramm für PDF-Dokument zu nutzen.

Print the first ten lines matching pattern and print their page number:
pdfgrep -n –max-count 10 pattern foo.pdf

Search all .pdf files whose names begin with foo recursively in the current directory:
pdfgrep -r –include “foo*.pdf” pattern

Search all PDFs in the current directory for foo that also contain bar:
pdfgrep -Z –files-with-matches “bar” *.pdf | xargs -0 pdfgrep -H foo

Search all .pdf files that are smaller than 12M recursively in the current directory:
find . -name “*.pdf” -size -12M -print0 | xargs -0 pdfgrep pattern

Note that in contrast to the previous examples, this task could not be solved with pdfgrep alone, but the Unix tools find(1) and xargs(1) had to be used. That’s because pdfgrep itself doesn’t include options to exclude files by their size. But as you see, it doesn’t have to!

Natürlich! Danke für den Hinweis.
Das Ganze geht natürlich auch wunderbar ganz ohne Adobe unter Windows. 😉 pdfgrep lässt sich bei aktiviertem Windows-Subsystem für Linux und einer installieren Distribution eben dort installieren und dann auch in der Windowswelt nutzen. Mal sehen, mach ich vielleicht noch ‘nen Artikel draus.

Kommentare sind geschlossen.