Diskussions- und Newsboard der Linux Interessen Gruppe Suletuxe
allgemeine Kategorie => Allgemeine Diskussionen => Thema von: Sebastian am 15. Juli 2022, 08:36:43

Titel: Grep on Steroids
Beitrag von: Sebastian am 15. Juli 2022, 08:36:43

Vor ein paar Tagen bin ich auf folgendem Artikel (https://gnulinux.ch/grep-on-steroids) gestoßen.

In kürze:

ripgrep-all sucht nach Strings, und unterstützt noch mehr Dateiformate zum Durchsuchen. Unter anderem PDF,DOCX,MP3,MP4 etc.


Code:

pacman -S ripgrep-all


Je nachdem welche Dateiformate man durchsuchbar machen möchte, werden folgende Abhängigkeiten gebraucht:


Code:

ffmpeg # Für Multimedia Formate (Subtitels etc.)
pandoc # .epub, .odt, .docx, .fb2, .ipynb
poppler # PDF
tesseract # Um Bilder mit Hilfe von OCR zu durchsuchen


Versteckte Dateien und Binärdateien werden um die Suche zu beschleunigen standardmäßig übersprungen. Sollen diese miteinbezogen werden, nutzt man folgende Optionen


Code:

--binary
-. , --hidden


Benutzen wird ripgrep-all ähnlich wie grep


Code:
rga [OPTIONS] PATTERN [PATH...]

Titel: Re:Grep on Steroids
Beitrag von: Andreas am 15. Juli 2022, 16:35:53

Genial. Damit ist mein selbstgeschriebenes Bash-Schript, das odt-Dokumente durchsuchen kann, obsolet geworden. Funktioniert einwandfrei. Leidglich mein Versuch rga mit "normaler grep-Syntax" aufzurufen führte zu einem Fehler - die Syntax ist leider nicht die gleiche. Aber egal - Klasse Tool!!

LG
Andreas


Diskussions- und Newsboard der Linux Interessen Gruppe Suletuxe | Powered by YaBB SE
© 2001-2003, YaBB SE Dev Team. All Rights Reserved.