Pdfgrep komandas PDF failu meklēšanai Linux terminālī

Operētājsistēmu pamatā ir komandrindas, kas piedāvā vairākas iespējas, kā palielināt izplatīšanas iespējas, veicot meklēšanu, administrācijas darbības, atbalstu un daudz ko citu.

Tieši viena no šīm iespējām ir saistīta ar iespēju meklēt noteiktu veidu failus Linux un tādējādi viegli piekļūt to saturam, tāpēc šodien mēs runāsim par pdfgrep, kas ir vērsta uz PDF failu meklēšanu.

Kas ir pdfgrepPdfgrep ir komandrindas utilīta, lai vienkāršā un funkcionālā veidā meklētu tekstu PDF failos, ietaupot laiku no piekļuves katram failam un teksta meklēšanas, izmantojot PDF rīkus.
Dažas tās īpašības ir:

  • Savietojams ar Grep, mēs varam izpildīt daudzus grep parametrus, piemēram, -r, -i, -n vai -c.
  • Iespēja meklēt tekstu vairākos PDF failos
  • Piedāvātās krāsas, šī GNU Grep krāsu opcija tiek atbalstīta un iespējota pēc noklusējuma.
  • Atbalsta regulāru izteiksmju izmantošanu.
  • Bezmaksas programmatūra

1. Instalējiet Pdfgrep operētājsistēmā Linux

1. darbība
Šajā gadījumā mēs izmantosim Ubuntu, kuram pietiek izpildīt šādu rindu. Tur mēs ievadām burtu S, lai akceptētu pakotņu lejupielādi un instalēšanu.

 sudo apt instalēt pdfgrep

2. solis
Citas instalēšanas iespējas ir šādas:

  • Lejupielādējiet .TAR.GZ failu, izmantojot šo saiti.

3. solis

  • Vai arī palaidiet šādu komandu:
 git klons https://gitlab.com/pdfgrep/pdfgrep.git
4. solis
Pēc tam ievadiet katru no šīm rindām to secībā:
 ./configure padarīt sudo make install

2. Izmantojiet Pdfgrep operētājsistēmā Linux

1. darbība
Kad pdfgrep ir instalēts, tā būs izmantojamā sintakse:

 pdfgrep [IESPĒJA…] PATTERN [FILE]
2. solis
Katrs no elementiem ir:
  • Opcija: norāda atribūtus, kurus, piemēram, varam pievienot meklēšanā -i vai -nometnes lieta, kas ignorē lielo un mazo burtu atšķirību starp mūsu norādīto modeli un failu, kam jāatbilst failam.
  • Modelis: norāda uz paplašinātu regulāro izteiksmi.
  • Fails: tas ir PDF fails, kurā jāveic meklēšana.

3. solis
Mēs sāksim ar vienkāršu meklēšanu, piemēram, meklēsim vārdu Solvetic failā Solvetic.pdf, šim nolūkam izpildām sekojošo:

 pdfgrep Solvetic Solvetic.pdf

PALIELINĀT

4. solis
Šajā gadījumā šis termins minētajā failā pastāv tikai vienu reizi, bet tagad mēs meklēsim terminu Windows oficiālā Microsoft PDF failā, un tas būs rezultāts:

PALIELINĀT

5. solis
Mēs redzam, ka meklētais vārds ir iezīmēts, kas atvieglo tā atrašanās vietu. Tagad, ja mēs pievienojam parametru -iekšā, Būs iespējams redzēt rezultātus ar lapas numuru, kurā šis termins ir konstatēts:

PALIELINĀT

6. darbība
Vēl viena iespēja, ko varam izmantot kopā ar pdfgrep, ir uzskaitīt PDF failu (-us), kas satur noteiktu terminu, tāpēc mēs izpildām sekojošo:

 pdfgrep Solvetic * pdf
7. solis
Tādā veidā tiks parādīts PDF fails, kas satur terminu Solvetic:

PALIELINĀT

8. solis
Ja mēs vēlamies atvērt PDF failu, mēs varam izpildīt šādu komandu:

 xdg-open (File.PDF)

PALIELINĀT

9. solis
Vispārīgās iespējas, ko mums piedāvā pdfgrep, ir šādas:

-i, --ignore-lietaIgnorēt burtu atšķirības gan avota, gan ievades failos.

-F,-fiksētas stīgasInterpretē PATTERN kā fiksētu virkņu sarakstu, kas atdalīts ar jaunām rindām.

-kešatmiņaIzmantojiet kešatmiņu atveidotam tekstam, lai paātrinātu darbību lielos failos.

-P, --perl-regexpInterpretē PATTERN kā ar Perl saderīgu regulāro izteiksmi (PCRE).

-H,-ar faila nosaukumuIzdrukājiet katras atbilstības faila nosaukumu.

-h, --no-faila nosaukumsIzspiež faila nosaukuma prefiksu.

-n, --lapas numursKatrai atbilstībai pievienojiet tās lapas numuru, kurā tika atrasts meklēšanas vienums.

-c, -skaitlisNomāc parasto izvadi un tā vietā izdrukā atbilstību skaitu katram ievades failam.

-p, -lapu skaitsIzdrukājiet atbilstību skaitu lapā. Tas nozīmē -n.

--KrāsaTas ļauj izcelt failu nosaukumus, lappušu numurus un atbilstošu tekstu ar dažādām secībām, lai terminālī tos parādītu krāsaini, dažas no iespējām ir Vienmēr, pakauša vai automātiska.

-o,-tikai saskaņošanaIzdrukājiet tikai atbilstošu līnijas daļu bez apkārtējā konteksta.

-r, -rekursīvsTas ļauj mums rekursīvi meklēt visus failus (ierobežoti ar --include un --exclude) katrā direktorijā, sekojot simboliskajām saitēm tikai tad, ja tie atrodas komandrindā.

-R,-rekursīva-atsauceTas pats kā -r, bet seko visām simboliskajām saitēm.

-kluss vai -qTas ļauj mums iziet no lietojumprogrammas.

Ar šo pdfgrep kļūst par ideālu risinājumu, strādājot ar PDF failiem Linux vidē.

Jums palīdzēs attīstību vietā, daloties lapu ar draugiem

wave wave wave wave wave