Aveți posibilitatea să convertiți cu ușurință fișierele PDF în text editabil în Linux utilizând instrumentul de linie de comandă "pdftotext". Cu toate acestea, dacă există imagini în fișierul PDF original, acestea nu sunt extrase. Pentru a extrage imagini dintr-un fișier PDF, puteți utiliza un alt instrument de linie de comandă numit "pdfimages".
NOTĂ: Când spunem să tastați ceva în acest articol și există citate în jurul textului, NU introduceți ghilimele, dacă nu specificăm altceva.
Instrumentul "pdfimages" face parte din pachetul poppler-utils. Puteți verifica dacă este instalat în sistemul dvs. și îl instalați, dacă este necesar, utilizând pașii descriși în acest articol.
Pentru a extrage imagini dintr-un fișier PDF folosind fișiere pdf, apăsați "Ctrl + Alt + T" pentru a deschide o fereastră Terminal. Tastați următoarea comandă la prompt.
pdfimages /home/lori/Documents/SampleWithImages.pdf / home / lori / Documente / ExtractedImages / imagine
NOTĂ: Pentru toate comenzile afișate în acest articol, înlocuiți prima cale din comandă și numele fișierului PDF cu calea și numele fișierului pentru fișierul PDF original. Cea de-a doua cale ar trebui să fie calea spre directorul rădăcină în care doriți să salvați imaginile extrase. Cuvântul "imagine" de la sfârșitul celei de-a doua căi reprezintă ceea ce vreți să faceți cu numele dvs. de fișier. Numele de fișiere ale imaginilor sunt numerotate automat (000, 001, 002, 003, etc.). Dacă doriți să adăugați text la începutul fiecărei imagini, introduceți textul respectiv la sfârșitul celei de-a doua căi. În exemplul nostru, fiecare fișier imagine va începe cu "imagine", cum ar fi image-001.ppm, image-002.ppm, etc. Se adaugă o linie între textul pe care îl specificați și numărul.
Formatul de imagine implicit este PPM (pixmap portabil) pentru imagini non-monocrome sau PBM (bitmap portabil) pentru imagini monocrome. Aceste formate sunt concepute pentru a fi ușor de schimbat între platforme.
NOTĂ: Puteți obține două fișiere imagine pentru fiecare imagine din fișierul PDF. Cea de-a doua imagine pentru fiecare imagine este necompletată, deci veți putea afla care imagini conțin imaginile din fișier prin miniatură din fișier din Manager fișiere.
Pentru a crea fișiere de imagine .jpg, adăugați opțiunea "-j" comenzii, după cum se arată mai jos.
pdfimages -j /home/lori/Documents/SampleWithImages.pdf / home / lori / Documente / ExtractedImages / imagine
NOTĂ: De asemenea, puteți modifica ieșirea implicită în PNG utilizând opțiunea "-png" sau TIFF utilizând opțiunea "-tiff".
Fișierul principal de imagine pentru fiecare imagine este salvat ca fișier .jpg. A doua imagine necompletată este încă un fișier .ppm sau .pbm.
Dacă doriți doar să convertiți imagini pe și după o anumită pagină, utilizați opțiunea "-f" cu un număr pentru a indica prima pagină de conversie, așa cum se arată în exemplul de mai jos.
pdfimages -f 2 -j /home/lori/Documents/SampleWithImages.pdf / home / lori / Documente / ExtractedImages / imagine
NOTĂ: Am combinat opțiunea "-j" cu opțiunea "-f" astfel încât să obținem imagini .jpg și am făcut același lucru și cu opțiunea "-l" menționată mai jos.
Pentru a converti toate imaginile înainte și pe o anumită pagină, utilizați opțiunea "-l" (o literă "L", nu "1") cu un număr pentru a indica ultima pagină de conversie, după cum se arată mai jos.
pdfimages -l 1 -j /home/lori/Documents/SampleWithImages.pdf / home / lori / Documente / ExtractedImages / imagine
NOTĂ: Puteți utiliza împreună opțiunile "-f" și "-l" pentru a converti imagini într-un anumit interval de pagini în mijlocul documentului.
Dacă există o parolă de proprietar în fișierul PDF, utilizați opțiunea "-opw" și parola în ghilimele simple, după cum se arată mai jos. Dacă parola din fișierul PDF este o parolă de utilizator, utilizați în schimb opțiunea "-upw" cu parola.
NOTĂ: Asigurați-vă că există citate simple în jurul parolei în comandă.
pdfimages -pw 'parola' -j /home/lori/Documents/SampleWithImages.pdf / home / lori / Documente / ExtractedImages / imagine
Pentru mai multe informații despre utilizarea comenzii pdfimages, tastați "pdfimages" la prompt într-o fereastră Terminal și apăsați "Enter". Se afișează utilizarea comenzii cu o listă de opțiuni disponibile pentru utilizare în comandă.