If-Koubou

Cum se extrag imagini, text și fișiere încorporate din documente Word, Excel și PowerPoint

Cum se extrag imagini, text și fișiere încorporate din documente Word, Excel și PowerPoint (Cum să)

Spune că cineva ți-a trimis un document Word cu o mulțime de imagini și vrei să salvezi imaginile pe hard disk. Puteți extrage imagini dintr-un document Microsoft Office cu un truc simplu.

Dacă aveți un fișier Word (.docx), Excel (.xlsx) sau PowerPoint (.pptx) cu imagini sau alte fișiere încorporate, le puteți extrage (precum și textul documentului), fără a fi nevoie să salvați fiecare separat . Și, cel mai bine, nu aveți nevoie de niciun software suplimentar. Formatele de fișiere XML pe bază de Office - docx, xlsx și pptx - sunt de fapt arhive comprimate pe care le puteți deschide ca orice fișier .zip normal cu Windows. De acolo, puteți extrage imagini, text și alte fișiere încorporate. Aveți posibilitatea să utilizați Windows 'built-in .zip suport, sau o aplicație ca 7-Zip, dacă preferați.

Dacă aveți nevoie să extrageți fișiere dintr-un document de birou mai vechi - cum ar fi un fișier .doc, .xls sau .ppt - puteți să faceți acest lucru cu o mică bucată de software liber. Vom detalia acest proces la sfârșitul acestui ghid.

Cum se extrage conținutul unui fișier Office mai recent (.docx, .xlsx sau .pptx)

Pentru a accesa conținutul interior al unui document Office bazat pe XML, deschideți File Explorer (sau Windows Explorer în Windows 7), navigați la fișierul din care doriți să extrageți conținutul și selectați fișierul.

Apăsați "F2" pentru a redenumi fișierul și a schimba extensia (.docx, .xlsx sau .pptx) în ".zip". Lăsați partea principală a numelui fișierului singur. Apăsați pe "Enter" când ați terminat.

Următoarea casetă de dialog vă avertizează despre modificarea extensiei de nume de fișier. Faceți clic pe "Da".

Windows recunoaște automat fișierul ca fișier comprimat. Pentru a extrage conținutul fișierului, faceți clic dreapta pe fișier și selectați "Extract All" din meniul pop-up.

În caseta de dialog "Selectați o destinație și extrageți fișiere", calea în care va fi extras conținutul fișierului .zip va apărea în caseta de editare "Fișierele vor fi extrase în acest folder". În mod implicit, un dosar cu același nume ca și numele fișierului (fără extensia de fișier) este creat în același director ca fișierul .zip. Pentru a extrage fișierele într-un alt folder, faceți clic pe "Răsfoire".

Navigați în locul în care doriți să fie extras conținutul fișierului .zip, dând clic pe "Folder nou" pentru a crea un nou dosar, dacă este necesar. Dați clic pe "Selectați folderul".

Pentru a deschide o fereastră File Explorer (sau Windows Explorer) cu dosarul care conține fișierele extrase care arată odată ce acestea sunt extrase, bifați caseta de selectare "Afișați fișierele extrase când este finalizată", astfel că există o marcă de selectare în casetă. Faceți clic pe "Extragere".

Cum să accesați imaginile extrase

Inclusiv în conținutul extras este un folder numit "cuvânt", dacă fișierul original este un document Word (sau "xl" pentru un document Excel sau "ppt" pentru un document PowerPoint). Faceți dublu clic pe dosarul "cuvânt" pentru al deschide.

Faceți dublu clic pe dosarul "Media".

Toate imaginile din fișierul original se află în dosarul "media". Fișierele extrase sunt imaginile originale utilizate de document. În interiorul documentului, este posibil să fie setată redimensionarea sau alte setări ale proprietăților, dar fișierele extrase sunt imaginile brute fără ca aceste proprietăți să fie aplicate.

Cum să accesați textul extras

Dacă nu aveți instalat Office pe PC și trebuie să extrageți text dintr-un fișier Word (sau Excel sau PowerPoint), puteți accesa textul extras din fișierul "document.xml" din dosarul "word" .

Puteți deschide acest fișier într-un editor de text, cum ar fi Notepad sau WordPad, dar este mai ușor de citit într-un editor XML special, cum ar fi programul gratuit, Notepad XML. Tot textul din fișier este disponibil în bucăți de text simplu, indiferent de stil și / sau formatare aplicate în documentul în sine. Desigur, dacă veți descărca programe gratuite pentru a vedea acest text, puteți descărca LibreOffice, care poate citi documente Microsoft Office.

Cum se extrage obiecte integrate OLE sau fișiere atașate

Pentru a accesa fișierele încorporate într-un document Word atunci când nu aveți acces la Word, deschideți mai întâi fișierul Word în WordPad (care este integrat în Windows). S-ar putea să observați că unele pictograme de fișiere încorporate nu se afișează, dar sunt încă acolo. Unele dintre fișierele încorporate pot avea nume de fișiere parțiale. WordPad nu suportă toate funcțiile programului Word, astfel încât unele conținuturi ar putea fi afișate necorespunzător. Dar ar trebui să aveți acces la fișiere.

Dacă faceți clic dreapta pe unul dintre fișierele încorporate din exemplul nostru de fișier Word, una dintre opțiuni este "Open PDF Object". Aceasta deschide fișierul PDF în programul de citire PDF implicit de pe PC. De acolo, puteți salva fișierul PDF pe hard disk.

Dacă WordPad nu are opțiunea de deschidere a fișierului dvs., notați tipul de fișier aici. De exemplu, al doilea fișier din acest document este un fișier .mp3.

Apoi, reveniți la dosarul "Fișiere din [Document]" și faceți dublu clic pe dosarul "embeddings" din dosarul "word".

Din păcate, tipurile de fișiere nu sunt păstrate în nume de fișiere. Toți au în schimb o extensie de fișier ".bin". Dacă știți ce tipuri de fișiere sunt încorporate în fișier, puteți deduce probabil care fișier este care după mărimea fișierului. În exemplul nostru, am avut un fișier PDF și un fișier MP3 încorporat în documentul nostru. Deoarece fișierul MP3 este cel mai probabil mai mare decât fișierul PDF, ne putem da seama care este fișierul care, analizând dimensiunile fișierelor și apoi redenumit-le folosind extensiile corecte. Mai jos, redenumim fișierul MP3.

Rețineți că nu toate fișierele vor fi deschise în mod necesar utilizând acest proces - de exemplu, fișierul PDF a fost deschis corect din WordPad, dar nu am putut să îl deschidem prin redenumirea fișierului său .bin.

Odată ce ați extras conținutul fișierului zip, puteți reveni la extensia fișierului original înapoi la .docx, .xlsx sau .pptx. Fișierul va rămâne intact și poate fi deschis în mod normal în programul corespunzător.

Cum să extrageți imagini din documentele de birou mai vechi (.doc, .xls sau .ppt)

Dacă aveți nevoie să extrageți imagini dintr-un document Office 2003 (sau mai devreme), există un instrument gratuit numit Expert de extragere a imaginilor Office, care ușurează această sarcină. Acest program vă permite, de asemenea, să extrageți simultan imagini din mai multe documente (de aceleași sau diferite tipuri). Descărcați programul și instalați-l (există și o versiune portabilă dacă nu doriți să o instalați).

Rulați programul și se afișează ecranul de întâmpinare. Dați clic pe "Următorul".

În primul rând, trebuie să selectăm fișierul din care doriți să extrageți imaginile. În ecranul Input & Output, faceți clic pe butonul "Răsfoiți" (pictograma dosar) din partea dreaptă a casetei de editare a documentului.

Navigați la dosarul care conține documentul dorit, selectați-l și faceți clic pe "Deschidere".

Dosarul care conține fișierul selectat devine automat dosarul de ieșire. Pentru a crea un subfolder în acel folder numit același fișier selectat, faceți clic pe caseta de selectare "Creați un dosar aici", astfel că există un marcaj de selectare în casetă. Apoi, faceți clic pe "Următorul".

În ecranul Ready to Start, faceți clic pe "Start" pentru a începe extragerea imaginilor.

Următorul ecran se afișează în timpul proceselor de extracție.

În ecranul Terminat, faceți clic pe "Faceți clic aici pentru a deschide dosarul de destinație" pentru a vizualiza fișierele imagine rezultate.

Deoarece am ales să creăm un subfolder, primim un dosar care conține fișierele de imagini extrase din fișier.

Veți vedea toate imaginile ca fișiere numerotate.

De asemenea, puteți extrage imaginile din mai multe fișiere simultan. Pentru a face acest lucru, pe ecranul Input & Output, faceți clic pe caseta de selectare "Mod lot", astfel că există un marcaj de selectare în casetă.

Se afișează ecranul de introducere și ieșire lot. Faceți clic pe "Adăugați fișiere".

În caseta de dialog Deschidere, navigați la folderul care conține oricare dintre fișierele din care doriți să extrageți imagini, selectați fișierele utilizând tasta "Shift" sau "Ctrl" pentru a selecta mai multe fișiere și faceți clic pe "Deschidere".

Puteți adăuga fișiere dintr-un alt folder făcând din nou clic pe "Adăugați fișiere", navigând la dosarul din caseta de dialog Deschidere, selectând fișierele dorite și dând clic pe "Deschide".

Odată ce ați adăugat toate fișierele din care doriți să extrageți imagini, puteți alege să creați un folder separat pentru fiecare document din același director ca fiecare document în care vor fi salvate fișierele de imagine făcând clic pe "Creați un dosar pentru fiecare document ", astfel că în casetă există un marcaj de selectare.

De asemenea, puteți specifica directorul de ieșire să fie "același folder ca și fișierul de intrare" sau să introduceți sau să selectați un folder personalizat utilizând caseta de editare și butonul "Răsfoiți" sub această opțiune. Dați clic pe "Următorul" după ce ați selectat opțiunile dorite.

Faceți clic pe "Start" din ecranul Ready to start.

Se afișează următorul ecran care arată progresul extracției.

Numărul de imagini extrase se afișează pe ecranul Finalizat. Faceți clic pe "Închidere" pentru a închide Expertul de extragere a imaginii Office.

Dacă ați ales să creați un folder separat pentru fiecare document, veți vedea foldere cu aceleași nume ca și fișierele care conțin imaginile, indiferent de dosarul de ieșire specificat (e).

Din nou, obținem toate imaginile ca fișiere numerotate pentru fiecare document.

Acum puteți redenumi imaginile, le puteți muta și le puteți folosi în propriile documente. Asigurați-vă că aveți dreptul să le utilizați legal.