Dacă reacția dvs. la moartea anunțată a Google Reader a fost să țipați "Dar articolele cu stea! ", Atunci acesta este tutorialul pentru tine. Citiți mai departe pe măsură ce vă vom arăta mai multe modalități de a extrage toate articolele dvs. cu stea cu stea din Google Reader.
Google Reader se închide la 1 iulie. Dacă dvs., ca și milioane de fani RSS de pe tot globul, ați fost un fan Google Reader, există o șansă bună să utilizați funcția stea pentru a atrage atenția asupra articolelor pe care să le păstrați, să le citiți mai târziu sau în alte scopuri.
Dacă doriți să fiți siguri că toate articolele marcate cu stea sunt sigure și sănătoase în ciuda implinirii iminente a programului Google Reader, va trebui să efectuați câțiva pași minori pentru a vă asigura că aveți datele aflate în posesia dvs. și nu vă lăsați să putrezească Servere Google.
Când ați terminat cu următorul tutorial, veți avea (cel puțin) un fișier care conține toate elementele dvs. marcate cu stea și (în funcție de segmentul tutorialului pe care decideți să îl urmați împreună) articolele dvs. cu stea într-un mod mai ușor de utilizat, un format prietenos.
Există un lucru pe care nici un pic de exportator sau magia automatizării nu îl poate ajuta, totuși, și de fapt procesează conținutul articolelor cu stea. Dacă ați jucat articole pentru a citi mai târziu de ani de zile, probabil că veți fi șocați de câte articole exportate generează acest proces. S-ar putea să trebuiască să vă lăsați puțin timp în fiecare zi timp de câteva săptămâni pentru a săpărați bitul rezultat.
Prima ordine de afaceri este să obțineți direct o copie a tuturor datelor dvs. Google Reader aflate în posesia dvs. În acest fel, indiferent ce se întâmplă în viitor cu datele dvs. Reader de pe serverele Google, veți avea o copie a acesteia cu care să lucrați.
Google Takeout este un instrument excelent pentru extragerea datelor dvs. de la tot felul de servicii Google, dar suntem interesați doar de cititorul pentru acest tutorial. Accesați aici subsecțiunea Reader a instrumentului Google Takeout. Va dura un moment pentru a calcula dimensiunea fișierului Takeout. După ce terminați, faceți clic pe Creare arhivă.
În ciuda faptului că nu vă exporta întregul cont Google, ci doar o mică parte a acestuia, procesul durează o perioadă surprinzător de lungă. Vă recomandăm să verificați "Trimiteți-mi un e-mail atunci când sunteți gata" și să luați o ceașcă de cafea.
După ce faceți totul, faceți clic pe butonul Descărcare care apare în colțul din dreapta jos.
Continuați și extrageți arhiva într-un director de lucru, cum ar fi My Documents, și puneți arhiva într-un loc sigur. Fișierele de arhivă sunt aranjate astfel:
[email protected].
... [email protected]
... Reader
... followers.json
... follow.json
... liked.json
... notes.json
... shared-by-followers.json
... shared.json
... starred.json
... subscriptions.xml
Există două tipuri de fișiere în arhivă: JSON și XML. Fișierele JSON (JavaScript Object Notation) sunt pur și simplu un tip de format de transfer de date și fișierele XML (Extensible Markup Language) sunt un mod la îndemână de a marca un document astfel încât să poată fi citit atât de mașină, cât și de om. Fișierul cel mai interesat pentru acest tutorial este fișierul starred.json, deoarece conține toate intrările pentru elementele cu stea.
O importanță egală în marea schemă de eliberare a datelor de la Google Reader și de mutare pe pășuni mai verzi este totuși fișierul subscriptions.xml. Acest fișier conține toate abonamentele dvs. RSS și, dacă doriți să importați toate abonamentele vechi de la Google Reader într-o nouă aplicație RSS, acesta este fișierul pe care îl veți folosi. Mențineți cu siguranță (și arhiva originală descărcată de la Google Takeout) într-un loc sigur.
Una dintre modalitățile cele mai ușoare de a face față fișierului JSON este utilizarea JSONview (o extensie disponibilă pentru Firefox și Chrome). Această metodă este cea mai potrivită pentru cititorii care au un număr mic de articole cu stea în Google Reader (mai puțin de 1000).
Instalați extensia pentru browserul dvs. și apoi trageți și plasați fișierul starred.json într-un nou panou de browser. Salvați fișierul rezultat ca document HTML. Apoi, puteți întoarce în jur și puteți importa documentul HTML în browser-ul dvs. de web ales și va importa toate link-urile ca marcaj nou.
Există însă două dezavantaje ale acestei tehnici. Primul este că veți ajunge la unele adrese URL duplicate în fișierul dvs. de marcaj, deoarece URL-ul sursei principale de domenii / principale ale articolelor pe care le-ați adus frecvent (cum ar fi articolele de la How-To Geek) va apărea de mai multe ori. E un pic enervant, dar nu atât de mare.
Cel de-al doilea dezavantaj este un spărgător al afacerilor pentru persoanele cu multe elemente cu stea (aceia dintre noi cu mii și mii de articole cu stea); atunci când se ocupă de un import enorm de HTML, de cele mai multe ori doar craps afară și nu se termină niciodată. Evident, aceasta este o soluție extrem de nesatisfăcătoare pentru utilizatorii Power Reader, deoarece niciodată nu termina importul articolelor dvs. cu stea. Dacă sunteți un utilizator de putere și aveți mii de articole cu stea cu care să vă ocupați, importându-le ca marcaje, nu o veți tăia.
Pentru tipul de putere de prelucrare greu de care au nevoie utilizatorii (tipul de procesare care poate reduce prin 5000 sau mai multe articole cu stea în câteva minute), ne întoarcem la Python pentru a ne ajuta să ne distrăm prin lista noastră masivă.
Datorită courtesy lui Paul Kerchen și Davide Della Casa, doi utilizatori ai puterii Google Reader care doreau să-și exporte toate articolele vechi cu stea, avem două scripturi Python care ne pot ajuta să facem una dintre următoarele două lucruri: 1) documente HTML distincte și / sau 2) importă toate articolele cu stea în Evernote.
Pentru ambele trucuri, va trebui să aveți Python instalat pe sistemul dvs. Luați o copie a Python pentru sistemul de operare și instalați-o înainte de a continua.
După instalarea programului Python, vizitați site-ul pentru proiectul Kerchen / Casa Google Reader Export și salvați fișierele export2HTMLFiles.py și export2enex.py în același director în care ați extras fișierul starred.json.
Dacă doriți să vă convertiți toate elementele cu stea în fișiere HTML distincte, puteți face acest lucru utilizând export2HTMLFiles.py executând următoarea comandă în directorul în care este stocat fișierul dvs. starred.json:
python export2HTMLFiles.py
(Dacă python nu este desemnat ca o comandă de sistem pe mașină, înlocuiți "python" cu calea completă spre executabilul python, de ex. C: \ Python2.7 \ python.exe)
În funcție de numărul de elemente cu stea pe care le aveți, acest proces poate dura de la câteva secunde până la câteva minute. Au fost necesare aproximativ trei minute pentru a trăi peste 12 000 de articole cu stea în timpul testului nostru.
După ce ați terminat, veți avea o serie de fișiere HTML numite și numite (de exemplu, un articol pe care l-ați marcat cu stea.html până la 10000 alt articol pe care l-ați înregistrat.html). Cea mai ușoară modalitate de a le examina pe toate este de a încărca directorul local în browserul dvs. web.
Aceasta este o modalitate excelentă de a vă elibera articolele cu stea din Google Reader și din fișierul JSON, dar așa cum am menționat mai devreme în tutorial, dacă ați salvat articole pentru a le citi mai târziu de ani de zile, veți avea o sarcină monumentală pe mainile tale.
O modalitate prin care puteți gestiona mai bine această sarcină este să utilizați Evernote ca spațiu de lucru pentru a sorta, a eticheta și, eventual, să ștergeți elementele care nu mai sunt utile.
Există două modalități prin care puteți să importați elementele în Evernote. Puteți importa fișierele HTML pe care le-am creat cu un moment în urmă, utilizând Folderul de import. În cadrul clientului desktop Evernote, puteți accesa Instrumente -> Importați foldere și apoi creați un director de memorie pentru fișierele HTML. Am creat un sub-folder în folderul / Reader / work numit Imports și un nou notebook în Evernote numit Starred Items. Prin glisarea și plasarea fișierelor HTML în / Reader / Imports / folder, le putem importa ca note distincte în dosarul Evernote Items Starred Items. Sunt stocate permanent acolo pentru a fi revizuite în timpul liber.
În mod alternativ, dacă doriți să transformați toate articolele dvs. cu stea într-un notebook Evernote într-o singură lovitură, puteți utiliza al doilea script Python pe care l-ați descărcat, export2enex.py pentru a face acest lucru. Avantajul de a face acest lucru este că face o treabă puțin mai bună păstrând formatarea documentelor.
În dosarul unde este localizat fișierul dvs. starred.json, executați următoarea comandă:
python export2enex.py> StarredImport.enex
Luați fișierul rezultat StarredImport.enex și importați-l în clientul Evernote de pe desktop folosind File -> Import -> Evernote Export Files.
În acest moment, v-ați eliberat articolele cu stea în totalitate de la Google Reader și sunteți gata să vă concentrați asupra activității (potențial lungă) de sortare prin grămadă.
Aveți un mod inteligent de a manipula fișierul JSON și de a extrage elementele marcate cu stea? Alăturați-vă discuției de mai jos și împărtășiți sfaturile și trucurile cu cititorii dvs. colegi.