Semalt Guide Op Scraper Extensioun Fir Chrome

Fir all Geschäft ze iwwerliewen a schliisslech ze wuessen, ass et noutwendeg fir seng Konkurrenten a verschidde Risiken ze bleiwen. Entscheedunge maachen baséiert op analyteschen Donnéeën ass e séchere Wee fir dës Probleemer ze vergiessen. Esou Daten kënnen duerch Dateschrott opgeholl ginn. Dat ass wou eng einfach Schrack Extensioun fir Chrome kënnt: et wäert net nëmmen de Prozess vun der Datensammlung erliichteren, awer och et méiglech maachen ënner Schraufen ouni komplizéiert Setups ze maachen.

Wéi Scraper ze benotzen

    1. Déi éischt Saach déi Dir maache musst ass d'Extensioun ze installéieren, da fuert iwwer de Chrom Web Store, Sich no "Schrackeren" a klickt op Add to Chrome.

    2. Navigéiert op d'Websäit déi Dir wëlles Daten ze schrauwen , markéiert den Entrée, an deem Dir interesséiert sidd, andeems Dir et Highlight. Riets klickt op et a wielt "ähnlech schrauwen" am Menü deen opkënnt.

    3. Maachen dëst wäert eng separat Schrackconsolefenster starten. Hei gesitt Dir eng Lëscht vun de geschrapten Donnéeën .

    4. Fir den Inhalt ze späicheren, klickt op "späicheren a Google Docs", dëst exportéiert automatesch d'Donnéeën an e Google Spreadsheet.

Verlängert Schrott

Am Fall wou Dir plangt méi Daten ze schrauwen, kënnt Dir déi fortgeschratt Approche benotzen. Notiz, et ass vill méi einfach mat dem Tool ze schaffen wann Dir e bësse Kenntnisser vun HTML hutt. Ugeholl Dir wollt Daten aus enger Quell schrauwen, déi en Archiv huet op Basis vun Zäitserie Daten. An esou Fall, wann Dir d'Method hei uewen beschriwwen probéiert, kritt Dir déi verwinnt Daten.

Fir dëst Thema ze léisen, kënnt Dir eng HTML an XML Ufrosprooch als XPath benotzen. Wat mécht et? XPath erkennt Daten iwwer déi verschidden Elementer, déi an all Auswiel enthalen sinn. Folgend ass e Guide fir wéi et geet:

1. Gitt an d'Skraperkonsol, uewe lénks sollt Dir e "XPath" Knäppchen bemerken, klickt op et a fuert weider fir den initialen Dësch ze montéieren.

2. Dir musst den XPath fir dat richtegt Element schreiwen. Den aktuellen XPath deen d'ganz Informatioun enthält gëtt an engem Format wéi dëst "// div [3] / div [3] / div [2] / div" ugewisen. Déi <div> Elementer ginn am HTML Dokument vum Computer unerkannt.

3. Fir d'erkannt Date ze trennen, musst Dir d'Scraper Sailen benotzen. Fir dëst ze maachen, musst Dir op déi verschidden Aarte vun Informatioun kucken, déi Dir verfügbar hutt. Ofhängeg vun den Donnéeën déi Dir skrapt, hutt Dir vläicht Tittelen. Dës Tittele sinn präsent nieft all Satz vun Daten. Si gi vun engem Tag begleet, an dësem Fall en <b> Tag.

4. Mat Inspektiounselement lokaliséieren an den <b> Tag op Ärem XPath derbäi. Elo kënnt Dir dës éischt Kolonn als "Titelkolonn" bezeechnen, wéi et d'Titele gëtt. Fuert weider fir verschidde XPaths fir all Kolonn ze kreéieren déi Dir braucht.

5. Klickt op de Schrack an d'Extensioun wäert automatesch d'Donnéeën erofhuelen an se an déi verschidde Kolonnen organiséieren, déi Dir agestallt hutt.