SeoApp - GHarvester


GHarvester alias wytrwały żniwiarz, to program do harvestowania adresów stron www, który dzięki powtarzaniu zapytań radzi sobie relatywnie dobrze z zapytaniami zawierającymi proxożerne operatory jak "inurl", "intitle", "site" itd... Tego typu operatory wykorzystywane są przy pozyskiwaniu mówiąc w żargonie SEO "miejscówek" na konkretnym CMS.

Wytrwały żniwiarz powtarza zapytania, aż trafi na proxy, które pobierze kolejną stronę wyników SERP. Dzięki takiemu podejściu nie są pomijane pobrania wyników z powodu bana proxy.

Screeny z głównego okna programu dla dwóch typów operatorów

W tym testowym przypadku nastawionym na ilość wszystkie footprinty były klasycznymi zapytaniami bez trudnych operatorów.

  • Lista footprint ~ 37.600 - trzydzieści siedem tysięcy sześćset
  • Lista wynikowa: ~ 14.110.000 - czternaście milionów sto dziesieć tysięcy URL
  • Czas pracy: ~ 8:50 - osiem godzin pięćdziesiąt minut

W tym testowym przypadku wszystkie footprinty zawierały operator inurl: i mimo tego pobierane zakończono sukcesem - 8000 URL bez pomijania stron wyników.

  • Lista footprint ~ 35 - trzydzieści pięć
  • Lista wynikowa: ~ 8000 - osiem tysięcy URL
  • Czas pracy: ~ 8:50 - czterdzieści cztery minutu

Filtr URL

Umożliwia filtrowanie w locie pobieranych URL pod kątem ciągów znaków, które muszą / nie mogą wystąpić w zapisywanym adresie strony www.

Menadżer proxy API lub z dysku

Lista źródeł proxy API lub ewentualnie z dysku z których program ma pobierać proxy używane do harvestowania.
Plik zródeł to: proxy\listazrodel.txt. Jeśli proxy mają być wczytane z dysku należy w tym pliku podać taką ścieżkę: proxy\test1proxy.txt.
Po dodaniu w programie listę należy zapisać prawym przyciskiem myszki.

Generator footprint

Wstawia keywords z prawego okna przed keywords z lewego okna lub w miejsce znacznika: %KW%.
Przykładowo mamy 2 keywords w lewym i 4 w prawym oknie, co wygeneruje 8 kombinacji footprint.

Instrukcja obsługi

  • W głównym oknie programu zdefiniować plik zapisu zapisu adresów url z harwestowania;
  • W zakładce proxy dodać źródła proxy API lub ewentualnie z dysku;
  • Określić parametry oraz liczbę wątków;
  • Uruchomić pobieranie proxy z API;
  • Uruchom wątki;

FAQ programu

  • Autoryzacja programu top menu > Pomoc kod autoryzacji i skopiowany klucz wysłać do producenta programu;
  • Jeśli na po włączeniu będzie na czerwono = BAN 302, to znaczy, że mamy proxy zbanowane, ale po program będzie ponawiał zapytania, aż trafi an proxy, które "ożyje" lub API podmieni na działające;
  • Jaka jest optymalna liczba wątków ? To zależy od kondycji i ilości proxy, listy footprint i ich typów. Nieraz więcej nie znaczy szybciej, więc ilość wątków należy ustawić empirycznie
  • Na liście cały czas zostanie jedn footprint na czerwono - co zrobić ? Najlepiej zatrzymać program i ewentualnie pobrać dane dla tego footprint bez proxy lub świeżymi porxy;
  • Skąd mam wziąć proxy ? Dedykowaną przez producenta metodą jest zakup pakietów proxy API w serwisie ProxyMarket.pl.

Zakup programu

Aktualna cena programu wynosi 150 zł netto (184,50 brutto) w celu zakupu proszę się skontaktować z producentem programu