SeoApp - CMSdetektor


CMSdetektor program do rozpoznawania CMS pod linuxa ....

Program służy do rozpoznawania skryptów CMS dzięki czemu z milionów adresów domen uzyskanych podczas harvestowania na wyjściu zostają tylko te które są na konkretnym CMS'ie. Dobrze przefiltrowana lista ma ogromne znacznie w wolniejszych programach opartych o silnik przeglądarki gdyż zamiast kolokwialnie mówiąc "mielić miliony adresów" przez wiele dni z których 5% jest tych właściwych i 95% nie od razu wykorzystujemy tylko te rozpoznane jako konkretny CMS pod konkretny proces rejestracji profili, kont itd... Zaoszczędzony czas można wykorzystać na następne rejestracji. A czas, to pieniądz - jak mawia powiedzenie.

Doświadczenie zdobyte podczas prac nad różnymi wielowątkowymi aplikacjami opartymi o żądania HTTP pozwoliło postawić tezę, że łącza domowe nawet te o relatywnie dużej szybkości zupełnie się do tego nie nadają zwłaszcza na większej ilości wątków. Z pomocą przychodzą VPS'y z Windows i zdalne pulpity, które niestety na dzień dzisiejszy są nadal znacznie droższe niż te linuxowe o podobnych parametrach.

Możliwości programu

  • wielowątkowość ograniczana wydajnością maszyny na jakiej pracuje, 100, 200, 300 itd wątków. Jednak nie zawsze większa liczba wątków = szybszy proces przetwarzania listy adresów do rozpoznania;
  • precyzyjne footprint dla rozpoznawania konkretnego skryptu CMS;
  • możliwość definiowania footprint w dostosowanych do własnych potrzeb;
  • wczytywanie listy URL do sprawdzenia z wielu pików z zdefiniowanego katalogu;
  • dopisywanie przyrostowe i unikalnych URL domen do wynikowego pliku rozpoznanych OK;
  • powtarzanie lub zapisywanie listy URL które zwróciły TimeOut do ponownego sprawdzenia;
  • możliwość wczytania z plików i zapisania tylko unikalnych domen bez procesu rozpoznawania skryptu;
  • bezobsługowa praca w tle. Program można uruchomić na zasadzie screena linuxa;

Footprint rozpoznania CMS

Specyfikacja parametrów:

  • SciezkiPrzeszukiwania - program po wczytaniu przycina adres do bazowej domeny root, więc w ramach <sciezka></sciezka> definiujemy adres strony pod jakim program ma szukać elementów charakterystycznych dla danego CMS. Alternatywnych ścieżek można zamieścić kilka zaczynając od tej typowej. Przykładowo Jomala i K2 mają formularz rejestracji pod kilkoma adresami. Nie zaleca się wpisywanie wielu ścieżek jeśli są nikłe szanse na ich występowanie gdyż, to znacznie wydłuży proces rozpoznawania CMS.
  • MuszaWystapic dopasowanie="wszystkie|jedenznich" - Jest, to ciąg znaków określający charakterystyczny element w tym wypadku pola formularza rejestracji bloga w WPMultisite. Natomiast: dopasowanie="wszystkie|jedenznich" jeśli określimy jako dopasowanie="wszystkie" jak w tym przypadku na stronie muszą wystąpić wszystkie elementy zdefiniowane w ramach znacznika <szukanyciag></szukanyciag>. Jeśli określimy dopasowanie="jedenznich" wystarczy, że wystąpi jedne element by rozpoznanie zwróciło TRUE.
  • NiemogaWystapic dopasowanie="jedenznich|wszystkie" - podobniej jak dla bloku <MuszaWystapic></MuszaWystapic> z tym, że definiujemy tutaj jakie elementy zaneguja wartosć TRUE jesli wystąpią. Przykładowo inteesuja nas formularze nie mające tokenów kapczy.
  • PomijaneDomeny - w ramach tego bloku w znacznikach <pomijaj> </pomijaj> definiujemy jakie ciągi znaków w tym wypadku domeny maja być pomijane przy wczytywaniu z surowych plików z harvestru do rozpoznania CMS. Dodatkowo te domeny będą pomijane w adresach wynikowych OUT, co często występuje przy włączonym auto przekierowaniu 301. Dzięki zastosowaniu tego filtra dane wynikowe nie powinny zawierać elementów - adresów niepożądanych które są zbędne w dalszych operacjach.

CMSdetektor program do rozpoznawania CMS pod Windowsa

Dodatkowo program posiada edytor footpint rozpoznawania skryptów CMS w którym można testować przygotowywany footprint.

Zakup programu

Aktualna promocyjna cena programu wynosi 150 zł netto. W cenę wchodzi instalacja niezbędnych składników na VPS'ie w tym najnowszej Libcurl z c-ares oraz biblioteki Boost. W celu zakupu proszę się skontaktować z producentem programu