Za chybou 503 mohou být boti

Automatické skripty, které prochází stránky a hledají například bezpečnostní hrozby jsou na vzestupu. Infografika od Incapsula přinesla zajímavá čísla. Ať už je váš web velký anebo malý, tak více jak polovina návštěvnosti jsou boti. Přitom na běžných počítadlech návštěvnosti je nevidíte. Stačí si však zapnout access log a nebudete se stačit divit.

Pro škodlivé boty jsou největším lákadlem weby s vysokou návštěvností, která se nejčastěji určuje z veřejně dostupných zdrojů jako je Alexa. Pokud je váš web mezi sto tisíci nejnavštěvovanějších tak byste z obsahu access logu určitě byli překvapení.

Další oblíbenou metrikou, kterou sledují zvláště spamboti (roboti, kteří mají za úkol vkládat odkazy například formou komentářů) je Google page rank. Jedná se o hodnotu, která má vyjadřovat jak pravděpodobné je, že se na vaší stránku dostane internetový návštěvník. Veřejně nabývá hodnoty od 0 do 10, přitom 10 má jen hrstka webů na internetu. Převážná většina se pohybuje mezi 2 až 3. Mezi jednotlivými hodnotami je exponenciální rozdíl. Takže mezi 1 a 2 je malý rozdíl, 4 a 5 už slušná propast a na 6tku v podstatě většina provozovatelů webů nikdy nedosáhne. Hodnota Google page rank se zvyšuje pomocí zpětných odkazů. Přitom pokud na vás odkazuje web s vyšší hodnotou, tak to má větší vliv než ten s nižší. Spamboti se tak snaží umísťovat zpětné odkazy na weby s vysokým Google page rank. Třeba u ranku 5 může být jejich aktivita už značně nepříjemná.

Aktivita botů může vyústit k zobrazování chyb 503, což u většiny hostingů znamená vyčerpání přidělených serverových zdrojů. Přitom na webu to může vypadat, že máte jen minimální návštěvnost. Boty totiž běžné měření návštěvnosti nezachytí. Potřebujte buď skript, který zpracovává data při generování stránky anebo měření přímo na serveru. Popřípadě pomůže i ten accesslog z kterého se dají data pěkně vyčíst. No pěkně moc ne, ale existují nástroje, které jej přehledně zpracují.

Než tedy odepíšete svého současného poskytovatele webhostingu možná by stálo za to si prověřit aktivitu botů. Tedy spustit alespoň ten accesslog. Mimochodem 503 může být i důsledkem brute force útoku na váš web, kdy se bot snaží uhádnout heslo administrátora.

Existuje větší množství ochran, ovšem pokud nepoužíváte některý ze známých redakčních systémů jako je třeba WordPress, tak si jí budete muset naprogramovat sami, což rozhodně není zrovna jednoduchá záležitost. Na jeden druh botů totiž platí, spíše je efektivní, něco jiného než na ty ostatní. Například pokusy o brute force útoky na administraci zastaví umístění omezení IP adres, které do ní mají přístup, ideálně přes .htaccess a 403. Což je nejméně náročné na výkon a snese celkem hodně velký provoz. Pokud by byl ještě větší a opravdu to tam někdo sypal hlava nehlava je to už otázka spíše na provozovatele hostingu ať s tím něco udělá.

Spamboti, kteří píší rádi komentáře kvůli už zmíněnému Google page rank, se dají zahnat umístěním atributu nofollow do všech komentářů. Nofollow je znehodnotí, protože pak takové odkazy nepřenáší Google page rank a stanou se nezajímavými. Jinak zvolit nějakou metodu filtrování anebo jednodušší je captcha či otázka. Jakmile spambot nedosáhne určité úspěšnosti vkládání odkazů tak se vypne.

Nebezpečí je samozřejmě vícero. Důležité je vždy zjistit co se děje a čeho chce bot dosáhnout a pak proti němu zvolit účinnou obranu.

Share Button

Tento článek byl byl přečten 1346 krát

Napsat komentář

Vaše emailová adresa nebude zveřejněna. Vyžadované informace jsou označeny *