Internetový bot: Porovnání verzí

Smazaný obsah Přidaný obsah
Kohelet (diskuse | příspěvky)
m Kohelet přesunul stránku Internetový robot na Internetový bot s výměnou přesměrování: "robot" se nikde nepoužívá
Kohelet (diskuse | příspěvky)
opr
Řádek 1:
'''Internetový robotbot''' nebo(zkrácenina častěji jenomslova '''bot'[[robot]]'') je [[počítačový program]], který pro svého majitele opakovaně vykonává nějakou rutinní činnost na [[internet]]u - obvykle sbírá data, odesílá a zpracovává požadavky na služby vzdálených [[server]]ů.
 
== Příklady botů ==
 
===Vyhledávací robotyboti===
Častým příkladem robotabota jsou ''vyhledávací robotyboti'' [[Internetový vyhledávač|internetových vyhledávačů]], v [[angličtina|angličtině]] crawler, spider, gatherer (doslova „prolízač“, pavouk, „shomažďovač“ - český ekvivalent se nepoužívá). Tento typ robotůbotů prochází jednotlivé [[World Wide Web|webové]] stránky, hledá na nich odkazy na nové stránky, [[index]]uje obsah zpracovávaných stránek a umožňuje jejich následné prohledávání. Podobným příkladem může být ''robotbot na kontrolu odkazů'' (linkchecker). Prochází zadanou množinu stránek (opět následuje odkazy) a hledá na nich odkazy na již neexistující stránky.
 
===Spamboty===
{{Vlastní výzkum|část}}
RobotBot může informace do stránek i vkládat (odesíláním dat přes [[HTTP]]), existují např. robotyboti vkládající [[komentářový spam]]. Takový robotbot vyhledává formuláře na webu a vkládá do nich reklamní text nebo komerční sdělení.
 
Existují rovněž robotyboti, kterékteří získávají [[e-mail|e-mailové adresy]], jež vkládají do databází příjemců pro rozesílání nevyžádané pošty ([[spam]]u). Odtud se jim říká '''spambot'''i, řidčeji harvester. Jeden ze způsobů je prohledávání internetových stránek - e-mailovou adresu obvykle poznají podle přítomnosti [[zavináč]]e – '''@'''.<ref>Teoreticky by se zavináč mohl uvést jako element '''&amp;#64;'''; specifikaci [[HyperText Markup Language|HTML]] to neodporuje, prohlížeče by to měly podporovat a většinu spambotů by to mělo zmást.</ref> Protože objem takového spamu přesáhl míru únosnosti, bývá naléhavě doporučováno e-mailové adresy na internetu nezveřejňovat přímo, ale nějakým pro člověka snadno pochopitelným způsobem je opsat, např. '''jmeno (zavinac) domena.cz'''. Některé servery jdou v tomto uživatelům vstříc a e-mailové adresy takto rozloží automaticky nebo je vloží ve formě obrázku<ref>http://www.who.is/whois-org/ip-address/wikipedia.org/ Příklad e-mailu ve formě obrázku (na stránce uveden ve spodní části)</ref> (či obrázkem nahradí jednotlivá písmena nebo alespoň znak zavináče<ref>http://kmf.troja.mff.cuni.cz/pracovnici/index.php?id=votocek</ref>). Existuje i způsob přes [[kaskádové styly]]<ref>http://css.interval.cz/clanky/skryti-e-mailu-pred-harvestery-e-mailovych-adres-antispam/</ref><ref>http://css.interval.cz/priklady/priklad-50-1.htm</ref>, ten však zužuje skupinu uživatelů na ty s prohlížeči s podporou CSS(2).
 
Spamovací robotyboti však e-mailové adresy můžou získat rovněž sledováním odpovědí vzdálených [[Simple Mail Transfer Protocol|SMTP]] [[server]]ů. Provádějí na vzdálený [[SMTP#Poštovní server|poštovní server]] tzv. [[slovníkový útok]], kdy se pokouší doručit e-mail na adresy složené z obvyklých jmen a příjmení, oblíbených názvů a přezdívek (svoboda, novak, cerny, atd.). Tyto adresy jsou proto ohroženější, jako protiopatření se doporučuje např. rozšíření adresy o další znaky (xsvoboda, novak69, …).
 
Některé weby místo kontaktního mailu rovnou zobrazí formulář (třeba na připomínky k správě či obsahu jejich stránek), který je po vyplnění uživatelem zpracován na serveru, přičemž se teprve pošle na adresu administrátora nebo jiné zodpovědné osoby.<ref>http://www.256b.com/contact.php</ref> Při nedůsledném zpracování tohoto formuláře vzniká bezpečnostní díra, kterou může robotbot využít a pomocí ní rozeslat spam nejen správci ale libovolnému příjemci.<ref>http://php.vrana.cz/e-mailovy-formular.php - příklad pro [[PHP]]</ref>
 
Zajímavostí je ring serverů, které na spamboty políčily past - zobrazují stránky s desítkami mailových adres a odkazy vedoucí na obdobné takové stránky spřátelených serverů. Tyto stránky jsou vygenerované a odkazy lze procházet donekonečna, aniž by spamboty jediný z nich vyvedl mimo ring (obtěžovat běžné uživatele). Zmíněné e-mailové adresy pak patří největším prokázaným spamerům, takže tito v podstatě „sklízejí co zaseli“.<ref>http://www1173640515703.reporterweb.com/</ref>
 
===RobotyBoti pro správu a údržbu===
[[Wikipedie]] používá [[Wikipedie:Bot|robotyboty]] k různým údržbářským pracím, např. údržbě [[Wikipedie:Interwiki|mezijazykových odkazů]], odstraňování nefunkčních [[Wikipedie:Externí odkazy|externích odkazů]], vytváření nových [[Wikipedie:Přesměrování|přesměrování]] či odstraňování [[Wikipedie:Přesměrování#Dvojité přesměrování|dvojitých přesměrování]].
 
===IRC bot, Chatterbot===
RobotBot nemusí pracovat pouze s webovými stránkami, [[IRC bot]] může poslouchat na [[IRC]] kanálu a reagovat na zaslané příkazy, či do IRC kanálu nějakou konverzaci odesílat.
 
Úkolem dalšího z botů, tzv. chatterbota, není sbírat nebo zasílat spam, ale bavit uživatele předstíráním (simulací) inteligentní konverzace. Zpravidla jeho algoritmus není tak dokonalý, aby obstál srovnání s živým protějškem (více viz [[Turingův test]]), většinou se jen snaží analyzovat z vět klíčová slova a na ně odpovědět podle připravených vzorů.
Řádek 33:
<references/>
=== Související články ===
* [[Wikipedie:Bot|InternetovéInternetoví robotyboti na české Wikipedii]]
* [[Spam]]