Wikipedie:Interwiki bot

Interwiki bot je bot, který se zabývá údržbou a doplňováním interwiki.

Nejčastěji se používá program napsaný v jazyce Python. Od toho dostal název Pywikipedia bot. Jedná se o celý balíček programů, a interwiki je jedním z nich.

Princip

Robot je spouštěn tak, že má jeden z jazyků jako výchozí. V něm prochází články podle zadaného kritéria

  • jediný článek
  • seznam článků
  • všechny články podle abecedy (se zadaným počátečním článkem případně s počtem článků)
  • všechny články v určité kategorii (včetně podkategorií)
  • všechny články odkazované ze zadané stránky
  • všechny články, které odkazují na daný článek.
Příklad

Pro jednoduchost si můžeme představit, že robot dostal zadaný jediný článek. V něm nalezne odkazy na článek v angličtině a němčině. Následuje tedy tyto dva jazyky. V anglickém článku nalezne ještě odkaz na francouzský a japonský článek. V německém nenalezne nic navíc. Francouzský článek je přesměrování, robot tedy přejde na nový název, v něm nalezne odkaz na španělštinu. Japonský článek neexistuje (byl mezitím smazán). Ve španělském článku není nic nového. Nyní robot doplňuje chybějící interwiki.

Do českého článku přidá odkazy na španělštinu a francouzštinu. Do anglického přidá chybějící španělštinu a změní francouzštinu. Podle zadání může nebo nemůže odstranit chybný odkaz na japonštinu.

Z tohoto vyplývá, že většinou stačí přidat odkaz pouze na jediný jazyk, ovšem zároveň je vhodné přidat i zpětný odkaz do některého z jiných jazyků. Nemusí to nutně být angličtina.

Problematické interwiki

Problém nastává ve chvíli, kdy robot výše popsaným postupem nalezne dva či více odkazů do některého jazyka. Tato situace většinou nastává, když je některý z článků přesunut a nahrazen jiným, případně po sloučení nebo rozdělení článků na některém z jazyků. Typickým případem je, když jsou všechny články o postavách z nějaké knihy/filmu sloučeny do jediného a z původních názvů vzniknou přesměrování. (Odborníci na toto slučování jsou na německé Wikipedii).

Tuto věc může operátor robota vyřešit v poloautomatickém režimu, kdy u každého odkazu rozhodne, zda je to ten správný. Při větším počtu jazyků však může operátor udělat chybu s mnohem větší pravděpodobností.

Jiným druhem problémů je situace, kdy jsou na některé verzi smíchány dva články, např. článek na jedné verzi je o rodu rostlin, ale obsahuje odkazy na rod i konkrétní druh a zároveň se množiny článků o rodu a druhu na žádné jazykové verzi neprolnou. V takovém případě nezbývá, než ručně nebo roboticky odstranit chybné odkazy ze všech jazyků, jinak hrozí, že některý z robotů opět tyto chybné odkazy doplní.

Externí odkazy