Wikipedie:AutoWikiBrowser/Typos/Dokumentace

Tento seznam obsahuje definice oprav špatně psaných řetězců slov ve Wikipedii pro externí programy (AutoWikiBrowser, WPCleaner) nebo boty. Řetězce jsou psány pomocí regulárního výrazu uvnitř XML tagu.

<Typo name="název chyby (správný tvar)"  find="výraz pro nalezení"  replace="výraz pro nahrazení"/>

Máte-li návrh na chybu nebo jste objevili falešný výskyt a nevíte, jak chybu napsat, resp. opravit, uveďte problém na diskusní stránce. Tam popište, co a proč (uveďte například zdroj) hledat a opravovat, a uveďte i případy, kdy by se to hledat a opravovat nemělo.

Přídáváte-li nové pravidlo, umístěte ho dle platné dokumentace i do druhého seznamu.

Syntaxe editovat

Související informace naleznete také na stránkách regulární výraz a PCRE.
  • . znamená jakýkoliv znak kromě nového řádku,
  • * znamená, že se předchozí znak může vyskytnout mnohokrát, ale také vůbec nemusí,
  • + znamená, že předchozí znak se může vyskytnout mnohokrát, nejméně však jednou,
  • ? znamená, že se předchozí znak může vyskytnout jednou, nebo se vyskytnout nemusí vůbec;
  • { } – počet opakování předchozího znaku/řetězce:
    • {6} – předchozí znak/řetězec se opakuje přesně šestkrát, {5,} – předchozí znak/řetězec se opakuje pět- a víckrát, {2,4} – předchozí znak/řetězec se opakuje dva- až čtyřikrát.

Pokud za některý z výše uvedených operátorů přidáme ?, bude pracováno s co nejmenším počtem znaků (bude upřednostňován nižší počet znaků); bez otazníku je pracováno s co největším počtem (je upřednostňován co největší počet).


  • ( ) – pokud je nutné ponechat nějakou proměnnou část tak, jak byla nalezena (malé/velké písmeno, koncovka apod.), vkládá se do těchto závorek; závorky se číslují v pořadí zleva doprava a zpět se vkládájí v parametru replace jako $[číslo], kde číslo je pořadí závroky – samotný dolar se v části replace vkládá $$;
    • (?: ) – obdoba oblých závorek, ale obsah se neukládá jako proměnná (není číslován);
  • (?= ) – oprava pokračuje, pouze pokud je text v závorce shodný s textem vpravo od závorky;
  • (?<= ) – oprava pokračuje, pouze pokud je text v závorce shodný s textem vlevo od závorky;
  • (?! ) – oprava pokračuje, pouze pokud text v závorce shodný s textem vpravo od závorky není;
  • (?<! ) – oprava pokračuje, pouze pokud text v závorce shodný s textem vlevo od závorky není.

Pokud je do nějaké (oblé) závorky vloženo svislítko (|), oddělí jinou možnost (jiné možnosti; slovně nebo).


  • [ ] – jeden ze znaků, který je uveden uvnitř:
    • [A-Za-z0123] – jeden ze znaků v rozsahu A–Z, a–z nebo čísel 0, 1, 2, 3,
    • [^a–f0–9x] – žádný ze znaků či v rozsahu;
  • \ – pokud se vloží před znak, který má svůj specifický význam (např. tečka .), specifičnost se ruší a je chápán jako obyčejný znak; totéž platí i naopak – pokud je vložen před určitý znak, získává specifickou vlastnost (např. písmeno \w):
    • \b – hranice mezi číslem či písmenem a znakem, který není číslem ani písmenem; opak \B, \w – písmeno nebo číslice, \W – ani písmeno, ani číslice, \d – pouze číslice, \Dne číslice, \s – bílý znak (mezera, nový řádek \n [opak .], tabulátor \t [opak \T]), \Sne bílý znak;
  • \xčíslo – hexadecimální kód znaku (&#32; [mezera] → \x20).

V parametru name se používá pouze čistý text, v parametru find je možné využít cokoliv výše uvedené kromě vložení neznámé ($) a v parametru replace se jakýkoliv znak tvořící syntaxi užívá bez lomítka.

Omezení editovat

AWB nekontroluje cíle odkazů/obrázků, šablony a citace.

WPCleaner umožňuje použít řetězce \[\[ jako počátek odkazu a \{\{ jako počátek šablony. Jinak nekontroluje <!-- komentáře -->, cíle odkazů/obrázků (ale kontroluje popisy), kategorie, mezijazykové odkazy a jiná místa.

WikiEd kontroluje vše, avšak přeskakuje pravidla s look-behind sekvencemi (?<= ) a (?<! ).

Upozornění editovat

  • Pokud má být vyhledána horní uvozovka ", která se využívá např. ve značkovacím jazyce HTML, musí být zapsána jako \x22. Vložit ji je možné pouze přes proměnnou ($1 atd.).

Před přidáním položky editovat

  • Ujistěte se prosím, že opravdu jde o chybu a že její opravování nebude kontraproduktivní (např. pevné mezery za jednopísmennými slovy, přidávání mezery mezi číslo a procento).
  • Vymezte si, kdy to chyba je a kdy není (např. opravovat řetězec abla na alba je správně, ale opravovat ablativ na albativ už ne).
  • Napište pravidlo tak, aby platilo pro co nejvíc možných tvarů.
  • Pravidlo správně pojmenujte a správně abecedně zařaďte.
  • Pokuste se, aby pravidlo s žádným jiným nekolidovalo.