Wikipedie:WPCleaner/Typo

Tato stránka obsahuje seznam (regulárních) výrazů pro vyhledávání a opravování překlepů a špatné gramatiky v článcích Wikipedie. Seznam používá program WPCleaner k detekci chyby #501 Opravy pravopisu a typografie a také se používá pro generování seznamu článků s překlepy.

Stránka byla inspirována stránkami Wikipédia:Liste de fautes d'orthographe courantes a Wikipédia:WPCleaner/Suggestions na francouzské Wikipedii. Existuje podobný seznam, který používá program AutoWikiBrowser.

ŠablonaEditovat

Pro přidání výrazu do seznamu je nutné použít šablonu {{Typo}}.


{{Typo|hledat=albumu|<nowiki>\b(A|a)lbumu\b</nowiki>|$1lba|$1lbu|komentář=<nowiki>Alb|um, vybrat správný tvar</nowiki>}}

Výsledek: \b(A|a)lbumu\b$1lba nebo $1lbu (Alb|um, vybrat správný tvar)

Parametr hledat určuje, zda bude vytvořen odkaz na speciální stránku s výpisem článků, kde se daná chyba může nacházet. Pokud není vyhledávací parametr uveden, odkaz se nevytvoří. Syntaxe parametru je shodná s tou v této dokumentaci. (Poznámka: znak | je nutné nahradit kouzelným slůvkem {{!}}.)

První anonymní parametr obsahuje regulární výraz (dle jazyka Java) toho, co má být v kódu článku vyhledáno a označeno jako chybné. Protože však tento zápis tvoří ve wikitextu popisek externího odkazu ([adresa popis]), je v některých případech (např. pokud je obsažena pravá hranatá závorka) nutné dát jej do tagu <nowiki>. Druhý až šestý anonymní parametr obsahuje výraz pro náhradu. Je-li těchto parametrů vloženo více, ve WPCleaneru se zobrazí všechny varianty, a uživatel tak může vybrat správnou. Do parametru komentář se vkládá text, který je kurzívou zapsán do závorky za poslední variantu nahrazení a zobrazuje se uživatelovi při editaci.

Pokud náhrada nepotřebuje dozor člověka, parametr auto= s hodnotou ano povolí automatické nahrazování daného výrazu.

Syntaxe regulárních výrazůEditovat

Jelikož je syntaxe regulárních výrazů Javy a RegExTypoFixu prakticky stejná, vizte dokumentaci seznamu pro AWB. Úplná kompatibilita s jinými knihovnami (např. re v Pythonu) není zaručena. (V Pythonu je přinejmenším nutné upravit výrazy pro náhrady, aby místo $1 používaly \1 atd.)

Předpony a začátkyEditovat

Konce a koncovkyEditovat

Shody předložekEditovat

Shody přísudkůEditovat

Shody přívlastkůEditovat

AEditovat

AlbumEditovat

ÁEditovat

BEditovat

CEditovat

ČEditovat

DEditovat

EEditovat

FEditovat

GEditovat

HEditovat

Harvardova univerzitaEditovat

IEditovat

ÍEditovat

JEditovat

KEditovat

Krevní plazmaEditovat

LEditovat

MEditovat

NEditovat

OEditovat

PEditovat

REditovat

ŘEditovat

SEditovat

Stanfordova univerzitaEditovat

ŠEditovat

TEditovat

UEditovat

ÚEditovat

VEditovat

YEditovat

ZEditovat

ŽEditovat

Čísla a číslovkyEditovat

VokalizaceEditovat

  • devokalizace: (?![Kk]e \s??[CGgKkQqXx]|[Ss]e \s??[ČčSsŠšXxZzŽž]|[Vv]e \s??[FfVvWw]|[Zz]e \s??[ČčSsŠšXxZzŽž])([KkSsVvZz])(?<=\s[KkSVvZz]|\bse \s??s)e \s??(?!II|VI|X[IV]|[Mm]ě)([AaÁáEeÉéIiÍíOoÓóUuÚú]\w{2,25}|[^AaÁáEeÉéIiÍíOoÓóUuÚú\W][aáeéěiíoóuúůyý]\w{2,25}|SSSR|StB|11|[15][589]|88?)\b$1 $2 (Vyslov, pak rozhodni)[30]
  • ke: (?<=\s)([Kk])(?: | \s??)(?!X{1,3}V?I{0,4})([GgKkQqXx]\w{2,25})\b$1e $2 (Vyslov, pak rozhodni)[3][30]
  • se: (?<=\s)([Ss])(?: | \s??)(?!sebou)([Ss][a-záčďéěíňóřšťúůýž]{2,25}|[17][47]|1\d\d)\b$1e $2 (Vyslov, pak rozhodni)[3][30]
  • ve: (?<=\s)([Vv])(?<!\d V)(?: | \s??)(?!VI)([FffiVvWw]\w{2,25}|[Pp]h\w{2,25}|1[24]|městě|svém?)\b$1e $2 (Vyslov, pak rozhodni)[3][30]
  • ze: (?<=\s)([Zz])(?: | \s??)([Zz]\w{2,25}|čtv?r\w+|s[tv]\w+|železa|1[47]|7[14])\b$1e $2 (Vyslov, pak rozhodni)[3][30]

SídlaEditovat

StátyEditovat

MěstaEditovat

ČeskáEditovat

  • -av: \b(Boles|Břec|Čás|Přibys|Soběs|Vratis|Zbras)lavy\b$1lavi  
  • -ava: \b(Bratis|Jih)lavi\b$1lavy  
  • Brno: \bbrn([aěou]|em)\bBrn$1  
  • České Budějovice: \b[Čč]esk(é|ý(?:ch|mi?)) +?[Bb](?<!Česk(?:é|ých|ými?) B)udějovic(e?|ích|ím)\bČesk$1 Budějovic$2  
  • Frýdek-Místek: \b[Ff]rýd(ek|kem|ku)(?:\s?[-–]\s?|[-–]?| +?)[Mm]íst(?:ek|kem|ku)(?<!Frýdek-Místek|Frýdku-Místku|Frýdkem-Místkem)\bFrýd$1-Míst$1  
  • Hradec Králové: \b[Hh]rad(c[ei]|cem|ec) +?[Kk]r[aá]lov[eé]\w*(?<!Hrad(?:c[ei]|cem|ec) Králové)\bHrad$1 Králové  
  • Janské Lazně: \b[Jj][aá]nsk(é|ý(?:ch|mi?)) +?[Ll](?<!Jansk\w{1,3} L)ázn([ěí]|í(ch|m))\bJansk$1 Lázn$2  [6]
  • Jihlava: \bjihlav([aěuy]|ou)\bJihlav$1  
  • Karlovy vary: \b[Kk]arlov(y|ý(?:ch|mi?)) +?[Vv](?<!Karlov(?:y|ých|ými?) V)ar(ech|ům?|y)\bKarlov$1 Var$2  
  • Liberec: \bliber(ec|c[ií])\bLiber$1  
  • Olomouc: \bolomouc([eií]?)\bOlomouc$1  
  • Ostrava: \bostrav([aěuy]|ou)\bOstrav$1  
  • Pardubice: \bpardubic(e?|ím|ích)\bPardubic$1  
  • Plzeň: \bplz(eň|n[ěi])\bPlz$1  
  • Praha: \bpra(ha|hou|ze)\bPra$1  
  • Újezd nad Lesy: \b[UuÚúŮů]jezd([ěu]?|em) +?nad +?[Ll]es[iy](?<!Újezd(?:[ěu]?|em) nad Lesy)\bÚjezd$1 nad Lesy  [6]
  • Ústí nad Labem: \b[UuÚú]st[ií](m?) +nad +[Ll](?<!Ústím? nad L)abem\bÚstí nad Labem  
  • Zlín: \bzlín([aěu]?|em)\bZlín$1  

ZahraničníEditovat

JináEditovat

GramatikaEditovat

PravopisEditovat

Opakovaná slovaEditovat

  • (?<=\s)([aikosuvz]|ale|ani|až|bez|během|buď|(ne)?(bude([mt]e|š?)|budo?u|js(em|[mt]e|ou)|mají|nacház(ej)?í|(by|mě|nacháze)l[aioy]?)|[dhp]o|dv[aě]|díky|jak[áéoý]?|je(ho|n)?ž?|její(ch|m)?ž?|jejichž?|kde|[kvzž]e|když?|kvůli|(ne)?mají|m[iu]|nad?|neboť?|n[eěií]ž|něj|není|n[ií]|nichž?|ob[aě]|osmi?|pak|pět|p?ode?|pro(t[io])?|pře[ds]e?|při|sám|sedmi?|si|sto|sv[áé]|svoj[eií]|svůj|šest|tě|tři|a?však|vůči|za)(?<![Nn]a na|i nebo|, je) +?(?!na na\b)(?=\w\w? |\w{3})\1\b$1 (Opakované slovo)  
  • \b(?![A-ZÁČĎÉĚÍŇÓŘŠŤÚÝŽ])(\w{5,25}|\w{1,10}(?: | )\w{5,15})\s+\1\b$1 (Opakované slovo)[3]
  • \b(?:dle podle|podle dle)\bdle nebo podle (Dle = podle)
  • (?<=\s)(?!ze z do)([kvz])e +?(?!v té době)\1(?=\s)$1
  • (?<=\s)([ksvz])(?<![^A-Za-z] +?s) \s??\1e\b$1e  
  • \b([Pp])(od?|ři) +?p\1\b$1$2  
  • (?<=\s)se se se(?=\s)se se  
  • \b(?:se (\w+ )?)?stal([aioy]?) se stal\2?\bse $1stal$2

Zkratky v textuEditovat

Jednotky a předpony SIEditovat

Zdvojená nebo ztrojená písmenaEditovat

TypografieEditovat

TečkyEditovat

  • mezera před tečkou: (?:\s*\.)?\s{1,3}\.(?!\w|\.). (Mezera před tečkou/ami)

ČárkyEditovat

  • \s\s?,(\s) *,$1  
  • \s{0,3},?\s{0,3},\s{0,3}\.( ) *.$1 nebo ,$1 (Čárka, nebo tečka)
  • \s{0,4},\s{0,4},( ) *,$1 (Dvě čárky)  

Jiná interpunkceEditovat

  • ( ) *?;\1 *;$1 (Mezery u středníku)
  • (?<=\w{4})(?<! : .{5,100})\s ??\?([^\w?'])?$1 (Mezera před otazníkem)
  • (?<=\w{4})(?<! : .{5,100}) {1,2}?!([^\w!'])!$1 (Mezera před vykřičníkem)

ZávorkyEditovat

  • [ ]*('''?)?\(( ) *$2$1( (Mezera po závorce)  
  • [ ]+\)('''?)? *([\.,:;!?'"“\n]))$1$2 (Mezera před závorkou)  
  • [ ]*( )\)('''?)? *(?![\.,:;!?'"“]))$2$1 (Mezera před závorkou)  
  • (.)\[(?:http://(www\.?)?){2}$1[http://$2 (2× http://)  

Pomlčka, spojovník, mínusEditovat

  • [ ]{0,6}( | ) ?-( ?)(,?) ?( | ) {0,6}$1–$3$4 nebo nebo - nebo $1−$4 nebo $1− (1) Pomlčka s mezerami, 2) bez mezer, 3) spojovník bez mezer, 4) mínus s dvěma mezerami a 5) mezerou jednou)[3]
  • (?<=\[\[\d{2,4}(\|\d\d)??\]\]) *?[-–—] *?(?<![^ ]–)(?=\[\[\d\d[^\.]) (Rozsah let v odkazech)  
  • (?<=\s|\()(\d\d?)(?:- ?| -)(\d\d?(?:\s| ))([ckm]?[gm]\b|(centi|deci|deka|hekto|kilo|mili)??(gram|litr|metr)(ech|ům?|y)\b|(tý)?dn(ech|[iy]|ům?)\b|let(ech|ům|y)\b|měsíc([ei]|ích|ům?)\b|min\b|minut(ách|ám|ami|y)?\b|procent(ech|ům?|y)?\b|ro(cích|k(ům?|y))\b|sekund(ách|ám|ami|y)?\b|vteřin(ách|ám|ami|y)?\b|[s×%])$1–$2$3 (Menší rozsah)[3]
  • (?<=\s|\(|\|)(?<!IS[BS]N \s??)(\d{3})(?: ?[-—]|[-—] )(\d{3})(?!-)\b$1–$2 (Rozsah let (oba pod 1000). Opravuj pouze roky!)
  • (?<=\s|\(|\|)(?<!IS[BS]N \s??)([12]?\d{3})(?: ?[-—]|[-—] )([12]\d{3}|dosud|současnost)(?!-)\b$1–$2 (Rozsah let (druhý nad 1000))  
  • \bISSN +?(\d{4})[–—](\d{3}[\dX])\bISSN $1-$2 (Fix ISSN)  
  • \b(\w{1,20})ov([áé]|ou)(?:\s-|-\s|\s?[–—]\s?)(\w{1,20})ov([áé]|ou)$1ov$2-$3ov$4
  • <sup>[-–](\d)<sup>−$1 (Mínus)  
  • \b(?<!\d\.\s)(\d\d?)\.(?: ?-|- )(\d\d?\.)$1.–$2 (Rozsah řad. číslovek)
  • (?<!-)\b(19|20)(\d\d)(?<!99)(?:\s?-|-\s)(\d\d)\b(?![\-–—])$1$2–$3 nebo $1$2–$1$3 nebo $1$2/$3 nebo $1$2/$1$3 (Rozsah 20./21. století)
  • (?<!-)\b1999(?:\s?-|-\s)00\b(?![\-–—])1999–00 nebo 1999–2000 nebo 1999/00 nebo 1999/2000 (Rozsah let 1999 a 2000)
  • \b([Pp]p?\.|[Pp]ages?|[Ss]\.|[Ss]tr\.|[Ss]trany):? *?(\d+, )??(\d+)(?: ?-|- )(\d+)\b$1 $2$3–$4 (Rozsah stran)
  • \b(jedno|dvou|tří|čtyř|pěti|šesti|sedmi|osmi|de[sv]íti) +?([ai]|až|či|nebo(?: i)?) +?(dvou|tří|čtyř|pěti|šesti|sedmi|osmi|de[sv]íti|(?:jede|dva|tři|čtr|pat)nácti|více)(\w{3,15}([áéíý]|é(ho|mu?)|[íý](ch|m[iu]?)|ou))\b$1- $2 $3$4 (Chybějící spojovník)
  • (?<=\s|\(|\|)([12]?\d{3}) – ([12]?\d{3})\b$1–$2 (Pomlčka bez mezer)

ČasEditovat

DatumEditovat

  • datum leden: \b0?([1-9]|[123]\d)\.( | )+?0?1\.(?: | )+?(\d{3,4})\b$1.$2ledna $3[3]
  • datum únor: \b0?([1-9]|[12]\d)\.( | )+?0?2\.(?: | )+?(\d{3,4})\b$1.$2února $3[3]
  • datum březen: \b0?([1-9]|[123]\d)\.( | )+?0?3\.(?: | )+?(\d{3,4})\b$1.$2března $3[3]
  • datum duben: \b0?([1-9]|[123]\d)\.( | )+?0?4\.(?: | )+?(\d{3,4})\b$1.$2dubna $3[3]
  • datum květen: \b0?([1-9]|[123]\d)\.( | )+?0?5\.(?: | )+?(\d{3,4})\b$1.$2května $3[3]
  • datum červen: \b0?([1-9]|[123]\d)\.( | )+?0?6\.(?: | )+?(\d{3,4})\b$1.$2června $3[3]
  • datum červenec: \b0?([1-9]|[123]\d)\.( | )+?0?7\.(?: | )+?(\d{3,4})\b$1.$2července $3[3]
  • datum srpen: \b0?([1-9]|[123]\d)\.( | )+?0?8\.(?: | )+?(\d{3,4})\b$1.$2srpna $3[3]
  • datum září: \b0?([1-9]|[123]\d)\.( | )+?0?9\.(?: | )+?(\d{3,4})\b$1.$2září $3[3]
  • datum říjen: \b0?([1-9]|[123]\d)\.( | )+?10\.(?: | )+?(\d{3,4})\b$1.$2října $3[3]
  • datum listopad: \b0?([1-9]|[123]\d)\.( | )+?11\.(?: | )+?(\d{3,4})\b$1.$2listopadu $3[3]
  • datum prosinec: \b0?([1-9]|[123]\d)\.( | )+?12\.(?: | )+?(\d{3,4})\b$1.$2prosince $3[3]

StupněEditovat

  • \b(\d{1,3})[˚°°] +?(\d\d?(?:[\.,]\d+)?)['’'´]$1°$2'  
  • \b(\d{1,3})[˚°°] +?(\d\d?)['’'´] +?(\d\d?(?:[\.,]\d+)?)(?:"|”|''|’’|´´)$1°$2'$3” nebo $1°$2'$3"  
  • \b(\d+)˚$1°  
  • <sup>[oO0]</sup>([CFK])°$1  

Procenta, promileEditovat

  • \b(\d+) %\B$1 % (Redukce kódu)  [3]
  • \bo((?: | )\d{1,3}(?:,\d\d?)?)%( +?[a-záčďéěíňóřšťúůýž]+ší(?:m?|ho|ch|m[iu])\b|[\.,:;\)])o$1 %$2 (Mezera před procentem)  [3]
  • \b(\d+) +?‰\B$1 ‰ (Pevná mezera u promile)[3]

KrátEditovat

  • (?<=[\s*\("])(\d+)x(?=\s)$1×  
  • \b(\d+) x ?(\d+)\b$1 × $2 nebo $1×$2 nebo $1 × $2[3]
  • \b(\d+)x([1-9]\d*)(?!\])\b$1×$2

IndexyEditovat

  • \b([HK]|Na)\+\B$1<sup>+</sup> (Horní index)
  • Ca2+: \b(Ca)2\+\B$1<sup>2+</sup> (Horní index)  
  • CO2: \bCO2\bCO<sub>2</sub> (Dolní index)
  • H2O: \bH2O\bH<sub>2</sub>O (Dolní index)
  • O2−: \bO2[-–−]\BO<sup>2−</sup> (Horní index)  

Apostrofy, uvozovkyEditovat

  • \b(\w+)´([ms]|re)\b$1'$2 (Typografie)  
  • (?<=\s)´(\d\d)\b'$1 (Typografie)  
  • \b([DdLlOo])´(\w+)\b$1'$2 (Typografie)  
  • (?<=\s)´([^´\n]+?)´(?=\W)‚$1‘ (Typografie)
  • „ +?(\w+)\b„$1  
  • „([^“\n]+\s)'([^'“\n]+?)(?<!'|in'\W.{1,300})'(?!')([^“\n]*?)“„$1‚$2‘$3“
  • (?<=\s)(?:,,|´´)([^\n“]+?)(?:[“”"]|(?:['´’]){2})„$1“ (Typografie)

MezeryEditovat

  • (?<!\| {0,5})(?: +  *| *  +)(?! |\|)  (Nezlomitelná mezera)  [3]
  • ( ) *[-–] *  * –$1 (Nezlomitelná mezera za pomlčkou)[3]
  • \((\*|†)(?! )(\S[^\n\)]+?)\)($1 $2) (Mezera po hvězdičce/kříži)[3]
  • (?<!\|) +<ref(?=[ >])<ref (Mezera před referencí)  
  • \{\{ +\{\{  
  • &n(?:bps|pbs);?   [3]

PleonasmyEditovat

NadpisyEditovat

  • (\n)(===?) *([Ee]xternal|[Ee]xt[eé]rní|[Vv]nější) +?(link[sy]?|stránk[ay]|odkazy?|zdroje?)(?<!Externí odkazy)\b$1$2 Externí odkazy (Nadpis Externí odkazy)
  • (\n)(===?) *[Dd]alší +?čtení\b$1$2 Literatura (Nadpis Literatura)
  • (\n)(===?) *([Ss]ouvis(ej)?ící +?hesla|[Vv]iz +?t(aké|éž))\b$1$2 Související články (Nadpis Související články)

PoznámkyEditovat

  1. a b http://prirucka.ujc.cas.cz/?id=755
  2. Například: Internetová jazyková příručka [online]. Praha: Ústav pro jazyk český AV ČR, v. v. i, 2008–2021. Heslo software. 
  3. a b c d e f g h i j k l m n o p q r s t u v w x y z aa ab ac ad ae af ag ah ai aj ak al am an ao ap aq ar as at au av aw ax ay az ba Ve výrazu jsou některé mezery pevné, ale zobrazují se jako obyčejné.
  4. a b c
  5. Internetová jazyková příručka [online]. Praha: Ústav pro jazyk český AV ČR, v. v. i, 2008–2021. Heslo abchazský. 
  6. a b c d e f g h i j k l m n o p q r s t u v w x y z aa ab ac ad ae af ag ah ai aj ak al am an ao ap aq ar as at au av aw ax ay az Stručná učebnice spisovatelství aneb Ta naše čeština česká
  7. http://pravopisne.cz/2010/10/antedatovat-x-antidatovat/
  8. a b c d e Internetová jazyková příručka [online]. Praha: Ústav pro jazyk český AV ČR, v. v. i, 2008–2021. Heslo album. 
  9. http://prirucka.ujc.cas.cz/?id=101
  10. Internetová jazyková příručka [online]. Praha: Ústav pro jazyk český AV ČR, v. v. i, 2008–2021. Heslo expertiza. 
  11. a b c Internetová jazyková příručka [online]. Praha: Ústav pro jazyk český AV ČR, v. v. i, 2008–2021. Heslo Falklandy. 
  12. a b c d e f g h i j k l m n o p q Wikipedie:Pravopisné rady
  13. http://pravopisne.cz/2015/01/implementace-x-inplementace/
  14. Internetová jazyková příručka [online]. Praha: Ústav pro jazyk český AV ČR, v. v. i, 2008–2021. Heslo interview. 
  15. a b c Internetová jazyková příručka [online]. Praha: Ústav pro jazyk český AV ČR, v. v. i, 2008–2021. Heslo kasárna.  Internetová jazyková příručka [online]. Praha: Ústav pro jazyk český AV ČR, v. v. i, 2008–2021. Heslo kasárny. 
  16. a b
  17. a b c d e f g h http://pravopisne.cz/2015/02/plazma-x-plasma/
  18. Internetová jazyková příručka [online]. Praha: Ústav pro jazyk český AV ČR, v. v. i, 2008–2021. Heslo naších. 
  19. http://pravopisne.cz/2014/08/opomijeny-%C3%97-opominany/
  20. Internetová jazyková příručka [online]. Praha: Ústav pro jazyk český AV ČR, v. v. i, 2008–2021. Heslo orleánský. 
  21. http://prirucka.ujc.cas.cz/?id=150#nadpis13
  22. a b c d http://prirucka.ujc.cas.cz/?id=125
  23. Internetová jazyková příručka [online]. Praha: Ústav pro jazyk český AV ČR, v. v. i, 2008–2021. Heslo práce. 
  24. Internetová jazyková příručka [online]. Praha: Ústav pro jazyk český AV ČR, v. v. i, 2008–2021. Heslo protěžovat. 
  25. Internetová jazyková příručka [online]. Praha: Ústav pro jazyk český AV ČR, v. v. i, 2008–2021. Heslo ředitel. 
  26. Internetová jazyková příručka [online]. Praha: Ústav pro jazyk český AV ČR, v. v. i, 2008–2021. Heslo tanzanský. 
  27. http://pravopisne.cz/2010/10/vymytit-%C3%97-vymitit/
  28. Internetová jazyková příručka [online]. Praha: Ústav pro jazyk český AV ČR, v. v. i, 2008–2021. Heslo zapřičinit. 
  29. a b c d e
  30. a b http://prirucka.ujc.cas.cz/?id=370
  31. Internetová jazyková příručka [online]. Praha: Ústav pro jazyk český AV ČR, v. v. i, 2008–2021. Heslo Pobřeží slonoviny. 
  32. Internetová jazyková příručka [online]. Praha: Ústav pro jazyk český AV ČR, v. v. i, 2008–2021. Heslo Tanzanie. 
  33. http://pravopisne.cz/2014/10/versailles-%C3%97-versailes/
  34. Internetová jazyková příručka [online]. Praha: Ústav pro jazyk český AV ČR, v. v. i, 2008–2021. Heslo versailleský. 
  35. a b Internetová jazyková příručka [online]. Praha: Ústav pro jazyk český AV ČR, v. v. i, 2008–2021. Heslo Korea. 
  36. Internetová jazyková příručka [online]. Praha: Ústav pro jazyk český AV ČR, v. v. i, 2008–2021. Heslo městys. 
  37. Neopravují se slova, která jsou již někde výše; bcdf - neopravovat kódy barev; f - neopravovat „Schifffahrt“; l - neopravovat Eisschnelllauf; r - neopravovat hudební skupinu Riot grrrl aj.