Smazaný obsah Přidaný obsah
Brzdik (diskuse | příspěvky)
Řádek 53:
 
--[[Wikipedista:Mormegil|Mormegil]] [[Wikipedista diskuse:Mormegil|✉]] 08:29, 4. 4. 2008 (UTC)
 
Napřimování odkazů na přesměrování dělám většinou jen u zkratek, kde je riziko, že by z té zkratky mohl být rozcestník, nebo u stránek, kde člověka na cílové stránce uvítá "..pro jiné významy viz XYZ (rozcestník)". Ostatně zhruba tak každý 50. odkaz neodpovídá významem přesměrování, takže to, že to jen zacpává poslední změny bych netvrdil. Bohužel solve_disambiguation v pywikipedii funguje tak, že mu dám jméno rozcestíku (nebo redirectu) a pak se interaktivně opravují všechny stránky které na něj odkazují - viz [[meta:Solve disambiguation.py]]. Optimálnější by sice bylo opravit "při té příležitosti" na stránce všechny odkazy co tam jsou, ale jednak by to znamenalo výrazně vyšší zátěž na wikipedii (teď to technicky funguje tak, že se stáhne stránka, opraví se odkazy a znovu se to tam nahraje, pokud by se mělo opravovat všechny odkazy, muselo by to u každého odkazu stáhnout cíl a zjistit jestli nejde o redirect nebo rozcestník, čili pro každou stránku stáhnout v průměru několik desítek dalších), jednak přepsat to do téhle podoby je daleko za mými možnostmi (mé znalosti pythonu jsou poněkud omezené) a myslím že i zkušenému pythonistovi by to trvalo asi několik dní.
 
Nahrazení nezlomitelné mezery běžnou není bezdůvodné ani "zcela chybné". Od jisté verze MW (nevím od které, ale v té co je na cs wiki se to tak už děje, ze skriptu cituji:
 
Newer MediaWiki versions automatically place a non-breaking space in
front of a percent sign, so it is no longer required to place it
manually.
 
) se před znak procentou automaticky dává nedělitelná mezera, i když je v textu obyčejná. Tedy tato změna zpřehledňuje text. NBSP jinde než před procentem jsou nechány tak jak tam jsou.
A „==Něco==“ vs „== Něco ==“? Bot nikomu nerozkazuje, každý ať si to tam cpe jak chce, bot to jen opravuje na jednotný formát, který mi přijde přehlednější.
 
Další z kosmetických změn je přerovnání interwiki do správného pořadí, uvedení kategorií s velkým počátečním písmenem, zpřehlednění odkazů typu "<nowiki>[[X|x]] -> [[x]] a [[blbec|blb]]ec -> [[blbec]]</nowiki> apod.", převedení některých entit přímo na patříčný unicode znak "&amp;aacute; -> á", odstranění extra mezer v textu (dvě a více mezer se zdrcnou do jedné, pokud to není v nowiki, pre nebo jiném kusu kódu, kde by to vadilo)
 
Ostatně, kosmetické změny se provádějí pouze pokud je opraven alespoň jeden odkaz. Nikdy ne samostatně.
 
Ale pokud by byl s některou z kosmetických změn problém, můžu ji zakomentovat. Přesný seznam změn je v souboru cosmetic_changes.py z pywikipedie.
 
Teď tam je tohle:
text = self.fixSelfInterwiki(text)
text = self.standardizeInterwiki(text)
text = self.standardizeCategories(text)
text = self.cleanUpLinks(text)
text = self.cleanUpSectionHeaders(text)
# Disabled because of a bug, and because its usefulness is disputed
# text = self.putSpacesInLists(text)
# text = self.translateAndCapitalizeNamespaces(text)
text = self.removeDeprecatedTemplates(text)
text = self.resolveHtmlEntities(text)
text = self.validXhtml(text)
text = self.removeUselessSpaces(text)
text = self.removeNonBreakingSpaceBeforePercent(text)
try:
text = isbn.hyphenateIsbnNumbers(text)
except isbn.InvalidIsbnException, error:
pass
 
--[[Wikipedista:Brzdik|Brzdik]] 16:29, 5. 4. 2008 (UTC)