Diskuse s wikipedistou:PastoriBot/Archiv vyřešeného

Typografické chyby editovat

Upozorňuji na typografickou chybu v zakládaných pahýlech obcí. Za tečkou se píše mezera, která tam mezi první a druhou větou chybí.
Danny B. | diskuse | mail | přehled příspěvků | 16:55, 21. 7. 2006 (UTC)

Díky za upozornění. To mi uniklo. Robota jsem opravil. Ten automaticky upraví všechny chyby a nové články již bude generovat správně. --PastoriBot 17:15, 21. 7. 2006 (UTC)

Tak jsem se podíval do zdrojáku, namátkou Nové Hamry, a našel jsem tam chyb podstatně více:

  1. tečka na konci úvodního odstavce je odsazena na nový řádek, což způsobuje mezeru mezi ní a vlastním textem
  2. čísla nejsou spojena s jednotkami nedělitelnou mezerou
  3. jednopísmenná slova nejsou spojena s následujícím slovem nedělitelnou mezerou
  4. domnívám se, že druhý odstavec (vzdálenosti k jiným obcím) by měl být jako jeden plynoucí řádek a nikoliv co obec to nový řádek.

Prosím, podívejte se na Wikipedie:Typografické rady a podle nich patřičně upravte svého robota. Do té doby ho, prosím, nepouštějte.
Danny B. | diskuse | mail | přehled příspěvků | 17:28, 21. 7. 2006 (UTC)

ad 1 - už je upraveno ad 2 - nelze - dočítám informace z internetu a nemohu ručit za jejich tvar ad 3 a 4 - méně se dívejte do zrojáku

je to robotický pahýl a jako takový je optimalizován pro strojové zpracování

Musím vás opravit: lze. Pokud byste to před odesláním prohnal regulárními výrazy, tak by výsledek mohl vypadat přesně dle typografických pravidel. Nevím, jak ta data z Internetu získáváte, ale pomocí XSLT transformací byste také mnohého dosáhl.
Danny B. | diskuse | mail | přehled příspěvků | 17:47, 21. 7. 2006 (UTC)

Bohužel můj robot je Microsoft Access a takové věci jako regulární výrazy a XSLT transformace je pro Access španělská vesnice. --PastoriBot 17:50, 21. 7. 2006 (UTC)

Další chybka: např. Slavkov (okres Opava) - prázdná sekce Externí odkazy. Buď do ní něco dejte, nebo tam, kde nemáte co dát, ji nepište. Díky
A co se robotu týče, ondyno jsem vám navrhoval, ať se o něj podělíte - víc hlav víc ví. Nahrazování textu umí kdejaký notepad, tak to jistě bude umět i Access... ;-)
Danny B. | diskuse | mail | přehled příspěvků | 19:21, 21. 7. 2006 (UTC)

Sekce Externí odkazy není prázdná. Je v ní uvedeno minálně {{Geo cz}} (požadavek Malého čtenáře). O robota se zatím dělit nehodlám. Je v neustálém pohybu. --PastoriBot 20:55, 21. 7. 2006 (UTC)

Jen prosím, zda by robot nemohl souřadnice do infoboxů přidávat ve formátu °'" místo ° ´ ´´. JAn 13:52, 1. 8. 2006 (UTC)

Neúplně vložený text editovat

V sekci Externí odkazy článku Zduchovice jsem nalezl tuto perlu

  • [htt Oficiální stránky obce]

--Zirland 19:29, 21. 7. 2006 (UTC)

To je proto, že na místě, ze kterého to robot čte, je uveden tento údaj. --PastoriBot 20:53, 21. 7. 2006 (UTC)

Námět, nebo spíš požadavek na rozšíření editovat

V těch roboticky generovaných pahýlech obcí píšete počet obyvatel a katastrální rozlohu. Rozloha se příliš často nemění, takže u ní to pominu, ale u počtu obyvatel bych rád viděl datum, k němuž je daný stav aktuální. Čím přesnější, tím lepší. Jinak je taková informace nepříliš hodnotná. Není-li ve vašich zdrojích (mimochodem, odkud čerpáte?) uvedeno datum sčítání u té které obce, jistě bude někde uvedeno souhrnné "Stav k ...", takže by stačilo i to. Díky.
Danny B. | diskuse | mail | přehled příspěvků | 23:14, 21. 7. 2006 (UTC)

Dovoluji si tvrdit, že ani počet obyvatel se během doby nijak výrazně nemění. Pokud budu chtít zjistit aktuální hodnotu, určitě ji nebudu hledat ve wikipedii. Jinak je ale celkem jedno, zda je údaj z roku 2006 nebo např. z roku 2004. Rozdíl bude až na nějakou vzácou výjimku v řádu zlomků procent. --Pastorius 12:23, 2. 8. 2006 (UTC)

V některých obcích jsou chyby. Zadní Třebaň: Beroun je severozápad a Hořovice jihozápad, viz [1] --Beren 23:43, 21. 7. 2006 (UTC)

Tak jsem si udělal výlet po krajině české do míst, kde jsem kdy byl. Podle popisu lokace mi to spíš připomnělo jízdu s pražským taxikářem z Václavského náměstí na Hrad přes Újezd nad lesy. A v některých případech mi v hlavě znělo pověstné cimrmanovské: "jdu na sever, jdu na jih..."

A jako perlička na konec:

Kdyby byl dnes 1. duben, tak by to byl výtečný příspěvek. Ale dnes Apríl není. Takže takhle tedy rozhodně NE.
Danny B. | diskuse | mail | přehled příspěvků | 00:48, 22. 7. 2006 (UTC)

Robot byl vzhledem k faktickým chybám v generovaných článcích zablokován, podrobnosti jsou na Wikipedie:Pod lípou (oznámení)#Protokol o krizové situaci 22. 7.. --che 02:50, 22. 7. 2006 (UTC)

Jak dál editovat

Zdá se, že robot nemá všechny aspekty pahýlů úplně odladěné, takže navrhuji následující: dejme jeho generátor obsahu k dispozici na web, tak aby stačilo zdrojový kód kopírovat do Wikipedie. Odtamtud jej mohou přispěvovatelé používat jako základ pro své články o obcích, nebo jej prostě přenášet jako základní pahýly. To poskytne evidentně potřebnou ruční kontrolu, a zároveň podstatně zjednoduší práci editorům kteří se místopisu věnují. Až bude podoba předkládaných pahýlů stabilizovaná a odladěná, bude mít smysl je hromadně vkládat. --che 02:57, 22. 7. 2006 (UTC)

Světové strany editovat

Zastavil jsem robota, neboť jsem opět při náhodných kontrolách zjistil nesrovnalosti ve světových stranách. Prosím, zveřejněte algoritmus, dle nějž jsou světové strany určovány. Jinak jste také řekl, že počítáte s vkládáním infoboxu. Bylo by vhodné, kdyby se vkládal hned při založení článku.

Mám pro vás návrh: Použijte si na odladění robota testovací Wikipedii - tam si můžete dělat, kolik verzí článků potřebujete, a pilovat robota k dokonalosti. Bude to mít výhody i pro vás, i pro českou Wikipedii. Především se tím předejde podobným situacím jako nedávno. Věřte, že nás nijak nebaví vašeho robota zastavovat a určitě to neděláme jen tak pro naši radost. Chápu, že vás jeho neustálé zastavování může demotivovat. Na testwiki si můžete naprosto nerušeně vyvíjet dle libosti a nikdo vás tam zastavovat nebude. A až to budete mít dostatečně odzkoušené, vypilované, okomentované wikipedisty a schválené k masivnímu nasazení, uvítáme vaše robotické pahýly i tady.

Díky za spolupráci

Danny B. | diskuse | mail | přehled příspěvků | 01:35, 31. 7. 2006 (UTC)

Robot nejel v automatickém režimu, proto bylo jeho zastavení zbytečné. Nevím o kterých chybách konkrétně mluvíte. Ocenil bych konkrétní případ. Nevím, jak vy kontrolujete správnost výpočtu. Zvlášť v situacích, kdy se dohadujeme zda směr je S nebo SV, nebo J nebo JV je velmi sporný.

Problém je obtížnější než se na první pohled zdálo. Nejprve jsem vypočítával počáteční úhel ortodromy, současný stav je výpočet azimutu loxodromy. Existují různé algoritmy, žádný z nich bohužel není úplně bez chyby. Problém je v tom, že některý pracuje dobře pro krátké vzdálenosti, některý pro dlouhé. Já ale používám pouze jeden algoritmus, pomocí kterého spočítám vzdálenosti z dané obce do cca 200 větších měst. Pak vyberu tu čtyři nejbližší.

Můj problém tak není v otestování konkrétního algoritmu. Ten mám otestovaný dobře. Problém je v tom, že podle konkrétní kombinace délky a šířky dochází k numerickým problémům při výpočtu. Normální počítač prostě při výpočtu goniometrických funkcí typu 0.9999997878 nebo 1.0000000045 dělá chyby.

Zatím jsem to nevzdal a budu ještě nějaký čas experimentovat. Pojďme se tedy bavit o konkrétních chybách a pojďme společně ověřit, zda se jedná o skutečné chyby nebo domněnky. Pokud se mi nepodaří v nějaké historicky krátké době algoritmus vylepšit, funcionalitu s určováním směru odstraním a budu generovat pahýly bez této užitečné informace.

Algoritmus zvěřejním večer (teď to u sebe nemám).

--Pastorius 07:57, 31. 7. 2006 (UTC)



Čau PastoriBote :) Našel jsem jednu chybku v článku města Jičína [http://cs.wikipedia.org/w/index.php?

title=Jičín&diff=579052&oldid=546564]. -xfi- 09:26, 25. 6. 2006 (UTC)

Další dvě chybky jsou v článcích Libchavy a Lanškroun. --che 12:52, 24. 6. 2006 (UTC)

Prošel jsem editace z noci na dnešek, další rozbité jsou tyto: [2] [3] [4] [5] [6] [7] [8] [9] [10] [11] [12] [13] [14] [15] [16] [17] [18] [19] [20] [21] [22]. Zdá se, že bot má problémy zejména s unicode znaky. --che 13:34, 24. 6. 2006 (UTC)
Milí kolegové, děkuji za všechna upozornění. Uvedené chyby jsou odstraněny --Pastorius 20
10, 26. 6. 2006 (UTC)

Dobrá, tak ještě jednou na to nejvhodnější místo. S tímto robotem byly v minulosti problémy, dokonce jím zakládané články musely být hromadně mazány. Nechci, aby se to opakovalo. Proto je třeba, aby kterýkoliv wikipedista, když spozoruje chyby v jeho činnosti, jej mohl zastavit. Nejen správce pomocí zablokování, protože to je pomalejší postup a zaměstnává správce. Analogický systém mají i jiní roboti, se kterými potíže nebyly (Lótetári). Píšeš, neexistuje žádné pravidlo, které by nařizovalo, že robot musí mít brzdu. To je pravda, ale taky neexistuje pravidlo, které by dovolovalo provoz neodladěných robotů, ba naopak. Jestliže s tímhle jsou problémy a existují pochybnosti o jeho odladění, je tento systém nutný. Navíc jsi sám slíbil, že bude fungovat, takže nevidím důvod, proč to nesplnit. Na odladění této funkce ani není třeba, aby robot editoval, stačí v offline provozu ověřit, že okamžitě reaguje na příspěvek na příslušné stránce. Až poté může být odblokován. --egg 12:10, 4. 8. 2006 (UTC)

Ještě poznámka k tomuhle, Pastorie.

  • NEFUNGUJE VÁM SLIBOVANÁ BRZDA
Tak na ní nesahejte. Brzda není od toho, aby reagovala na zlovolné a věcně nepodložené pruzení.

Brzda je od toho, aby okamžitě zabrzdila, pokud je na editacích něco nejasné. Nedá se tím nic zkazit, není přece problém robota pustit znova, takže nemůže být problém, pokud na ni kdokoliv v případě připomínek sáhne. Dále jestliže nefungovala (nebo nebyla zapnutá schválně), znamená to, že robot nedělá to, co o sobě tvrdí. A to je jednoznačně důvod ho zablokovat. Přečti si, co má i PastoriBot napsané nahoře na stránce. Že jsi zablokování nazval svévolí a doteď proti tomu protestuješ, považuju za drzost, a trvám na obnovení této funkčnosti. --egg 12:42, 4. 8. 2006 (UTC)

Možný problém editovat

Robot při procházení roků smazal šablonu {{Pojednává2}} z 666. Předpokládám, že to bylo neúmyslné a doporučuji to opravit a zkontrolovat, zda se to nestalo i nějakému jinému roku. -- Hkmaly 08:27, 5. 8. 2006 (UTC)

To bylo schválně. Chtěl jsem to doplnit až pro zpracování všech let 1 - 2018. Jste rychlejší. Díky. --PastoriBot 08:47, 5. 8. 2006 (UTC)

Připomínky editovat

Prosím, zapište sem všechny vaše připomínky k funkci, která generuje automatické robotické pahýly.


Takze vecna kritika: infobox u pahylu vyplneny jen napul, prazdna sekce "externi odkazy", soupiska casti obce i kdyz se obec sklada z jedne casti. Viz [23], obec s rozšířenou působností a pověřená obec byt mohly byt odkazy, dalsich 6 polozek chybi. Rozhodne bych toho bota ted pouzival pouze na pregenerovani tech clanku ktere uz jednou udelal (cili tam jeste je roboticky pahyl) a ne na zakladani novych. Az se to doladi, tak by mohl bezet dale. Do ty doby bych ho asi pouzival radsi jen na doplnovani souradnic, to mu jde dobre. --Bilboq 20:31, 3. 8. 2006 (UTC)

 Pastorius: pocty ZSJ, mistni casti by se s te obrovske db od CSU asi take daly vytahnout, ne?
<Pastorius> pověřená obec ....  - pokud to má být odkaz, měla by to zařídit za šablona
<AHA_> Ehm, zatim to nedela, kazda polozka ma sva pravidla... ale snad se budou infoboxy predelavat...
<Pastorius> počty ZSJ a místních částí - asi jo, ale já nevím jaký je rozdíl mezi ZSJ a místní částí
<AHA_> ZSJ jsou tam vyjmenovane v solo sloupecku, mistni casti take... takze by mel stacit nejaky unique s omezenim na obec...


  • Počet MČ, KÚ a ZSJ včetně jmen lze zjistit na http://www.isu.cz/uir
  • Názvy MČ neuvádět vždy s rozlišovačem (Obec), leckdy jde o unikátní jména
  • vteřiny v souřadnicích uvádět symbolem ", minuty ' (nikoliv ´)
  • POU jako odkaz v šabloně prozatím nelze: 1) množství hotových šablon 2) problém s názvy s rozlišovačem (Písek (okres Písek) apod.)
  • JAn 11:37, 4. 8. 2006 (UTC)
  • V Kostelní Radouň bylo špatně NUTS. NUTS5 vždy uvádět ve tvaru CZ0313 567890 (Nikoliv 567890) a u tohoto článku navíc nesouhlasilo NUTS4: nebylo CZ0313 ale CZ03103. JAn 13:12, 8. 8. 2006 (UTC) - TAk je to špatně asi všude JAn 11:59, 21. 8. 2006 (UTC)

JAn 21:27, 9. 8. 2006 (UTC)

  • Někde je chyba při generování seznamu MČ, viz třeba [24]. Místo 25 MČ jich bylo jen 10 )tolik tam je katastrálních území).
  • Dokázal by robot s asistencí dogenerovat příslušné údaje (Poloha, mč...) i do již hotových článků? JAn 11:59, 21. 8. 2006 (UTC)

Dotazy autora editovat

Rád vyjdu vstříc vašim požadavkům. Některé záležitosti ale v tuto chvíli vyřešit neumím. Snad mi dokážete pořadit vy.

  • jaký je rozdíl mezi ZSJ a místní částí, jak zjistit jejich počet? Stačí spočítat počet různých hodnot pro konkrétní obec?
Místní část není odborný termín, správný je část obce, o čemž zákon o obcích říká: Část obce je evidenční jednotka vytvářená budovami s čísly popisnými a čísly evidenčními (§ 31) přidělenými v jedné číselné řadě, která leží v jednom souvislém území. Názvy částí obce jsou zpravidla převzaty z názvu zaniklých obcí, osad nebo z názvů historicky vzniklých území, na nichž se tyto části obce nacházejí.
ZSJ je pojem ČSÚ, který říká: je skladebnou částí sídelního útvaru, je určena pro prostorovou identifikaci a sledování sociálně-ekonomických a územně-technických jevů přímo vázaných na osídlení. Soubor ZSJ pokrývá beze zbytku území celého státu. ZSJ se ve vybraných obcích městského charakteru nazývají urbanistické obvody, jsou charakterizovány shodným funkčním využitím většiny objektů a jejich soubory vyplňují beze zbytku plochu všech katastrálních území příslušného města. V ostatních obcích se ZSJ nazývají sídelní lokality a zahrnují pouze zastavěné části katastrálního území. Jsou tvořeny samostatnými seskupeními obytných objektů včetně území upraveného pro potřeby sídla a jsou vzájemně odděleny buď nezastavěnou plochou nebo hranicí katastrálního území.
Tedy jablka a hrušky. Obě by měly jít vytáhnout z Databáze sčítacích obvodů, asi budou i další, pravděpodobně však neautoritativní zdroje...
  • kde se dá zjisti PSČ obce, jak postupovat, pokud obci přirazeno více poštovních směrovacích čísel?
Jediným autoritativním zdrojem PSČ je Česká pošta, formulář mají na svém webu. Při více PSČ by měla být jednotlivá oddělena čárkami. --Adam Hauner 11:21, 4. 8. 2006 (UTC)
I v případě, že jich bude opravdu hodně? --Pastorius 11:50, 4. 8. 2006 (UTC)
Pokud nejde o čísla, která jsou bezprostředně za sebou, nelze je uvést intervalem (a naopak). Tj. pro Plzeň si dokážu představit zápis 300 00–331 06, 332 08, pokud by bylo ve zdroji pro Plzeň explicitně uvedeno 3107 čísel jdoucích po sobě, pak jedno vynechané a ještě jedno další. Ale třeba je tu nějaký expert na PSČ, já se za něj nepovažuji. --Adam Hauner 13:46, 8. 8. 2006 (UTC)

Připravované změny editovat

Toto je část, kam autor píše seznam požadavků, které se rozhodl realizovat na základě výše uvedených připomínek.

  • Externí odkazy uvádět pouze v případě, že existuje alespoň jeden externí odkaz
  • Části obce, Části města - uvádět pouze v případě, že obec (město) má alespoň dvě části. Pokud je jedna část, neuvádí se ani tehdy, neshoduje-li se název části se jménem obce (města).
  • jména obce s rozšířenou působností a pověřené obce uvádět jako wiki odkazy
  • názvy částí uvádět buď s rozlišovačem obce (pokud je nejednoznačný), jinak bez něj
  • vteřiny v souřadnicích uvádět symbolem ", minuty ' (nikoliv ´)
  • prověřit v vytváření NUTS - příklad Kostelní Radouň
  • do externích odkazů vždy uvést odkaz na statistické údaje o obci: http://www.czso.cz/lexikon/mos2003.nsf/mos?openform&:123456 (NUTS5)

Kategorie roků - prosba editovat

Ahoj, nešlo by prosím u nově zakládaných roků rovnou přidávat interwiky alespoň do en? --Tlusťa 08:59, 10. 4. 2007 (UTC)

To by šlo. --PastoriBot 09:00, 10. 4. 2007 (UTC)

Tak jestli to bude, tak dík :) --Tlusťa 09:01, 10. 4. 2007 (UTC)
Za moment to spustím. --PastoriBot 09:04, 10. 4. 2007 (UTC)

PSTN -> SČ editovat

Ahoj, nechceš nejdřív na dumpu udělat analýzu, najít všechny používané tvary (Viz též, Vizte též, Podívejte se na, Podívejte se též na, Související odkazy, Příbuzné články, ...) a nahradit vše? --Adam Hauner 11:37, 25. 4. 2007 (UTC)

To je docela dobrý nápad. Nejsem ale takový dump schopen zpracovávat. Vzhledem k tomu, že u každého článku je jenom jedna taková varianta, nebude analýza mít velký vliv na celkový výkon nebo spotřebu výkonu. Domnívám se, že ten nejčastější tvar je potřeba upravit co nejrychleji, aby všichni noví editoři a ti editoři, kteří nesledují všechny diskuse na hlasování, měli před očima ten správný vzor. --P A S T O R I U S 11:44, 25. 4. 2007 (UTC)

Robot mění entity &lt; přímo na literál <. Chvíli jsem se domníval, že to dělá úmyslně a má to aspoň trochu pod kontrolou (třebaže to je IMHO chybné chování tak jako tak), teď jsem však zjistil, že to pod kontrolou nemá vůbec, takže bych prosil o co nejrychlejší opravu. --Mormegil 20:31, 10. 5. 2007 (UTC)

Vrátit se na uživatelskou stránku uživatele „PastoriBot/Archiv vyřešeného“.