Rozhodovací strom: Porovnání verzí

Smazaný obsah Přidaný obsah
m až na tu stylizaci ... (opravujete nesmysly)
Mpx (diskuse | příspěvky)
kategorie, odkazy
Řádek 1:
'''Rozhodovací stromy''' jsou jednou z nejoblíbenějších [[Data mining|data miningových]] technik. Důvodů pro aplikaci těchto technik je několik. Hlavní důvod spočívá v jejich přehlednosti a snadné interpretovatelnosti, která umožňuje uživatelům rychle a lehce vyhodnocovat získané výsledky, [[identifikace|identifikovat]] klíčové položky a vyhledávat zajímavé [[segment|segmenty]] případů.
 
Cílem rozhodovacích stromů je identifikovat objekty, popsané různými atributy, do tříd. Představit si je můžeme jako řádky v tabulce, kde jednotlivé sloupce jsou [[atribut|atributy]] (barva očí, délka ocasu). Jelikož se jedná o strom, [[algoritmus]] je velmi rychlý. Rozhodovací strom se musí nejprve vytvořit z množiny daných objektů, které musí někdo (učitel, jiný [[algoritmus]]) zařadit do skupin (skupina se obvykle označuje jako závislý [[atribut]] a zapisuje se do tabulky do posledního sloupce). Jedná se tedy o [[učení s učitelem]].
 
Každý uzel stromu představuje jednu (vybranou) vlastnost objektů, z tohoto uzlu vede konečný počet hran. Proto je nutné vlastnosti nejdříve diskretizovat (např. z reálných čísel do konečného počtu [[Interval (matematika)|intervalů]]). Kámen úrazu je však ve vytváření takového stromu. Ten musí co nejlépe objekty od sebe odlišit. Pro kořenový uzel se vybírá takový atribut, který objekty od sebe maximálně odliší. Využívá se proto [[entropie]] (míra informační hodnoty [[atribut]]u). Vytváření stromů je dobře popsáno ve známých [[algoritmus|algoritmech]] [[Algoritmus ID3|ID3]] a [[C4.5]].
 
[[Kategorie:Strojové učení]]
[[Kategorie: Umělá inteligence]]