Klasifikace (umělá inteligence): Porovnání verzí
Smazaný obsah Přidaný obsah
preklad, en , perex, ; mezisave |
linky |
||
Řádek 1:
'''Klasifikace''' je ve [[strojové učení|strojovém učení]] a [[statistika|statistice]] druh problému, když máme určit, do které z [[kategoriální proměnná|kategorií]] dat dané [[pozorování]] patří. K tomu máme k dispozici
"A", "B", "AB" nebo "O" pro [[krevní skupina|krevní skupiny]], [[ordinální data|ordinální]] (např. "velký", "střední" nebo "malý"), [[celočíselné]] (např. počet výskytů slova v emailu) anebo [[reálné]] (např. měření [[krevního tlaku]]). Některé algoritmy pracují pouze s diskrétními hodnotami a požadují, aby se celočíselná nebo reálná data ''diskretizovaly'', tj. převedly na skupiny obsahující podobná měření (např. "méně než 5", "mezi 5 a 10", "víc než 10"). Příklad problému je přiřazení emailu do třídy "spam" nebo "ne-spam" anebo přiřazeni diagnozy danému pacientovi, podle toho, jak je popsán svými pozorovanými charakteristikami (pohlavím, věk, krevní tlak, přítomnost nebo absence určitých symptomů, ...)
Algoritmus, který implementuje klasifikaci, se nazývá [[klasifikátor]]. Tento termín se používá také pro [[matematická funkci|matematickou funkci]], která je implementována algoritmem, a zobrazuje vstupní data na třídy.
V terminologii [[strojové učení|strojového učení]] je klasifikace považována za metodu [[učení s učitelem]], to jest učení, při kterém je známá trénovací množina správně klasifikovaných příkladů. Analogická metoda v [[učení bez učitele]] je známá jako [[klastrování]] a spočívá ve spojování dat do kategorií podle nějaké míry vnitřní [[podobnosti]] (např. [[vzdálenost]]i mezi instancemi, které jsou považovány za vektory ve vícedimenzionálním [[vektor]]ovém prostoru.
Terminologie není jednotná a liší se mezi statistikou a strojovým učením, případně v aplikačních oblastech.
{{Překlad|en|Statistical classification|609043102}}
[[Kategorie:Umělá inteligence]]
[[Kategorie:Strojové učení]]
|