Klasifikace (umělá inteligence): Porovnání verzí
Smazaný obsah Přidaný obsah
++stzl značka: editace z Vizuálního editoru |
mBez shrnutí editace |
||
Řádek 60:
Další předzpracování může vybrat podmnožinu dat, pokud je [[dataset]] velký. Kromě doočíbijícího náhodného výběru můžeme chtít vybrat příklady typické nebo je pokrýt reprezentativně, což může znamenat například zachování poměru tříd nebo zachování zajímavých či typických příkladů.
Předzpracování může vybrat atributy v rámci [[výběr rysů|výběru rysů]] anebo může atributy přidat pomocí [[extrakce rysů]]. První přístup se typicky používá, pokud je atributů mnoho, či jsou závislé a nerelevantní. Druhý přístup se používá, pokud jsou jednotlivé
Další druh transformací jsou globální transformace. Číselná data v nějakém metrickém (pod)prostoru můžeme rotovat, natáhnout, centrovat ... Používané techniky jsou [[latentní sémantické indexování]] (LSI), [[analýza hlavních komponent]] (PCA) a další. Například pro klasifikaci pomocí [[support vector machines]] (SVM) se doporučuje atributy standardizovat, aby měly střední hodnotu 0 a standardní odchylku 1.
|