Hartiganova klasifikace struktur blízkosti

Matematik a statistik John Anthony Hartigan (* 1937 Sydney)[1] v roce 1967 rozlišil dvanáct základních struktur proximity, tedy dvanáct způsobů, jak je možno na množině objektů plausibilně definovat strukturu podobnosti nebo blízkosti („proximity“) jednotlivých objektů:[2][3]

  1. definuje na množině objektů Euklidovskou metriku
  2. definuje na metriku
  3. definuje na dvojicích objektů symetrickou reálnou funkci
  4. definuje na reálnou funkci
  5. zavádí na lineární uspořádání; speciálně tedy podobnost dvojic nemusí být reálně ohodnocena, ale pro každé dvě dvojice jsme schopni rozhodnout, zda první si je podobnější než druhá nebo naopak
  6. zavádí na uspořádání, ne nutně úplné - tato varianta připouští neporovnatelné dvojice dvojic
  7. zavádí na strukturu stromu, která sekundárně definuje částečné [uspořádání] podobnosti dvojic objektů: , jestliže . je nejbližší společný předchůdce v rámci stromu definovaného
  8. definuje pro každý objekt úplné uspořádání "je podobnější " na objektech . tedy dokáže pro každé jiné dva prvky rozhodnout, který z nich je podobnější
  9. definuje pro každý objekt částečné uspořádání "je podobnější " na objektech
  10. rozděluje na dvě disjunktní množiny: "podobné páry" a "nepodobné páry"
  11. rozděluje na tři vzájemně disjunktní množiny: "podobné páry", "nepodobné páry" a "nerozhodnuto"
  12. definuje relaci ekvivalence; objekty jsou si podobné právě tehdy, leží-li ve stejné třídě ekvivalence

Reference editovat

  1. BARRY, Daniel. A Conversation with John Hartigan. Statistical Science. 2005-11, roč. 20, čís. 4, s. 418–430. Dostupné online [cit. 2022-02-04]. ISSN 0883-4237. DOI 10.1214/088342304000000242. 
  2. HARTIGAN, John Anthony. Representation of Similarity Matrices by Trees. Journal of the American Statistical Association. Taylor & Francis, Ltd., 1967, roč. 62, čís. 320, s. 1140–1158. DOI 10.2307/2283766. 
  3. GUOJUN, Gan; CHAOQUN, Ma; JIANHONG, Wu. Data Clustering: Theory, Algorithms, and Applications. 2. vyd. [s.l.]: SIAM, 2020. 430 s. (Mathematics in Industry). Dostupné online. ISBN 9781611976335. S. 66.