Zadání diplomové práce

Vizualizace dat pro klasifikační a regresní stromy

(klíčová slova: vizualizace dat, vizualizace mnohodimenzionálních prostorů, klasifikační stromy, regresní stromy, stromové mapy)


Jedním z důsledků růstu výkonnosti počítačů i kvality jejich periferií je neustálý růst významu vizualizace při analýze dat. Vizualizace umožňuje zprostředkovat větší množství informací současně, a to intuitivním způsobem nevyžadujícím porozumění abstraktním konceptům. Jednou z prvních metod analýzy dat, ve které vizulazace hrála velmi významnou roli, byly klasifikační a regresní stromy. V jejich případě dala právě možnost vizualizace výsledků analýzy pomocí grafů stromového typu metodě jméno. Metody vizualizace používané pro klasifikační a regresní stromy však do značné míry obrážejí úroveň oblasti vizualizace na přelomu 80. a 90. let.  S přístupy k vizualizaci, které se začaly používat teprve později, se v případě klasifikačních a regresních stromů v podstatě nesetkáme. Ke změně tohoto stavu by mohla přispět i navržená diplomová práce.

Student se nejdříve seznámí s metodami vizualizace dat, zejména s moderními metodami vizualizace mnohorozměrných dat. Současně se také seznámí s klasifikačními a regresními stromy a s metodami jejich vizualizace. Na základě studia obou těchto oblastí navrhne, jak by bylo možné současné metody vizulizace klasifikačních a regresních stromů zdokonalit s využitím novějších vizualizačních přístupů. Navržené metody rozpracuje do podoby implementovatelných algoritmů, implementuje je ve vývojovém prostředí Matlab a otestuje na souborech reálných dat poskytnutých vedoucím práce.

 

Doporučená literatura

·         L. Breiman, J. Friedman, R.A. Ohlsen, C.J. Stone, Classification and Regression Trees. Wadsworth, 1984.

·         H. Hofmann. Mosaic plots and their variants. In Handbook of Data Visualization. Springer, 2008, 617–642.

·         W.Y. Loh. Regression trees with unbiased variable selsection and interaction detection, Statistica Sinica, 12 (2002) 361–386.

·         S. Urbanek. Visualizing trees and forests. In Handbook of Data Visualization. Springer, 2008, 243–264.

·         M. Theus. High-dimensional data visulaization. In Handbook of Data Visualization. Springer, 2008, 151–178.