diplomka19.html

Zadání diplomové práce

Moderní regresní metody při dobývání znalostí z dat

(klíčová slova: nelineární regrese, umělá inteligence, regresní stromy, umělé neuronové sítě, jádrové funkce)

Regresní metody jsou metody prokládání funkcí z předem vymezených tříd empirickými daty. Proloženou funkci lze potom využít jednak ke studiu vztahů mezi jednotlivými proměnnými a zákonitostí, kterými se data řídí, jednak k predikci hodnot závisle proměnné v případech, k teré v datech nejsou zachyceny. Nejjednodušším typem regrese je regrese lineární, která se odedávna používala ve statistice, stejně jako i některé velmi jednoduché typy regrese nelineární, např. polynomiální regrese. Během posledních 20–30 let se však, díky růstu výkonnosti počítačů, velmi rychle rozvíjí mnohem důmyslnější typy nelineární regrese, např. regrese pomocí regresních stromů a regrese založená na umělých neuronových sítích či na jádrových funkcích. Tyto metody však již nejsou rozpracovávány v rámci statistiky, ale v rámci samostatných disciplin na pomezí matematiky a umělé inteligence.
Diplomant se nejdříve důkladně seznámí s teoretickými základy i konkrétními algoritmy nejdůležitějších typů moderní nelineární regrese. Poté se naučí pracovat s existujícími implementacemi některých těchto metod ve vývojovém prostředí Matlab, a tyto implementace vybraných metod otestuje na řadě mezinárodně používaných testovacích souborů, i na alespoň jednom souboru dat z reálné aplikace. Na závěr se pokusí navrhnout metodu, která by zvyšovala přesnost regresních stromů, jež jsou nejsrozumitelnějším z uvažovaných regresních modelů, bývají však ve srovnání s ostatními typicky o dost méně přesné.

Doporučená literatura

· A. Criminisi, J. Shotton and E. Konukoglu. Decision Forests for Classi_cation, Regression, Density Estimation, ManifoldLearning and Semi-Supervised Learning. Technical Report, Microsoft Reserch, 2011.

· T. Hastie, R. Tibshirani, J. Friedman. The Elements of Statistical Learning, kapitoly 1–3, 9–11. Springer, 2001

· E. Rasmussen, C.K.I. Williams. Gaussian Processes for Machine Learning. MIT Press, 2005.