Zadání diplomové práce

Kombinování klasifikátorů pomocí fuzzy metod

(klíčová slova: klasifikace, strojové učení, fuzzy matematika , klasifikační stromy, jádrové funkce)

Klasifikační metody jsou metody třídění empirických dat do konečného počtu tříd pomocí funkcí z předem vymezených funkčních systémů. Výběr klasifikační funkce z daného funkčního systému se provádí na základě omezeného počtu dat se známou příslušností do tříd postupem, který se obecně označuje jako učení a který může mít rozmanitou podobu, od poměrně triviálních jednokrokových výpočtů až po velmi složité iterační algoritmy. Protože zpracování empirických dat bylo původně doménou statistiky, spočívají tradiční klasifikační metody na statistických principech. Nástup počítačů a neustálý růst jejich výkonu však vedl ke vzniku a rychlému rozvoji klasifikačních metod založených na principech strojového učení – např. klasifikace pomocí umělých neuronových sítí, pomocí klasifikačních stromů, či tzv. SVM klasifikátory (support vector machines), spočívající na jádrových funkcích. Díky tomu jsme při řešení klasifikačních problémů často v situaci, že máme k dispozici několik přibližně stejně přesných klasifikátorů spočívajících na různých principech. V takovém případě buď stojíme před nelehkou volbou, který z nich použít, nebo nejdříve provedeme klasifikaci pomocí všech a potom se snažíme získané výsledky nějak zkombinovat. Druhá z těchto možností může v ideálním případě případě vést ke spojení předností kombinaovaných klasifikátorů, takže výsledný klasifikátor je přesnější než kterýkoliv z nich. Metod kombinování klasifikátorů existuje několik desítek, od prosté volby té klasifikace, kterou navrhuje nejvíce z nich, až po velmi důmyslné agregační metody založené na teorii míry. Velmi obecný teoretický rámec agregačních metod představuje fuzzy matematika. A právě v tomto rámci by se kombinováním klasifikátorů měla zabývat navrhovaná diplomová práce.
Diplomant se nejdříve v rešeršní práci důkladně seznámí s teoretickými základy  nejdůležitějších moderních klasifikačních metod i metod fuzzy agregace. Poté se při výzkumném úkolu seznámí s existujícími implementacemi některých z těchto metod ve vývojovém prostředí Matlab, a tyto implementace doplní implementací několika dalších metod, které v prostředí Matlab dosud k dispozici nejsou. V rámci vlastní diplomové práce pak bude implementovat některé z fuzzy metod kombinování klasifikátorů a testovat je na řadě mezinárodně používaných testovacích souborů a souborů dat z reálných aplikací.

 
 

Doporučená literatura

·          M. Grabisch,  H.T. Nguyen, E.A. Walker. Fundamentals of Uncertainty Calculi with Applications to Fuzzy Inference. Kluwer, Boston, 1995.

·          J.M. Keller, P. Gader, H. Tahani, J.H. Chiang, M. Mohamed. Advances in fuzzy integration for pattern recognition. Fuzzy Sets and Systems, 65 (1994) 273-283.

·          L.I. Kuncheva, J.C. Bezdek, R.P.W. Duin. Decision templates for multiple classifier fusion: an experimental comparison. Pattern Recognition, 34 (2001) 299-314.

·          B. Schölkopf, A. Smola. Learning with Kernels. MIT Press, Cambridge, 2002, kapitoly 1–7.