Zadání diplomové práce

Sekvenční testování fuzzy hypotéz

(klíčová slova: dobývání znalostí z dat (data mining), testování hypotéz, sekvenční testy, fuzzy logika, fuzzy hypotézy)

Testování hypotéz je jedním z významných statistických přístupů používaných v rychle se rozvíjející oblasti dobývání znalostí z dat (data minimg). Hypotézy o parametrech pravděpodobnostních rozdělení, jimiž se data řídí, představují jednu z možností, jak získané znalostí reprezentovat. Avšak na rozdíl od tradiční (tzv. konfirmační) analýzy dat, při které se testují pouze s dostatečnou precizností zformulované hypotézy, znalosti získávané metodami data mining z dat bývají často vágní a nepřesné. Z toho důvodu se od počátku devadesátých let studují možnosti testování fuzzy hypotéz pomocí teorie fuzzy množin, a v poslední době také pomocí fuzzy logiky. Tyto metody jsou nicméně zatím rozpracovány pouze v hlavních rysech a řadu důležitých aspektů je teprve nutné řešit. V případě přístupu založeného na fuzzy logice například nebyla dosud věnována žádná pozornost sekvenčnímu testování hypotéz, tj. jejich testování v situacích, kdy máme možnost v případě potřeby získat další data se stejným rozdělením pravděpodobnosti. Zatímco při nesekvenčním testování může test vést pouze k některému ze dvou závěrů „hypotézu lze na základě dat zamítnout“ nebo „hypotézu nelze na základě dat zamítnout“ (z nichž obvykle pouze první představuje využitelnou informaci), v případě testování sekvenčního může vést k některému ze tří závěrů „hypotézu lze na základě dat zamítnout“, „hypotézu lze na základě dat potvrdit“ a „je nutné přibrat další data a testování opakovat“ (z nichž již využitelnou informaci představuje i druhý). Právě rozpracováním uvedeného přístupu k testování fuzzy hypotéz na sekvenční testy by se měla zabývat navrhovaná diplomová práce.

Diplomant nejdříve získá celkový přehled o statistickém testování hypotéz, přičemž bude věnovat pozornost zejména sekvenčním testům. Poté se seznámí s některými přístupy k testování fuzzy hypotéz a důkladnně prostuduje přístup založený na fuzzy logice. Vlastní tvůrčí přínos jeho práce bude spočívat v rozpracování uvedeného přístupu pro sekvenční testování fuzzy hypotéz, a to jak na obecné teoretické úrovni, tak na úrovni konkrétních testů. Tyto konkrétní testy bude nakonec implementovat ve vývojovém prostředí Matlab a ověřovat na datech ze skutečných aplikací.


 

Doporučená literatura

·        M. Arnold. Testing fuzzy hypothesis with crisp data. Fuzzy Sets and Systems, 94 (1998) 323-333.

·        Z. Govindarajulu. Sequential Statistics. World Scientific, Singapore, 2004.

·        P. Grzegorzewski. Testing statistical hypotheses with vague data. Fuzzy Sets and Systems, 112 (2000) 501-510.

·        M. Holeňa. Fuzzy hypotheses testing in the framework of fuzzy logic. Fuzzy Sets and Systems, 149 (2004) 229-252.

·        N. Watanabe, T. Imaizumi. A Fuzzy Statistical Test of Fuzzy Hypotheses. Fuzzy Sets and Systems, 53 (1993) 167-178.