Zadání diplomové práce

Volba počtu skrytých neuronů ve vícevrstevných perceptronech

Umělé neuronové sítě jsou oborem na pomezí matematiky a informatiky, který prodělal v posledních dvaceti letech tak prudký rozvoj jako málokterá jiný podobor těchto dvou disciplin. Jednou z hlavních příčin atraktivnosti umělých neuronových sítí je jejich schopnost libovolně přesně aproximovat velmi obecná zobrazení. V případě typu umělých neuronových sítí nejčastěji používaného v praktických aplikacích, vícevrstevného  perceptronu, se přesnost této aproximace zvyšuje s rostoucím počtem neuronů ve skryté vrstvě nebo skrytých vrstvách sítě. Zvyšování počtu skrytých neuronů však s sebou přináší jeden velmi závažný problém. Vícevrstevný perceptron totiž nekonstruuje aproximující zobrazení na základě celkového průběhu aproximovaného zobrazení, nýbrž pouze na základě konečného počtu dvojic vstupních a výstupních hodnot aproximovaného zobrazení, které má k dispozici jako trénovací data v průběhu učení. A při dostatečně velkém počtu skrytých neuronů lze vždy najít takové aproximující zobrazení, které sice ještě nebude od aproximovaného zobrazení natolik blízko, jako požadujeme, ale trénovací dvojice již bude aproximovat s maximální možnou přesností - tj. bude jimi procházet. Tento jev, označovaný jako přeučení, zároveň zablokuje další učení sítě a nalezení dostatečně přesné aproximace. Zatímco aproximační vlastnosti neuronových sítí byly v posledním desetiletí studovány velmi intenzivně, jen velmi malá pozornost byla věnována kombinování získaných výsledků s tím, co je známo o jevu přeučení, pro návrh vhodného počtu skrytých neuronů při dané trénovací množině. A právě takové tvůrčí kombinování známých výsledků by mělo být cílem navrhované diplomové práce.

Diplomant by se měl seznámit se současným stavem znalostí o aproximačních vlastnostech vícevrstevných perceptronů i o závislosti průběhu učení tohoto typu umělých neuronových sítí na množství trénovacích dat. Tvůrčím propojenímním výsledků z obou oblastí by měl vypracovat metodu, jak alespoň v případě některých jednoduchých typů aktivačních funkcí stanovit pro daná trénovací data takový počet skrytých neuronů, který bude zohledňovat jak přesnost aproximace, tak odolnost proti přeučení. Měl by prokázat schopnost samostatně odvozovat jednoduché teoretické výsledky i schopnost ověřovat ty vlastnosti sítí, jež nelze studovat teoreticky, pomocí vhodných počítačových simulací. Přitom bude mít možnost se podle svých vlastních zálib více zaměřit na jeden či druhý z obou přístupů.
 

Doporučená literatura