Zadání diplomové práce

Kombinování evoluční optimalizace a hlubokého učení pro detekci malware a útoků v síti

Díky velké popularitě, kterou v posledních 5-10 letech zažívají neuronové sítě, zejména pak hluboké učení, se stále častěji používají i v aplikačních oblastech, v nichž se s nimi dříve bylo možné setkat jen výjimečně. K nim patří i navzájem spřízněné oblasti detekce malware a detekce útoků v síti. Uplatnění v těchto oblastech nacházejí nejrůznější typy neuronových sítí: statické k poměrně přesné detekci malware přímo z binárních souborů, konvoluční k detekci útoků na základě prostorového rozložení provozu v síti, rekurentní k detekci anomálního chování software nebo uživatelů sítě. Setkáme se s nimi jak na platformě Windows, tak na platformě Android. Detekce malware a detekce útoků v síti však přináší z hlediska hlubokého učení dva závažné problémy. Prvním z nich je, že obvykle je pro učení k dispozici velmi vysoký počet příznaků. Ten nejenom zvyšuje jeho časovou náročnost, ale používání nevhodných příznaků může i snižovat prediktivní přesnost naučené neuronové sítě. Proto je třeba věnovat velkou pozornost výběru optimální množiny příznaků, které budou pro učení nakonec použity. Druhým problémem je, učení je třeba vždy po čase opakovat kvůli adaptaci na vývoj malware a s ním spojený vývoj hrozeb útoků v síti. Opravdová adaptace přitom obvykle nezahrnuje pouze opakování učení s novými daty, ale i výběr optimální architektury a dalších hyperparametrů neuronové sítě, aby její přeučení s původními hyperparametry nevedlo ke zhoršení její kvality. Jak výběr optimální množiny příznaků, tak i výběr optimálních hyperparametrů jsou složité úlohy strukturální optimalizace, při jejichž řešení jsou již po několik desetiletí nejúspěšnější evoluční optimalizační metody. Při nových aplikacích hlubokého učení při detekci malware a útoků v síti jim však zatím nebyla věnována téměř žádná pozornost. Je zde tedy velká potřeba výzkumu, který má velkou šanci přinést nové a užitečné výsledky.

Student si k tomuto rámcovému tématu může vybrat z několika konkrétních témat diplomových prací podle toho, zda se více zajímá o hluboké učení nebo evoluční algoritmy i podle toho zda ho více láká propojení hlubokého učení a evolučních algoritmů nebo použití hlubokého učení při detekci malware a útoků v síti.

Doporučená literatura

· W. Wang, Y. Sheng, J. Wang, X. Zeng, X. Ye et al.. HAST-IDS: Learning hierarchical spatialtemporal features using deep neural networks to improve intrusion detection. IEEE Access, 6:1792–1806.

· B. Xue, M. Zhang, W.N. Browne, X. Xao. A Survey on Evolutionary Computation Approaches to Feature Selection. IEEE Transactions on Evolutionary Computation, 20: 606-626.

· V.K. Ojha, A. Abraham, V. Snášel. Metaheuristic design of feedforward neural networks: A review of two decades of research. Engineering Applications of Artificial Intelligence, 60: 97-116.

· L. Zhang, D. Zhang. Evolutionary Cost-Sensitive Extreme Learning Machine. IEEE Transactions on Neural Networks and Learning Systems, 28: 3045-3060.

· Y. Sun, G.G. Yen, Z. Yi. Evolving Unsupervised Deep Neural Networks for Learning Meaningful Representations. IEEE Transactions on Evolutionary Computation, 23: 89-103.