Podmínky pro získání zápočtu:
- Vypracování projektu a jeho prezentace na cvičení.
- Ideální je aktivní účast na cvičení, ale lze pracovat i samostatně.
- Pokud budete docházet na cvičení, řešit úlohy a účasnit se ,,soutěží'', bude se to počítat jako body k dobru.
- Pokud už o hlubokém učení něco víte a nechcete/nemůžete se pravidelně účastnit cvičení, budu ráda, když ostatním na cvičení odprezentujete nějaké svoje zajímavé výsledky.
Řešení úloh ze cvičení a účast v ,,soutěžích''
Na cvičeních budeme experimentovat s modely hlubokého učení při řešení různých úloh. Během semestru budou zadány 2–3 úlohy, ve kterých studenti budou mít za úkol najít co nejlepší řešení, případně vylepšit dané základní řešení. Každá úloha bude mít stanovený termín pro odevzdání. Vítěz ,,soutěže'' o co nejlepší řešení se může těšit na drobnou odměnu. Je možné pracovat ve dvou-tříčlenných týmech.
Řešení úloh ze cvičení a účast v ,,soutěžích'' bude dobrá průprava pro závěrečný projekt. Bude se Vám to počítat k dobru (bude stačit jednodušší projekt, ne tak precizní provedení).
Vypracování projektu a jeho prezentace
V rámci kurzu budete samostatně pracovat na projektu, který můžete řešit buď individuálně, nebo ve dvojicích či trojicích. Tento projekt následně odprezentujete před svými kolegy na cvičení. Cílem projektu je aplikace hlubokého učení na reálný datový problém a experimentování s různými metodami a technikami.
-
Co bude projekt obnášet?
- Výběr úlohy a datové sady: Zvolte si vhodnou úlohu a odpovídající datovou sadu. Může jít např. o klasifikaci, regresi, práci s obrazovými nebo sekvenčními daty – podle toho, co vás zajímá. Pokud si nebudete vědět rady, ráda vám úlohu doporučím.
- Předzpracování dat: Důležité je důkladně data připravit pro trénování modelů – může zahrnovat čištění, vektorizaci, augmentaci apod.
- Výběr a aplikace modelu: Použijte jeden nebo více modelů hlubokého učení (např. MLP, CNN, RNN, autoenkodéry), které jsou vhodné pro vámi zvolený problém.
-
Experimentování:
- Vyzkoušejte různé přístupy (např. různé modely, různé varianty jednoho modelu, různou volbu architektury či parametrů, předučené modely). Můžete také zkusit aplikovat techniky zlepšení učení (např. regularizace, dropout, augmentace dat,...). Důležitý je proces experimentování. Jak budete experimentovat (a v jakém rozsahu) nechám na vás, ale ráda poradím.
- Porovnejte výsledky více modelů nebo různých přístupů.
- Vyhodnocení: Zhodnoťte výsledky svého experimentu – jak dobře model funguje / modely fungují? Které techniky měly největší dopad a jaký? Co Vám dalo nejvíc zabrat? Naučili jste se něco nového?
- Tip: Pokud jste již pracovali nebo právě pracujete na nějakém projektu týkajícím se hlubokého učení, například v rámci bakalářské nebo jiné práce, můžete ho po domluvě použít jako projekt pro tento předmět.
- 30.10.-31.11.2024 Výběr úlohy a její schválení.
- 10-17.12.2024 Prezentace vypracovaných projektů před ostatními. Jako doplněk odevzdáte okomentovaný zdrojový kód (ideální forma je notebook), vstupní data, vizualizace výstupů a případně slidy (podklady) k prezentaci. Prezentaci je možné po domluvě uskutečnit i dříve.
- Doplnění: Pokud nestihnete projekt dokončit včas, na cvičení 10. nebo 17. prosince 2024 odprezentujete aktuální stav projektu a následně (nejpozději do 30.6.2025) odevzdáte zevrubnější zprávu o řešení, finální obhajoba projektu pak proběhne během individuální konzultace v zimním nebo letním zkouškovém období. Stejně tak, pokud projekt a jeho prezentace budou mít větší nedostatky nebo nedostatečný rozsah, mohu vás požádat o nějaké doplnění, které mi pak odevzdáte a odprezentujete dodatečně v zimním zkouškovém období.
- Popis úlohy, kterou jste se rozhodli řešit.
- Popis dat (charakter dat, příznaky, počet vzorů,...) a jejich zdroj (popř. jak jste data získali).
- Jakým způsobem jste data předzpracovali.
- Popis experimentu - se kterými modely, technikami, nastaveními parametrů jste experimentovali a jak.
- Výsledky experimentu (vhodná vizualizace pomocí tabulek, obrázků a nebo grafů) + zhodnocení vlastními slovy.
- Kaggle: https://www.kaggle.com/datasets
- UCI Machine learning repository: https://archive.ics.uci.edu/
- KDnuggets: https://www.kdnuggets.com/datasets/index.html
- GitHub: https://github.com/topics/machine-learning-datasets
- Google dataset search: https://datasetsearch.research.google.com/
- OpenML https://www.openml.org/
- časové řady (např. kurzy měn, akcií),...