Dubinska analiza i otkrivanje znanja iz podataka

Repozitorij

Repozitorij je prazan

Anketa

Na ovoj stranici trenutno nije odabrana niti jedna anketa!

Dubinska analiza i otkrivanje znanja iz podataka

Šifra: 255123
ECTS: 5.0
Nositelji: doc. dr. sc. Matej Mihelčić
Prijava ispita: Studomat
Opterećenje:

1. komponenta

Vrsta nastaveUkupno
Predavanja 45
* Opterećenje je izraženo u školskim satima (1 školski sat = 45 minuta)
Opis predmeta:
CILJ KOLEGIJA: Upoznavanje studenata s raznim metodama za dubinsku analizu podataka. Isticanje njihovih prednosti, mana, potrebnog formata ulaznih podataka i opis pripadnih rezultata.

NASTAVNI SADRŽAJI:
1. Uvod. O dubinskoj analizi podataka i ulaznim tabularnim podacima. (1 tjedan)
2. Osnovne mjere dubinske analize podataka i teorije informacija. Ponavljanje nekih bitnijih definicija iz statistike (varijanca, očekivanje i slično). Definicija entropije, dobiti informacija, mjere zajedničke informacije. Osnovne mjere evaluacije modela (često korištene i kod dubinske analize podataka), točnost, preciznost itd. (1 tjedan)
3. Uvod u stabla odlučivanja. Opis modela stabla odlučivanja, treniranje modela, stvaranje predviđanja. Evaluacija modela. (1 tjedan)
4. Konstrukcija pravila. Opis skupova pravila, treniranje, cilj, evaluacija. (1 tjedan)
5. Zatvoreni i frekventni skupovi objekata. Algoritmi za stvaranje zatvorenih i frekventnih skupova objekata, ciljevi, znanje koje mogu otkriti. (1 tjedan)
6. Asocijacijska pravila. Opis problema i algoritma za stvaranje asocijacijskih pravila, primjene i otkrivenog znanja. (1 tjedan)
7. Traženje podgrupa. Opis problema, algoritam za traženje podgrupa, evaluacija, primjene. (1 tjedan)
8. Traženje izvanrednih modela. Opis problema, algoritam za traženje izvanrednih modela, analiza dobivenog znanja. (1 tjedan)
9. Konceptualno klasteriranje. Osnovno o klasteriranju. Opis problema konceptualnog klasteriranja uz navođenje razlika od osnovnog zadatka klasteriranja, osnovni algoritam za konceptualno klasteriranje, analiza dobivenog znanja. (2 tjedna)
10. Traženje redeskripcija. Opis problema, najpoznatijih pristupa i analiza dobivenog znanja. (1 tjedan)
11. Osnove postprocesiranja i vizualizacije podataka. Analiza dobivenih modela, skupova pravila, vizualizacija ulaznih podataka i rezultata. (2 tjedna)
Literatura:
  1. Data mining and knowledge discovery handbook, Lior Rokach, Springer, New York, 2005.
  2. Foundations of Rule Learning, Johannes Furnkranz, Dragan Gamberger, Nada Lavrač, Springer Science & Business Media, 2012.
  3. Redescription mining, Esther Galbrun, Pauli Miettinen, Springer, Cham, 2017.
  4. Data mining: the textbook, Aggarwal, Springer, New York, 2015.
  5. Journal of Machine learning research, Nada Lavrač et al. Subgroup Discovery with CN2-SD, 2004.
  6. Artificial Intelligence Reviews, A review of conceptual clustering algorithms, 2019.
1. semestar Ne predaje se
Izborni predmet 1, 2, 3 - Redovni Studij - Matematička statistika

2. semestar
Izborni predmet 1, 2, 3 - Redovni Studij - Matematička statistika

3. semestar Ne predaje se
Izborni predmet 4, 5, 6, 7 - Redovni Studij - Matematička statistika

4. semestar
Izborni predmet 4, 5, 6, 7 - Redovni Studij - Matematička statistika
Termini konzultacija:
  • doc. dr. sc. Matej Mihelčić:

    Softversko inženjerstvo: četvrtak, 15h-17h

    Primijenjeno objektno programiranje: utorak, 15h-17h

    Mreže računala: srijeda, 10h-12h

    Obavezna najava mailom! 

    Lokacija: 226

Obavijesti