CILJ KOLEGIJA: Upoznavanje s nekoliko naprednih tema iz područja relacijskih baza podataka, skladištima podataka, NoSQL paradigmom te smještajem i obradama velikih podataka (big data).
NASTAVNI SADRŽAJI:
1. Proširenja znanja o relacijskim bazama podataka. Složeni tipovi podataka. Distribuirane baze podataka. Ciljevi, svrha, prednosti i mane distribuiranja podataka. Struktura distribuirane baze, replikacija, fragmentacija. Protokoli za izvršavanje distribuiranih transakcija.
2. NoSQL paradigma. Razlozi nastanka. Agregatni model podataka. Svojstva NoSQL baza podataka. Konzistencija i CAP teorem. Vrste NoSQL baza podataka: ključ-vrijednost, dokumentske, grafovske i obitelj-stupaca baze podataka. Map/reduce algoritam u NoSQL bazama podataka.
3. Skladišta podataka (data warehouses). Ciljevi i svrha skladištenja podataka. Modeli skladišta podataka. Postupak modeliranja skladišta. OLAP. Postupak punjenja skladišta podataka (ETL).
4. Veliki podaci (big data). Distriburani datotečni sustavi. Google FS i HDFS. Apache Hadoop ekosustav. Map/reduce algoritam. Distribuirana izračunavanja i analize. Apache Spark.
|
-
NoSQL Distilled: A Brief Guide to the Emerging World of Polyglot Persistence, Pramod J. Sadalage, Martin Fowler, Addison Wesley, 2012.
-
The Data Warehouse Toolkit - The Complete Guide to Dimensional Modeling, 2nd edition, R. Kimball, M. Ross, John Wiley & Sons, 2002.
-
Seven Databases in Seven Weeks: A Guide to Modern Databases and the NoSQL Movement, Eric Redmond, Jim Wilson, Pragmatic Bookshelf, 2012.
-
Hadoop in practice, Alex Holmes, Manning, 2012.
-
Database System Concepts, 4th edition, A. Silberschatz, H. F. Korth, S. Sudarshan, McGraw-Hill, 2001.
|