Subject

Вовед во рударење на масивни податоци

1. Наслов на наставниот предмет Вовед во рударење на масивни податоци
Introduction to mining massive dataset
2. Код F23L3W154
3. Студиска програма
4. Организатор на студиската програма (единица, односно институт, катедра, оддел) Faculty of Computer Science and Engineering
5. Степен (прв, втор, трет циклус) First Cycle
6. Академска година / семестар 7 / Зимски
7. Број на ЕКТС кредити 6
8. Наставник Ефтим Здравевски, Ѓорѓи Маџаров
9. Предуслови за запишување на предметот Алгоритми и податочни структури или Примена на алгоритми и податочни структури
10. Цели на предметната програма (компетенции) Студентите да се запознаат со алгоритмите и техниките на податочно рударење и машинско учење за анализа на големи податочни множества. Фокус ќе биде даден на дистрибуираните платформи како и на начинот на дефинирање и креирање на алгоритми за процесирање и анализа на многу големи податочни множества.
11. Содржина на предметната програма Предавања:
1. Вовед во MapReduce
2. Фреквентни множества и асоцијативни правила
3. Барање на најблиски соседи во многу-димензионални податоци, локациски сензитивни хеширања
4. Намалување на димензионалноста (SVD и CUR)
5. Системи на препораки базирани на колаборативно филтрирање
6. Системи на препораки базирани на содржина и хибридни системи за препораки
7. Кластерирање на масивни податочни множества
8. Надгледувано учење кај масивни податочни множества (К-најблиски соседи, апроксимативен К-најблиски соседи)
9. Надгледувано учење кај масивни податочни множества (класификациски и регресиски дрвa)
10. Надгледувано учење кај масивни податочни множества (длабоки невронски мрежи)
11. Континуирана обработка на масивни податоци базирано на прозорец
12. Рударење на податоци репрезентирани со графови

Вежби:
1. Примери на MapReduce
2. Градење на асоцијативни правила
3. Употреба на локациски сензитивни хеширања и барање на најблиски соседи во многу-димензионални податоци
4. Употреба на SVD и CUR
5. Работа со алгоритми за препораки базирани на колаборативно филтрирање
6. Работа со алгоритми за препораки базирани на содржина и колаборативно филтрирање
7. Употреба на методи за кластерирање на масивни податочни множества
8. Употреба на методите К-најблиски соседи на реални проблеми
9. Работа со класификациски и регресиски дрвa
10. Работа со длабоки невронски мрежи за анализа на масивни податочни множества (само-надгледувано учење)
11. Работа со алгоритми за континуирана обработка на масивни податоци базирано на прозорец
12. Работа со граф невронски мрежи
12. Методи на учење Предавања со користење на презентации, интерактивни предавања, вежби (користење на опрема и софтверски пакети), тимска работа, пример случаи, поканети гости предавачи, самостојна изработка и одбрана на проектна задача и семинарска работа.
13. Вкупен расположив фонд на време 6 ЕКТС x 30 часа = 180 часа
14. Распределба на расположивото време 30 + 45 + 0 + 30 + 75 = 180 часа
15. Форми на наставните активности
15.1. Предавања - теоретска настава 30 часови
15.2. Вежби (лабораториски, аудиториски), семинари, тимска работа 45 часови
16. Други форми на активности
16.1. Проектни задачи 30 часови
16.2. Самостојни задачи 0 часови
16.3. Домашно учење 75 часови
17. Начин на оценување
17.1. Тестови 0 бодови
17.2. Семинарска работа / проект ( презентација: писмена и усна) 30 бодови
17.3. Активности и учење 0 бодови
17.4. Завршен испит 60 бодови
18. Критериуми за оценување (бодови/ оценка)
до 50 бода5 (пет) (F)
од 51 до 60 бода6 (шест) (E)
од 61 до 70 бода7 (седум) (D)
од 71 до 80 бода8 (осум) (C)
од 81 до 90 бода9 (девет) (B)
од 91 до 100 бода10 (десет) (A)
19. Услов за потпис и полагање на завршен испит реализирани активности
20. Јазик на кој се изведува наставата македонски и англиски
21. Метод на следење на квалитетот на наставата механизам на интерна евалуација и анкети
22. Literature
22.1. Задолжителна литература
1. Jure Leskovec, Anand Rajaraman, Jeffrey D. Ullman | Mining of Massive Datasets | Cambridge University Press | 2020
2. Avrim Blum, John Hopcroft, and Ravindran Kannan | Foundations of Data Science | Draft version | 2017
3. Jiawei Han,‎ Micheline Kamber,‎ and Jian Pei | Data Mining: Concepts and Techniques, Third Edition | Morgan Kaufmann | 2011
4.
22.2. Дополнителна литература
Ред.бр. Автор Наслов Издавач Година