Subject
Податочно рударење
| 1. | Наслов на наставниот предмет |
Податочно рударење Data Mining |
||||||||||||
| 2. | Код | F23L3S150 | ||||||||||||
| 3. | Студиска програма | Статистика и аналитика на податоци | ||||||||||||
| 4. | Организатор на студиската програма (единица, односно институт, катедра, оддел) | Факултет за информатички науки и компјутерско инженерство | ||||||||||||
| 5. | Степен (прв, втор, трет циклус) | Прв циклус | ||||||||||||
| 6. | Академска година / семестар | 6 / Летен | ||||||||||||
| 7. | Број на ЕКТС кредити | 6 | ||||||||||||
| 8. | Наставник | Билјана Тојтовска Рибарски, Бојан Илијоски | ||||||||||||
| 9. | Предуслови за запишување на предметот | Веројатност и статистика или Математика 3 или Основи на теорија на информации или Бизнис Статистика | ||||||||||||
| 10. | Цели на предметната програма (компетенции) | Запознавање со методи за идентификација на валидни, нови, корисни и разбирливи шеми во податоци и откривања на нови знаења. Претпроцесирање на податоците. Вовед во предиктивни модели од податоците: класификација, регресијa. Откривање на кластери. Совладување на техники за собирање на податоци, нивно траксформирање во облик погоден за интерно користење и нивно зачувување. | ||||||||||||
| 11. | Содржина на предметната програма | 1. 1. Вовед, примери за примена на методите на податочно рударење. Типови на податоци. Мерки на сличност и растојание меѓу податоците: мерки на сличност и растојание за номинални и бинарни. Стандардизација на нумерички атрибути. Мерки на растојание за нумерички атрибути: Растојание на Минковски и специјални видови, косинусно растојание, евклидско ратојание, Махаланобиево растојание. Растојание меѓу податоци со мешани атрибути. 2. Техники за претпроцесирање на податоци: Квалитет на податоци, чистење на податочно множество, Интегрирање на податоци, редукција на податоци, трансформација на податоци и дискретизација на податоци. 3. Напредна визуелизација на податоците. 4. Модели за предвидување, регресиони модели. Напредни концепти (анализа на резидуали, confounding, adjustment, толкување на резултати) 5. Класификација. Надгледувано и ненадгледувано учење. Класификација со дрва на одлучување. LDA класификација 6. Кластерирање и евалуација на кластери. 7. Детекција и справување со аутлаери 8. Евалуација на модели 9. Анализирање на временски податоци и временски серии 10. Екстрахирање, трансформирање и зачувување на податоци (Extract, Тransform, Load) 11. Екстрахирање, трансформирање и зачувување на податоци (Extract, Тransform, Load) 12. Завршен проект |
||||||||||||
| 12. | Методи на учење | предавања, аудиториски вежби, лабораториски вежби, проектни задачи, домашни задачи, разработка на програмски пакет со методи за податочно рударење | ||||||||||||
| 13. | Вкупен расположив фонд на време | 6 ЕКТС x 30 часа = 180 часа | ||||||||||||
| 14. | Распределба на расположивото време | 30 + 45 + 0 + 30 + 75 = 180 часа | ||||||||||||
| 15. | Форми на наставните активности |
|
||||||||||||
| 16. | Други форми на активности |
|
||||||||||||
| 17. | Начин на оценување |
|
||||||||||||
| 18. | Критериуми за оценување (бодови/ оценка) |
|
||||||||||||
| 19. | Услов за потпис и полагање на завршен испит | Реализирани активности 15, 16 | ||||||||||||
| 20. | Јазик на кој се изведува наставата | македонски и англиски | ||||||||||||
| 21. | Метод на следење на квалитетот на наставата | механизам на интерна евалуација и анкети | ||||||||||||
| 22. | Литература |
|