DM864: Advanced Data Mining (5 ECTS)
STADS: 15020101
Niveau
Kandidatkursus
Undervisningsperiode
Kurset er placeret i forårssemesteret.
Ansvarlige undervisere
Email: zimek@imada.sdu.dk
Skemaoplysninger
Hold |
Type |
Dag |
Tidsrum |
Lokale |
Uger |
Kommentar |
Fælles |
I |
Mandag |
10-12 |
IMADA semi |
17 |
|
Fælles |
I |
Mandag |
09-11 |
IMADA semi |
22 |
|
Fælles |
I |
Tirsdag |
16-18 |
IMADA semi |
17 |
|
Fælles |
I |
Torsdag |
16-18 |
U144 |
14 |
|
Fælles |
I |
Torsdag |
16-18 |
IMADA semi |
15-16,21-22 |
|
Fælles |
I |
Fredag |
13-15 |
U142 |
14 |
|
Fælles |
I |
Fredag |
13-15 |
IMADA semi |
15-16,21 |
|
H1 |
TE |
Onsdag |
12-14 |
IMADA semi |
14-17,21-22 |
|
Vis hele skemaet
Vis personligt skema for dette kursus.
Kommentar:
Ubegrænset deltagerantal
Indgangskrav:
Ingen
Faglige forudsætninger:
Studerende, der følger kurset, forventes at:
- Have en basal forståelse for sandsynlighed og matematik;
- Have kendskab til programmering;
- Have kendskab af grundelementer af unsupervised data mining, fx, fra kurset DM555 eller fra kurset DM843 (kan kombineres med kurset).
FormålKurset har til formål at sætte den studerende i stand til at forstå og at anvende avancerede data mining metoder, fx ensemble metoder for clustering og outlier detection eller metoder for høj dimensional data (fx, subspace clustering), hvilket er vigtigt i forhold til at håndtere med kompleks, vanskelige og høj dimensional data i forskellige anvendelser.
Kurset bygger oven på den viden, der er erhvervet i kurserne DM555 eller DM843, og giver et fagligt grundlag for at anvendt projekter eller skrive speciale i emner relateret til unsupervised analyse af kompleks, vanskelig og høj dimensional data.
I forhold til uddannelsens kompetenceprofil har kurset eksplicit fokus på at:
- Give kompetence til at beskrive, analysere og løse avancerede problemstillinger i unsupervised data mining ved anvendelse af de lærte modeller og metoder.
- Give kompetence til at analyse fordelene og ulemper ved forskelige metoder på avanceret unsupervised data mining.
- Give færdigheder i tilstrækkelig brug af de lærte modeller og metoder.
- Give viden og forstand om udvælgelse af specialiseret modeller og metoder på unsupervised data mining med ensemble tekniker eller adaptioner til høj dimensional data, herunder metoder fra fagets forskningsfront.
MålbeskrivelseFor at opnå kursets formål er det læringsmålet for kurset, at den studerende demonstrerer evnen til at:
- beskrive de data mining opgaver som præsenteres i kurset;
- beskrive de algoritmer og metoder som bliver præsenteret i kurset;
- beskrive de emner der bliver præsenteret i kurset i et præcist matematisk sprog;
- forklare de enkelte trin i de matematiske udledninger der præsenteres i kurset;
- anvende metoderne på andre problemstillinger end dem der bliver præsenteret i kurset;
- vurdere og reflektere over valg af design af data mining metoder for høj dimensional data og ensemble metoder.
IndholdKurset indeholder følgende faglige hovedområder:
- generelle principper og metoder for ensemble læring;
- specielle udfordringer og tilgange for ensemble clustering og ensemble outlier detection;
- udvalgte metoder for ensemble clustering og ensemble outlier detection;
- specielle udfordringer for data mining høj dimensional data;
- generelle tilgange for unsupervised læring i høj dimensional data;
- udvalgte metoder for subspace clustering;
- udvalgte metoder for høj dimensional outlier detection.
LitteraturMeddeles ved kursets start
Kursets hjemmeside
Dette kursus benytter
e-learn (blackboard).
Forudsætningsprøver
- Præsentation af en eller flere videnskabelige artikler i klassen. Bestået/ikke-bestået, intern censur ved underviser. Forudsætningsprøven er en forudsætning for deltagelse i eksamenselement a). (15020112).
Eksamen- og censurform:
- Mundtlig eksamen. Ekstern censur, 7-trinsskala. Nærmere beskrivelse af eksamensreglerne vil blive offentliggjort under 'Course Information' på kursets side i Blackboard. (5 ECTS). (15020102).
Vejledende timetal
På naturvidenskab er undervisningen tilrettelagt efter trefasemodellen dvs. intro, trænings- og studiefasen.
Introfase: 24 timer
Træningsfase: 12 timer, heraf:
- Eksaminatorie: 12 timer
Aktiviteter i studiefasen
- Læse lærebogen og artikler
- Løse hjemmeopgaver
- Anvende opnået viden i praktiske projekter
UndervisningsformSe engelsk udgave af kursusbeskrivelsen.
Sprog
Dette kursus undervises på dansk eller engelsk, afhængigt af underviseren. Dog altid på Engelsk ved deltagelse af internationale studerende.
Kursustilmelding
Se tilmeldingsfrister.
Pris for åben uddannelse
Se priser for enkeltkurser.
Denne kursusbeskrivelse var gyldig fra 1. februar 2018 til 31. august 2020.