DM859: Applied Machine Learning (5 ECTS)

STADS: 15019401

Niveau
Kandidatkursus

Undervisningsperiode
Kurset er placeret i forårssemesteret.

Ansvarlige undervisere
Email: zimek@imada.sdu.dk

Skemaoplysninger
Hold Type Dag Tidsrum Lokale Uger Kommentar
Fælles I Tirsdag 14-16 U154 21
Fælles I Onsdag 10-12 IMADA semi 13-14,18-20
Fælles I Torsdag 08-10 U154 13
Fælles I Torsdag 08-10 IMADA semi 14,17-20
H1 TE Mandag 09-11 IMADA semi 14,18-21
H1 TE Onsdag 10-12 IMADA semi 17
Vis hele skemaet
Vis personligt skema for dette kursus.

Kommentar:
Ubegrænset deltagerantal. Fælles undervisning med DM855.

Indgangskrav:
Indgangskrav er en bachelor uddannelse i datalogi.

Faglige forudsætninger:
Studerende, der følger kurset, forventes at:
  • Have kendskab til programmering samt en basal forståelse for sandsynlighed og matematik.
  • Kurset er co-undervist med DM855. Kurset kan ikke blive valgt af studerende, der enten har fulgt, eller har bestået DM855.
 


Formål
Formålet med kurset er at introducere de studerende til data mining og maskinlærings teknikker. Kurset fokuserer på en lang række avancerede teknikker indenfor data mining på store og alsidige datasæt. De underviste teknikker bruges til biomedicinsk data, fra finansielle, samfundsvidenskabelige, kommercielle og naturvidenskabelige forskningsområder.  I bred forstand gør metoderne det muligt for computer systemer at identificere meningsfyldte mønstre i data og adaptivt forbedre deres præstation på baggrund af akkumuleret erfaring fra det observerede data. Kurset introducerer de nyeste og mest avancerede maskinlæringsteknikker på en praktisk og anvendelsesorienteret måde. De studerende får mulighed for at eksperimentere med og anvende de introducerede teknikker på udvalgte problemstillinger. 

Metoderne kan anvendes på alle former for data såsom finansielt, samfundsvidenskabeligt, kommercielt eller videnskabeligt data.

Kurset giver et fagligt grundlag for at lave et speciale indenfor machine learning og data mining.

I forhold til uddannelsens kompetenceprofil har kurset eksplicit fokus på at:

  • Give kompetence til at planlægge og udføre komplekse maskinlæringsopgaver
  • Give viden om almindelige data mining opgaver og metoder
  • Give viden om anvendelse af almindelige data mining metoder på reelle problemstillinger
  • Give færdigheder i design af nye varianter af data mining metoder
  • Give færdigheder i programmering og brug af computer værktøjer til at udføre data mining opgaver
  • Give viden om generel eksperimentelt design med fokus  på statistisk analyse og databehandling.
  • Give kompetence til fortolkning af eksperimentel data ved hjælpe af computationelle metoder

 



Målbeskrivelse
For at opnå kursets formål er det læringsmålet for kurset, at den studerende demonstrerer evnen til at:
  • Beskrive de data mining opgaver som præsenteres i kurset
  • Beskrive de algoritmer og metoder som bliver præsenteret i kurset
  • Beskrive de emner der bliver præsenteret i kurset i et præcist matematisk sprog
  • Forklare de enkelte trin i de matematiske udledninger der præsenteres i kurset
  • Anvende metoderne på simple problemstillinger
  • Anvende metoderne på andre problemstillinger end dem der bliver præsenteret i kurset
  • Vurdere og reflektere over valg af design af data mining og statistiske lærings systemer
  • Foretage eksperimentelle vurderinger af data mining metoder og rapportere resultaterne.
 


Indhold
Kurset indeholder følgende faglige hovedområder:
  • Forberedelse af og oprydning af data (f. eks. Featureudvælgelsesmetoder, outlier detektion)
  • Specifikke data mining teknikker såsom:
    • random forests,
    • neurale netværker,
    • support vector machines, og
    • regression, deres intuition anvendelse
 


Litteratur
    Meddeles ved kursets start.


Kursets hjemmeside
Dette kursus benytter e-learn (blackboard).

Forudsætningsprøver
  1. Udvalgte hjemme opgaver. Forudsætningsprøven er en forudsætning for deltagelse i eksamenselement a. Bedømmes bestået/ikke-bestået, intern censur ved underviser. (15019412).

     

Eksamen- og censurform:
  1. Oral exam. (5 ECTS). Ekstern censur, 7-trinsskala. Tilladt hjælpemiddel er Blackboard/Whiteboard. (15019402).
Vejledende timetal
På naturvidenskab er undervisningen tilrettelagt efter trefasemodellen dvs. intro, trænings- og studiefasen.
Introfase: 24 timer
Træningsfase: 12 timer, heraf:
 - Eksaminatorie: 12 timer

Aktiviteter i studiefasen
  • Læse lærebogen
  • Løse hjemmeopgaver
  • Anvende opnået viden i et praktisk projekt
 
Undervisningsform
I introfasen introduceres og perspektiveres begreber, teorier og modeller. I træningsfasen træner de studerende færdigheder og trænger dybere ned i det stof. I studiefasen får de studerende faglige, personlige og sociale erfaringer, der sætter dem i stand til at befæste og videreudvikle deres videnskabelige kompetencer. Der er fokus på fordybelse, forståelse og udvikling af samarbejdskompetencer.

Sprog
Dette kursus undervises på dansk eller engelsk, afhængigt af underviseren. Dog altid på Engelsk ved deltagelse af internationale studerende.

Bemærkninger
Studerende der tildligere har bestået DM205 kan ikke følge kurset.

Kursustilmelding
Se tilmeldingsfrister.

Pris for åben uddannelse
Se priser for enkeltkurser.

Dette er den nyeste version af en kursusbeskrivelse, som trådte i kraft den 1. feb 2017.