DM855: Data Mining for Translational Medicine (5 ECTS)

STADS: 15019001

Niveau
Kandidatkursus

Undervisningsperiode
Kurset er placeret i forårssemesteret.

Ansvarlige undervisere
Email: zimek@imada.sdu.dk

Skemaoplysninger
Hold Type Dag Tidsrum Lokale Uger Kommentar
Fælles I Tirsdag 14-16 U154 21
Fælles I Onsdag 10-12 IMADA semi 13-14,18-20
Fælles I Torsdag 08-10 U154 13
Fælles I Torsdag 08-10 IMADA semi 14,17-20
H1 TE Mandag 09-11 IMADA semi 14,18-21
H1 TE Onsdag 10-12 IMADA semi 17
Vis hele skemaet
Vis personligt skema for dette kursus.

Kommentar:
Ubegrænset deltagerantal. Fælles undervisning med DM859 Applied Machine Learning.

Indgangskrav:
Ingen

Faglige forudsætninger:
Studerende, der følger kurset, forventes at:
  • Have kendskab til programmering samt en basal forståelse for sandsynlighed og matematik.
Kurset er co-undervist med DM859. Kurset kan ikke vælges af studerende, der enten har fulgt, eller har bestået DM859.

Formål
Formålet med kurset er at introducere de studerende til de data mining og maskinlærings teknikker der bruges i translationel medicin. Kurset fokuserer på en lang række avancerede teknikker indenfor data mining på store og alsidige datasæt. De underviste teknikker bruges ikke blot til biomedicinsk data, men finder anvendelse indenfor en lang række problemstillinger fra finansielle, samfundsvidenskabelige, kommercielle og naturvidenskabelige forskningsområder. I bred forstand gør metoderne det muligt for computer systemer at identificere meningsfyldte mønstre i data og adaptivt forbedre deres præstation på baggrund af akkumuleret erfaring fra det observerede data. Kurset introducerer de nyeste og mest avancerede maskinlæringsteknikker på en praktisk og anvendelsesorienteret måde. De studerende får mulighed for at eksperimentere med og anvende de introducerede teknikker på udvalgte problemstillinger.

Kurset giver en akademisk basisviden i dataanalyse på store datasæt som er en del af uddannelsen i Biomedicinsk informatik.

I forhold til uddannelsens kompetenceprofil har kurset eksplicit fokus på at:
  • Give kompetence til at planlægge og udføre komplekse maskinlæringsopgaver.
  • Give viden om almindelige data mining opgaver og metoder.
  • Give viden om anvendelse af almindelige data mining metoder på reelle problemstillinger.
  • Give færdigheder i design af nye varianter af data mining metoder.
  • Give færdigheder i programmering og brug af computer værktøjer til at udføre data mining opgaver.
  • Give viden om generel eksperimentelt design med fokus på statistisk analyse og databehandling.
  • Give kompetence til fortolkning af eksperimentel data ved hjælpe af computationelle metoder.


Målbeskrivelse
For at opnå kursets formål er det læringsmålet for kurset, at den studerende demonstrerer evnen til at:
  • Beskrive de data mining opgaver som præsenteres i kurset
  • Beskrive de algoritmer og metoder som bliver præsenteret i kurset
  • Beskrive de emner der bliver præsenteret i kurset i et præcist matematisk sprog
  • Forklare de enkelte trin i de matematiske udledninger der præsenteres i kurset
  • Anvende metoderne på simple problemstillinger
  • Anvende metoderne på andre problemstillinger end dem der bliver præsenteret i kurset
  • Vurdere og reflektere over valg af design af data mining og statistiske lærings systemer
  • Foretage eksperimentelle vurderinger af data mining metoder og rapportere resultaterne.
 


Indhold
Kurset indeholder følgende faglige hovedområder:
Forberedelse af og oprydning af data (f. eks. Featureudvælgelsesmetoder, outlier detektion)
Specifikke data mining teknikker såsom:
  • random forests,
  • neurale netværker,
  • support vector machines, og
  • regression,
  • deres intuition anvendelse
 


Litteratur
    Meddeles ved kursets start.


Kursets hjemmeside
Dette kursus benytter e-learn (blackboard).

Forudsætningsprøver
  1. Udvalgte hjemmeopgaver, bestået/ikke-bestået, intern censur ved underviser. (15019012).
Eksamen- og censurform:
  1. Mundtlig eksamen, ekstern censur, 7-trinsskala. (5 ECTS). Tilladte hjælpemidler: blackboard/whiteboard. (15019002).
Vejledende timetal
På naturvidenskab er undervisningen tilrettelagt efter trefasemodellen dvs. intro, trænings- og studiefasen.
Introfase: 24 timer
Træningsfase: 12 timer, heraf:
 - Eksaminatorie: 12 timer

Aktiviteter i studiefasen
  • Læse lærebogen
  • Løse hjemmeopgaver
  • Anvende opnået viden i et praktisk projekt
Undervisningsform
I introfasen introduceres og perspektiveres begreber, teorier og modeller. I træningsfasen træner de studerende færdigheder og trænger dybere ned i det stof. I studiefasen får de studerende faglige, personlige og sociale erfaringer, der sætter dem i stand til at befæste og videreudvikle deres videnskabelige kompetencer. Der er fokus på fordybelse, forståelse og udvikling af samarbejdskompetencer.
 


Sprog
Dette kursus undervises på dansk eller engelsk, afhængigt af underviseren. Dog altid på Engelsk ved deltagelse af internationale studerende.

Bemærkninger
Studerende ikke indskrevet på Biomedicinsk informatik der ønsker dette kursus, skal tage kurset DM859 Applied Machine Learning, som der samlæses med.

Kursustilmelding
Se tilmeldingsfrister.

Pris for åben uddannelse
Se priser for enkeltkurser.

Dette er den nyeste version af en kursusbeskrivelse, som trådte i kraft den 1. feb 2017.