DM838: Data Mining (10 ECTS)

STADS: 15014601

Niveau
Kandidatkursus

Undervisningsperiode
Kurset er placeret i forårssemesteret.

Ansvarlige undervisere
Ingen ansvarlige undervisere angivet, kontakt eventuelt instituttet

Skemaoplysninger
Hold Type Dag Tidsrum Lokale Uger Kommentar
Fælles I Tirsdag 16-18 Spørg underviseren 06-13
Fælles I Onsdag 10-12 IMADA Seminarrum 06-13
Fælles I Onsdag 08-10 IMADA Seminarrum 15-22
Fælles I Torsdag 12-14 IMADA Seminarrum 06-13
Fælles I Torsdag 08-10 IMADA Seminarrum 15-22
Fælles I Fredag 08-10 IMADA Seminarrum 15-22
Vis hele skemaet
Vis personligt skema for dette kursus.

Kommentar:
Underviser: Fabio Vandin. Ubegrænset deltagerantal. 3. + 4. kvartal.

Indgangskrav:
Ingen

Faglige forudsætninger:
Stoffet fra DM507 Algoritmer og Datastrukturer, DM535 Diskrete metoder til datalogi og DM536 Introduktion til programmering skal være kendt.

Kursusintroduktion
I løbet af de sidste par år har fremskridtet inden for teknologier for data anskaffelse ført til en eksponentiel vækst af data, der rutinemæssigt akkumuleres af mange organisationer (teknologi virksomheder, videnskabelige laboratorier osv.). Dette har øget interessen for data mining, der handler om udvinding af skjulte og nyttige oplysninger fra et datasæt på grund af den potentielle effekt af mønstre opdaget i disse datasæt.

Dette kursus præsenterer de mest almindelige teknikker til at udføre grundlæggende data mining (f.eks klyngedannelse, klassificering, association rules mining), samt metoder til mere komplekse opgaver (fx datastream og netværk mining). En særlig vægt er givet til teknikker til behandling og mining af massive mængder af data, dvs data, der ikke passer ind i hovedhukommelsen. For de fleste af de præsenterede teknikker gives en formel beregningsmæssige beskrivelse ud over af de grundlæggende ideer og intuition. Desuden vil eleverne have mulighed for at eksperimentere og anvende data mining teknikker på et udvalgt problem.

Kompetencer
Ved afslutningen af kurset forventes den studerende at kende de mest almindelige metoder til at udføre standard data mining opgaver, samt mere avancerede teknikker til mere komplekse opgaver og for meget store mængder af data.

Forventet læringsudbytte
Ved afslutningen af kurset forventes den studerende at kunne:

  • Skelne i mellem, samt beskrive de data mining teknikker og problemstillinger som er præsenteret i kurset
  • Genkende hvilken metode er velegnet til en given data mining opgave
  • Beskrive klart og præcist algoritmer præsenteret i kurset
  • Anvende disse metoder til små legetøjs problemer
  • Foretage eksperimentelle evalueringer af data mining metoder og rapportere resultaterne
Emneoversigt
Klyngedannelse, Klassificering, Association Rules, Itemsets Mining, Graph Mining, sociale netværk, Collaborative filtrering, Finde Lignende Varer, Data Stream Mining.

Litteratur
    Meddeles ved kursets start.


Kursets hjemmeside
Dette kursus benytter e-learn (blackboard).

Forudsætningsprøver
Projekt. Bestået/ikke-bestået (15014612)

Eksamen- og censurform:
Mundtlig eksamen. Ekstern censur, bedømmes efter 7-trins skalaen (10 ECTS). Projektet består af milepæle i form af obligatoriske opgaver i løbet af kurset.

(STADS: 15014602)

Vejledende timetal
På naturvidenskab er undervisningen tilrettelagt efter trefasemodellen dvs. intro, trænings- og studiefasen.
Introfase: 42 timer
Træningsfase: 34 timer, heraf:
 - Eksaminatorie: 14 timer

Aktiviteter i studiefasen Studiefase: 24 timer

Sprog
Dette kursus undervises på engelsk.

Kursustilmelding
Se tilmeldingsfrister.

Pris for åben uddannelse
Se priser for enkeltkurser.

Dette er den nyeste version af en kursusbeskrivelse, som trådte i kraft den 1. feb 2014.