BM121: Bioinformatik III: Biologisk sekvensanalyse (5 ECTS)

STADS: 0104041

Niveau


Undervisningsperiode

Efterår

Ansvarlige undervisere
Email: lenem@imada.sdu.dk

Skemaoplysninger
Hold Type Dag Tidsrum Lokale Uger Kommentar
Fælles I Onsdag 12-14 IMADAs seminarrum 36
Fælles I Onsdag 12-14 IMADAs seminarrum 37-41
Fælles I Onsdag 12-14 IMADAs seminarrum 45-46,48
Fælles I Onsdag 12-14 IMADAs seminarrum 47
Fælles I Fredag 08-10 IMADAs seminarrum 36-39,41,45-49
Vis hele skemaet
Vis personligt skema for dette kursus.

Kommentar:
Kurset undervises på engelsk, hvis internationale studerende deltager.

Indgangskrav:
Ingen

Faglige forudsætninger:
DM02 og ST05 eller Science statistik forudsættes kendt.

Kursusintroduktion
Formålet med kurset er at give en dybdegående forståelse af teorien og teknikkerne bag de vigtigste algoritmer i bioinformatik. Hovedvægten lægges på sekvens-alignment og evolutionstræer.

Forventet læringsudbytte
Ved kursets afslutning forventes den studerende at kunne:

- anvende dynamisk programmering til at foretage parvis alignment af DNA- og protein-sekvenser.
- beskrive overordnet, hvordan BLAST og FASTA fungerer.
- beskrive overordnet, hvordan tallene i BLOSUM- og PAM-matricerne er beregnet.
- konstruere og anvende simple HMMer til multipel alignment af DNA- og protein-sekvenser.
- implementere andre simple algoritmer til multipel alignment, bl.a. vha. et guide-træ.
- redegøre overordnet for styrker og svagheder ved de enkelte alignment-metoder.
- implementere simple algoritmer til konstruktion af evolutionstræer, f.eks. neighbor joining, UPGMA og parsimony, samt redegøre overordnet for styrker og svagheder.
- implementere et suffix-træ og beskrive nogle af dets anvendelsesmuligheder.
- kunne anvende simple probabilistiske evolutionsmodeller til at beregne likelihood for et givet evolutionstræ.
- implementere en Metropolis-algoritme for evolutionstræer.
- implementere Gibbs sampling.
- redegøre for grundprincipperne i de mest almindelige metoder til forudsigelse af protein-struktur.
- implementere en simpel algoritme til forudsigelse af RNA-struktur.

Emneoversigt
Biologien: Et kort overblik over
• DNA
• Genstrukturen i eukarioter og prokarioter
• Transkribering og translation
• Proteiner

Hidden Markov Models (HMMs)

Sekvens-alignment
• Anvendelser: ligheder, homologi-søgninger, gen-søgning
• Score-metrikker
• Ultrametriske
• Additive
• Andre (vigtige eksempler er PAM- og Blosum-matricerne)
• Global alignment
• vha. dynamisk programmering
• vha. HMMs
• Lokal alignment
• Multipel alignment
• med "sum of pairs"-score
• vha. et guide-træ

Evolutionstræer

• Tegn-baserede metoder: maximum parsimony
• Afstandsbaserede metoder
• UPGMA
• Neighbor joining
• Probabilistiske metoder: introduktion til
• maximum likelihood metoder
• Bayesiske metoder

Proteinstruktur
• Forudsigelse af sekundær struktur vha. HMMs
• Overblik over metoder til forudsigelse af tertiær struktur
• Threading
• Simulering
• Sammenligningsbaserede metoder
• Gittermodeller

RNA-struktur

Litteratur
  • R. Durbin, S. Eddy, A. Krogh, G. Mitchinson: Biological Sequence Analysis.
  • Supplerende materiale udleveres .


Pensum
Se pensumbeskrivelse.

Kursets hjemmeside
Dette kursus benytter e-learn (blackboard).

Forudsætningsprøver
Ingen

Eksamen- og censurform:
Et projekt og to mindre afleveringsopgaver. Opgaverne skal laves individuelt, og projektet i grupper af to-tre studerende. Projektet kan enten være en implementeringsopgave eller et litteraturstudie.

Projektet skal munde ud i en rapport på fem-ti sider. Intern censur ved en underviser. Bestået/ikke bestået.

Vejledende timetal
På naturvidenskab er undervisningen tilrettelagt efter trefasemodellen dvs. intro, trænings- og studiefasen.

Forelæsninger (30 timer), øvelsestimer (5 timer), Vejledning (5 timer).
Aktiviteter i studiefasen

Sprog
Der er ikke registreret nogle oplysninger om undervisningssproget.

Kursustilmelding
Se tilmeldingsfrister.

Pris for åben uddannelse
Se priser for enkeltkurser.

Denne kursusbeskrivelse var gyldig fra 1. september 2005 til 31. januar 2009.