Email: rolf@imada.sdu.dk
Undervejs skal deltagerne implementere deres egen søgemaskine. Dette vil ske i større arbejdsgrupper, i den hensigt at øge deltagernes erfaring i samarbejde og projektstyring.
Forventet læringsudbytte
Efter kurset forventes den studerende at kunne:
- detaljeret forklare de algoritmiske og matematiske metoder bag hovedkomponenterne i en søgemaskine for WWW, herunder komponenterne for dataindsamling, indeksering, forespørgselsbesvarelse og rankning af svar.
- gengive de i kurset gennemgåede statistiske karakteristika for internetgrafen.
- forklare de i kurset gennemgåede modeller for internetgrafen og forklare deres egenskaber.
- forklare de øvrige i kurset gennemgåede algoritmiske og matematiske metoder af relevans for analyse af internettet, herunder metoder til at måle websiders similaritet.
- under udførelsen af ovenstående udvise matematisk præcision, logisk stringens, samt evne til at kunne udvælge de centrale og væsentlige dele af stoffet.
- konstruere en velfungerende prototype af en websøgemaskine ved at implementere de algoritmiske metoder bag hovedkomponenterne i en sådan søgemaskine, herunder komponenterne for dataindsamling, indeksering, forespørgselsbesvarelse og rankning af svar,
- på klar og velstruktureret måde dokumentere det udførte arbejde og designvalgene truffet undervejs, herunder beskrive den overordnede struktur af programmet samt principperne i de algoritmisk og programmeringsmæssigt centrale dele af programmet.
Emneoversigt
Opbygning af en søgemaskine: web crawling, indeksering, ranking, behandling af forespørgsler. Delemner herunder er bla. internet protokoller, algoritmer og datastrukturer for tekstdata, håndtering af massive datamængder, komprimering, og linkbaseret ranking. Derudover berøres emner som klassisk information retrieval, clustering, grafmodeller for internettet, web caching, samt anvendelser af spilteori på internettet.
Litteratur