Fra Begrebsordbog til FrameNet: en dansk rammeordbog til brug for sprogteknologi – Københavns Universitet

LEDA > Kalender > Fra Begrebsordbog til ...

Fra Begrebsordbog til FrameNet: en dansk rammeordbog til brug for sprogteknologi

v. Sanni Nimb og Mette-Marie Møller Svendsen, DSL

Medlemsmøde


I løbet af 2017 har man på DSL færdiggjort en sprogteknologisk ordbog hvor et stort antal verber og verbalsubstantiver fra Den Danske Ordbog er forsynet med formelle kategorier der beskriver deres betydning i form af frames (på dansk rammer). Kategorierne udgør en international standard udarbejdet ved projektet FrameNet, University of California, Berkeley. Verbet løbe har fx rammerne ’Self_motion’ og ’Fluidic_motion’ i ordbogen, svarende til betydningerne ‘bevæge sig hurtigt fremad til fods’ og ‘vedvarende flyde i dråbeform eller i en jævn strøm (om væske)’ i Den Danske Ordbog. Derudover har løbe også en række rammer der dækker nogle af de faste udtryk og kollokationer som ordet indgår i, fx ’løbe en risiko’ med rammen ’Run_risk’ og ’løbe fra et løfte’ med ’Going_back_on_a_commitment’. Projektet er finansieret af Carlsbergfondet og udført i samarbejde med Københavns Universitet. Ordbogen skal først og fremmest bruges som opslagsværk i kommende sprogteknologiske forskningsprojekter når lingvister manuelt skal opmærke danske korpussætninger med rammer og semantiske roller. De semantiske roller som en ramme knytter til sig (fx har Self_motion den tilknyttede rolle Self_mover), er ikke beskrevet i den danske rammeordbog, men skal overføres fra det engelske FrameNets rammebeskrivelse når sætningen opmærkes. De opmærkede sætninger skal efterfølgende bruges som træningsmateriale når sprogteknologiske forskere skal forsøge at udlede algoritmer der beskriver typiske betydningsmønstre i danske tekster.

I foredraget vil Sanni Nimb (seniorredaktør, DSL) fortælle om baggrunden for ordbogsprojektet og om den leksikalske metode der er anvendt. Metoden bygger på de grupperinger af Den Danske Ordbogs lemmaer og flerordsudtryk der blev foretaget til brug for udgivelsen af Den Danske Begrebsordbog i 2015. Nogle af de rammer der hyppigst er anvendt til at beskrive de danske ord, vil også blive præsenteret. Efterfølgende vil Mette-Marie Møller Svendsen (assisterende redaktør, DSL), der har skrevet speciale om FrameNet og tilblivelsen af den danske rammeordbog, diskutere de oversættelsesmæssige problemstillinger ved den valgte metode samt drage paralleller til lignende projekter for andre sprog især svensk.

Alle er velkomne.
Der vil blive serveret kaffe og te i pausen.

Hostes af Københavns Universitet