Supersenses - en semantisk opmærkning af et dansk korpus med grovkornede betydninger

foredrag ved Héctor Martínez Alonso og Sussi Olsen, CST, NFI, Københavns Universitet

Supersenses er brede betydningskategorier, en form for overordnet genus proximum, opfundet til at lette leksikografers arbejde under udviklingen af WordNet. Siden er supersenses blevet anvendt bredt internationalt til semantisk opmærkning af ord i løbende tekst. I FKK-projektet Semantic Processing across Domains har vi opmærket et dansk korpus med et revideret sæt af supersenses.

På LEDA-mødet vil vi fortælle om opmærkningsprocessen og resultaterne: hvor enige var annotørerne, hvilke supersenses optræder hyppigst i hvilken type tekst, og hvad kan det opmærkede korpus bruges til. Men vi vil også fortælle om vores udvidelser af det oprindelige supersense-inventar, erfaringerne med udvidelserne, og hvordan et optimalt sæt af supersenses bør se ud.


Som sædvanlig er alle velkomne, og der vil være kaffe/te i pausen.

Vel mødt!