DanTermBank for leksikografer

Fase I af det VELUX-støttede projekt ’Etablering af grundlaget for en dansk term- og vidensbase’ blev afsluttet med udgangen af 2014. Projektets primære mål var at udvikle automatiske metoder og prototyper til avanceret terminologiarbejde. Projektet omfattede tre delprojekter: 1. automatisk ekstraktion af termer og viden om termer fra tekster på Internettet, 2. automatisk konstruktion og validering af terminologiske ontologier (begrebsmodeller) og 3. metoder til brugerorienteret vidensformidling. I alle delprojekter er der opnået væsentlige resultater.

Herudover er der opnået nogle yderligere resultater, som er en forudsætning for oprettelsen af en dansk term- og vidensbank, og som kan give vigtig viden til andre, der planlægger oprettelse af en terminologibank: 1. udvikling af en metadata-taksonomi for terminologiske oplysningstyper, som er baseret på sprogvidenskabelige kategorier, hvilket letter valget af oplysningstyper ved planlægningen af en termbase og sikrer konsistens ved tilføjelse af nye kategorier, 2. udvikling af en datastruktur, som giver en stor fleksibilitet, fx ved håndtering af terminologi på flere sprog, hvor der ikke er en-til-en ækvivalens mellem begreberne, 3. udvikling af principperne for en emneklassifikation, som skal sikre høj grad af brugervenlighed ved klassificering og fremsøgning af begreber i vidensbanken og 4. gennemførelse af brugerundersøgelser i to folkeskoler og et gymnasium, hvor formålet var at teste, om eleverne kunne anvende terminologiske ontologier til besvarelse af spørgsmål i opgaver.

I vores indlæg vil vi fortælle om projektresultaterne og deres anvendelse i leksikografisk sammenhæng.

Der henvises til projektets hjemmeside på http://dantermbank.cbs.dk/dtb.

Oplægget holdes af Bodil Nistrup Madsen og Hanne Erdman Thomsen, Institut for International Business Communication, CBS.