Information Extraction und Message Understanding Conferences

Ein in dieser Hinsicht neuartiges anwendungsorientiertes Teilgebiet der Computerlinguistik ist Information Extraction, in dem es um die Erschließung textueller Inhalte nach bestimmten stereotypen Vorgaben geht, z.B.: welcher Architekt errichtete wann und wowelches Gebäude für welchen Bauherrn? Eine wichtige Rolle kommt der formalen Evaluation der Leistungsfähigkeit von Softwaresystemen des Information Extraction im Rahmen der Message Understanding Conferences (MUCs) zu; Vergleichsmaßstäbe sind die Leistungen einer entsprechenden intellektuellen (menschlichen) Textinterpretation.

Aus Anwendungssicht trennt die  formale Evaluation die Spreu vom Weizen: nur diejenigen Textanalyseansätze werden positiv bewertet, die vollständig algorithmisch expliziert sind (eine Grundvoraussetzung für die Implementierbarkeit und damit für die Teilnahme an der Evaluation) und deren zugrundeliegenden Analysetechniken tatsächlich problemrelevant sind. Information Extraction und Message Understanding Conferences fördern somit die Entwicklung tatsächlich anwendungstauglicher Textanalyseverfahren.

Da die Anapherninterpretation ein zentrales linguistisches Teilproblem jedweder anwendungsspezifischen Textanalyse darstellt, findet sie als Teildisziplin CO-Task im Rahmen der Message Understanding Conferences Berücksichtigung.

Schreibe einen Kommentar