zurück


Pressemitteilung - ( 10.12.2009 )

Wie Sprache Technik steuern kann


Transkription von Fernsehsendungen und Wikipedia als Wissensquelle für die Computerlinguistik - Fritz Kuhn MdB (Bündnis 90/ Die Grünen) bei den Forschungsinstituten EML und EML Research


Heidelberg. Deutschland ist arm an Rohstoffen, aber reich an Ideen. Daher nehmen Forschung und Technologie eine Schlüsselrolle ein, wenn es um die Zukunft unseres Landes geht. Die Heidelberger IT-Institute European Media Laboratory (EML) und EML Research laden politische Entscheidungsträger ein, um ihnen Forschungs- und Technologiegebiete zu zeigen, auf denen Deutschland besonders gut positioniert ist – wenn die Forschungsergebnisse auch nachhaltig verwertet werden. Der Heidelberger Bundestagsabgeordnete und stellvertretende Fraktionsvorsitzende Fritz Kuhn (Bündnis 90/ Die Grünen) war jetzt zu Gast in der Villa Bosch.

Mit der Sprache als natürlicher Form der menschlichen Kommunikation  befassen sich die Bereiche Sprachtechnologie (EML) und Computerlinguistik (EML Research). Die Forscher wollen mit automatischer Spracherkennung und Methoden des Sprachverstehens IT-Anwendungen intuitiv benutzbar, flexibel und effizient machen.
Der studierte Sprachwissenschaftler Fritz Kuhn MdB informierte sich über den aktuellen Stand auf diesen Gebieten.


„Eine echte Hilfe für ältere Menschen und Hörbehinderte, weil sie die Texte als Zusatzinformation nutzen können“ - Fritz Kuhn (links) und Andreas Reuter vor der EML-„Media Transkription Platform“ (Foto: EML)

So hat das EML eine „Media Transcription Platform“ entwickelt, mit der gesprochene Sprache automatisch in Schrift umgewandelt wird. Die EML-Forscher demonstrierten, wie Fernsehsendungen automatisch transkribiert werden. „Für ältere Menschen und Hörbehinderte, die die Texte als zusätzliche Information nutzen können, ist das eine echte Hilfe“, zeigte sich Fritz Kuhn beeindruckt. „Die Digitalisierung sorgt dafür, dass gesprochene Sprache durchsuchbar und somit recherchierbar wird“, erklärte Institutsdirektor Prof. Andreas Reuter dem Grünen-Politiker. Das EML arbeitet zurzeit in einem Pilotprojekt mit dem Bayerischen Rundfunk daran, die tägliche Sendung „BR Alpha Forum“ automatisch zu transkribieren.

Mit der geschriebenen Sprache befassen sich die Computerlinguisten der EML Research in der Forschungsgruppe Natural Language Processing (NLP). Sie arbeiten daran, dass der Computer den Sinn von Texten „verstehen“ lernt. Er wird mit großen Textmengen, sogenannten Corpora, gefüttert, für das „Verstehen“ sind zusätzlich strukturierte Wissensquellen notwendig. Dadurch können Texte mit Zusatzinformationen angereichert werden. Damit kann sie der Computer leichter einordnen und dem Nutzer zur Verfügung stellen. Die Forscher der EML Research haben als erste weltweit die Internetenzyklopädie „Wikipedia“ als Wissensquelle entdeckt und mit automatischen Verfahren genutzt. Damit ist es ihnen gelungen, manuell aufgebaute Wissensquellen, an denen Jahrzehnte manuell gearbeitet wurde, in kurzer Zeit einzuholen. „Eine clevere Idee, die einen erkennbaren Fortschritt bringt“ so Fritz Kuhn, der in den siebziger Jahren selbst Linguistik studierte.


Fritz Kuhn (Bündnis 90/ Die Grünen) während des Besuchs bei EML und EML Research (Foto: EML)

In einem EU-Projekt arbeiten die EML Research-Forscher daran, linguistische „Hecken“ aufzuspüren. Das sind schwammige oder verschleiernde Formulierungen, hinter denen  falsche Aussagen versteckt sein können. „Es geht dabei allerdings um Aussagen in Gerichtsprozessen, nicht etwa um Reden im Bundestag“, machte Institutsdirektor Andreas Reuter zum Abschluss scherzhaft deutlich.


Dr. Peter Saueressig
European Media Laboratory GmbH
Schloss-Wolfsbrunnenweg 33
69118 Heidelberg
Telefon: 06221-533-245
Fax: 06221-533-198
Email: peter.saueressig (at) eml.villa-bosch.de



Die Villa Bosch in Heidelberg: im Zentrum Europas!