|
|
autoclass/DDC Leitung: Prof. Dr. Klaus Lepsky (Februar 2010 bis Dezember 2010)
Ziel des Projekts ist die Weiterentwicklung der automatischen DDC-Klassifizierung von Textobjekten durch Integration einer automatischen Indexierung sowie Aufbereitung und Relationierung terminologischer Ressourcen. Der in der Verbundzentrale des Gemeinsamen Bibliotheksverbundes (VZG) entwickelte Klassifizierungsalgorithmus (Colibri/DDC) berücksichtigt bisher keine lingustischen Verfahren für den Erschließungprozess. Um das erhebliche Potenzial des Colibri-Ansatzes deutlich besser ausschöpfen zu können, wird durch linguistische und semantische Vorverarbeitung eine leistungsfähigere Version der automatischen DDC-Klassifizierung entwickelt. Zur Verbesserung der Klassifizierungqualität wird eine linguistisch arbeitende automatische Indexierung für die Klassifizierungskomponenten (Datenbasis, Wissensbasis, bibliografische Titeldatensätze) mit dem Open Source Indexierungssystem lingo umgesetzt. Das Projekt wird in Kooperation mit der Verbundzentrale des Gemeinsamen Bibliotheksverbundes (VZG) und der Deutschen Nationalbiliothek (DNB) durchgeführt.
iMEM Intelligente Translation-Memory-Systeme durch computerlinguistische Optimierung (Juni 2009 bis Mai 2012, Leitung: Prof. Dr. Uwe Reinke)
Translation Memory Systeme (TM) stellen seit einigen Jahren das wichtigste computergestützte Werkzeug am Übersetzungsarbeitsplatz dar. Sie sollen die Recherche nach bereits übersetztem (identischem oder ähnlichem) Textmaterial und dessen Wiederverwendung unterstützen. Derzeit verfügbare kommerzielle TM Programme verwenden zur Ermittlung von Übereinstimmungen und Ähnlichkeiten unterschiedliche Methoden der Satzmustererkennung, die sich in ihren Ergebnissen bislang allerdings noch stark vom Ähnlichkeitsempfinden des Menschen unterscheiden. TM Systeme verfügen nur in sehr begrenztem Maße über computerlinguistische Regeln, so dass die Retrievalmechanismen häufig keine optimalen Ergebnisse liefern. Das Projekt iMEM soll am Beispiel der Sprachen Englisch und Deutsch untersuchen, inwieweit die Retrievalleistung von TM Systemen durch Integration vorhandener computerlinguistischer Werkzeuge und Methoden optimiert und so sowohl die Wiederverwendbarkeit der gefundenen Übersetzungseinheiten, als auch die Leistung der Terminologieerkennungskomponenten erhöht werden kann.
Als Kooperationspartner sind an iMEM beteiligt: SDL/Trados (führendes Unternehmen im Bereich von Software für computergestützte Übersetzungslösungen) sowie das Institut der Gesellschaft zur Förderung der Angewandten Informationsforschung e.V. an der Universität des Saarlandes (industrienahe Forschung und Entwicklung im Bereich Sprachtechnologie und Sprachtechnik).
Objektdokumentation heterogener musealer Bestände Leitung: Prof. Dr. Klaus Lepsky (Januar 2009 bis Dezember 2009)
Die heterogenen musealen Bestände (Text, Bild, gegenständliche Objekte) im Haus der Geschichte der Bundesrepublik Deutschland umfassen derzeit über 365.000 Objektbeschreibungen zeithistorischer Objekte. Auf der Basis des Open Source Indexierungssystems lingo wird eine automatische Indexierung entwickelt, die - aufsetzend auf den existierenden Rahmenbedingungen - normierte Beschreibungsmerkmale generiert und als Indexterme für das Retrieval zur Verfügung stellt. Zielvorstellung ist es, eine einheitliche Suche über die Objektbeschreibungen anhand der sprachlichen und semantischen Vereinheitlichung der Indexterme zu realisieren.
ELCAT Innovatives E-Learning: Contentaufbereitung von Terminologie-Lernmodulen für die Automobilindustrie (Juli 2008 bis Dezember 2010, Leitung Prof. Dr. Klaus-Dirk Schmitz)
Da Terminologieentwicklung in allen Produktentwicklungszyklen stattfindet, ist es notwendig, den daran beteiligten Mitarbeitern terminologisches Bewusstsein sowie Kenntnisse über Prinzipien, Methoden und Werkzeuge der Terminologiearbeit zu vermitteln. Bereits in der Produktentwicklungsphase ist es notwendig, Terminologie exakt festzulegen und zu definieren, damit eine konsistente Anwendung sowie fehlerfreie fachsprachliche Kommunikation während des gesamten betrieblichen Herstellungs- und Vermarktungsprozesses gewährleistet werden kann.
Im Rahmen des ELCAT-Projektes (Förderprogramm FHprofUnd) wird ein innovative Lernsystem unter Anwendung digitaler, auf Internettechnologie basierender Medien entwickelt, das eine Einweisung in die Prinzipien und Methoden der Terminologielehre und Terminologiearbeit geben soll und die unternehmens- bzw. fachspezifische Terminologiepflege im Bereich der Automobilindustrie zur Unterstützung von wirtschaftlich-technischen Produktzyklen und unternehmensinternem Wissensmanagement optimieren soll.
Das Projekt wird in Kooperation mit Vertretern aus der Automobilindustrie durchgeführt; die geplante E-Learning-Plattform soll Mitarbeitern der beteiligten Unternehmen eine effektive Lernform bieten, die als Online-Weiterbildungskomponente in den Arbeitsalltag integriert werden kann.
TECHPROTRANS Technologien und Prozesse in der Translation (April 2008 bis März 2011 - Leitung: Prof. Dr. Barbara Ahrens, Prof. Dr. Sylvia Kalina, Prof. Dr. Monika Krein Kühle, Prof. Dr. Uwe Reinke, Prof. Dr. Klaus-Dirk Schmitz)
Aufgrund eines stark anwachsenden Translationsvolumens besteht in der Wirtschaft dringender Bedarf an effizienten, computergestützten Methoden und Verfahren zur Optimierung von Translationsworkflows, zur Sicherung von Translationsqualität sowie zum Aufbau und zur Verwaltung von Unternehmenssprachen (Corporate Languages).
Ziel des Projekts ist der Aufbau eines Forschungsschwerpunktes, der fachliche Kompetenzen aus den Bereichen Sprach- und Übersetzungstechnologie, Terminologiewissenschaft und Softwarelokalisierung sowie Übersetzungs- und Dolmetschwissenschaft zusammenführt. Sowohl die einzelnen Erfahrungen und Kontakte der beteiligten Forscherinnen und Forscher als auch die durch eine Systematisierung der Technologien und Prozesse der Translation zu erreichenden Synergien und Komplementäreffekte bieten eine Plattform für industrienahe Auftragsforschung, anwendungsorientierte Drittmittelprojekte und wissenschaftliche Begleitforschung.
RESEDA Repräsentationsmodelle semantischer Daten (Leitung: Prof. Winfried Gödert, Prof. Dr. Klaus Lepsky, Prof. Dr. Klaus-Dirk Schmitz)
Ziel von RESEDA ist die Entwicklung theoretischer und datentechnischer Repräsentationsmodelle für begriffliche Daten und der zwischen ihnen bestehenden Beziehungen zur adäquaten Modellierung sprachlichen Wissens. Untersucht werden sollen die semantische Interoperabilität und der Datenaustausch zwischen unterschiedlichen Repräsentationsformen und zweckorientierten Anwendungen, Lokalisierungsaspekte ontologischer Wissensrepräsentation sowie die begriffliche Wissensexploration mit Betonung der Anforderungen an Datenrepräsentation im Semantic Web.
Konzepte und praxisnahe Implementierungen sollen unter anderem für die Bereiche der Wissensrepräsentation sowie für Wörterbücher für Verfahren des Automatischen Indexierens, begriffsorientierte (mehrsprachige) Terminologien, Ontologien und Wissensdatenbanken sowie Portale und Suchumgebungen im Internet insbesondere Shopping- und eCommerce-Systeme mit sachlich-inhaltlichen Zugriffen entwickelt werden.
RESEDA
Automatische Erschließung des digitalen Bildarchivs prometheus (April 2007 bis Ende März 2009 - Leitung Prof. Dr. Lepsky - GEW Stiftung Köln in Kooperation mit der Universität zu Köln)
Ziel des Projekts ist es, für die Bildkollektion des prometheus Bildarchivs ein Verfahren zur automatischen formalen Normierung und inhaltlichen Indexierung prototypisch zu realisieren. Dafür werden zunächst Terminologieressourcen für Werktitel und Künstlernamen erstellt, die für eine automatische Indexierung der Bildbeschreibungen der prometheus Bildkollektion herangezogen werden. In einem nächsten Schritt sollen mit der Realisierung eines automatischen Erschließungsverfahren für Bildbeschreibungen die in einer Bildkollektion vorhandenen charakteristischen Relationen identifiziert und zugeordnet werden (bspw. zwischen Werktitel <->Künstler und Bauwerk <-> Geographikum). Zusätzlich wird in einem völlig neuen Ansatz versucht, die Bilder in prometheus mit kunstgeschichtlichen Fachtexten zu verknüpfen. Das Projekt wird von der GEW Stiftung Köln finanziert.
CrissCross Multilinguales Recherchevokabular zu heterogen erschlossenen Dokumenten (Januar 2006 bis 2010 - Leitung Prof. Winfried Gödert)
Ziel des Projekts ist die Erstellung eines multilingualen, thesaurusbasierten Recherchevokabulars zu heterogen erschlossenen Dokumenten für die Nutzer des deutschen wissenschaftlichen Bibliothekswesens. Zu diesem Zweck soll das Zugangsvokabular für die Recherche in der Dewey-Dezimalklassifikation (DDC) mit Schlagwörtern der zur Sacherschliessung in Bibliotheken eingesetzten Schlagwortnormdatei (SWD) angereichert werden. Den Schlagwörtern der SWD wiederum sollen DDC-Notationen zugeordnet werden. Die Multilingualität wird durch die Verknüpfung der Sachschlagwörter der SWD mit ihren Äquivalenten in der englischen Schlagwortsprache Library of Congress Subject Headings (LCSH) und in der französischen Schlagwortsprache Répertoire d'autorité-matiére encyclopédique et alphabétique unifié (Rameau) erreicht. Kooperationspartner dieses Projekts ist Die Deutsche Nationalbibliothek.
CrissCross
DEUTERM Deutsches Informations- und Dokumentationszentrum für Terminologie (Leitung Prof. Dr. Klaus-Dirk Schmitz)
deuTerm
Erschließungsstudie Landtag NRW (Februar 2007 bis Ende Mai 2008, Leitung Prof. Dr. Lepsky)
Anhand der Indexierungssoftware „lingo“ und einer Testkollektion, die aus den elektronischen Dokumenten der Landtagsdokumentation besteht, wird eine Ausweitung der bisherigen Funktionalitäten der automatischen Indexierung durchgeführt. Dazu werden die vorhandenen terminologischen Ressourcen (PARTHES-Thesaurus, Wörterbücher, et al.) analysiert und für die Indexierung optimiert.
Terminologie-Lernmodule für die Automobilindustrie Vorprojekt (Leitung Prof. Dr. Klaus-Dirk Schmitz)
TermNet-DE International Network for Terminology - German Branch (Leitung Prof. Dr. Klaus-Dirk Schmitz)
TermNet - das internationale Terminologienetz - ist eine wirtschaftsorientierte Non-Profit-Organisation zur Förderung des internationalen Marktes für terminologische Produkte und Dienstleistungen. TermNet zählt zu seinen Mitgliedern Unternehmen, Institutionen, Organisationen und Universitäten, weltweit.
TermNet
|