Projekt COMET - HTW Chur

Menu
Projekt
COMET

Projekt auf einen Blick

Im Rahmen des von Innosuisse (Kommission für Technologie und Innovation KTI) geförderten COMET-Projekts werden Verfahren und Technologien zur Kombination und Analyse von heterogenen, multimodalen Marktdaten entwickelt. Automatisierte Datenkonsolidierungs- und -klassifizierungsverfahren sowie Komponenten zur Valenzanalyse ermöglichen die Extraktion von Information, um die Entscheidungsträger aktiv bei der Optimierung ihrer Marken- und Marketingstrategien zu unterstützen.

Ausgangslage

In vielen Medienkanälen, wie zum Beispiel Print- und Onlinemedien, Blogs und Social Media sind marktrelevante Daten zu finden, welche die öffentliche Wahrnehmung von Produkten, deren Stärken und Schwächen sowie den Erfolg von Public Relations und Marketingstrategien widerspiegeln. Eine manuelle Auswertung dieser Datensätze ist aufgrund der steigenden Anzahl von möglichen Inhaltsquellen oft nicht möglich, sodass in der Praxis auf Business- und Web-Intelligence-Technologien zurückgegriffen wird, welche automatisch entscheidungsrelevante Information aus diesen Quellen extrahieren.

Projektziel

Das COMET-Projekt entwickelt Technologien zur Ermittlung, Konsolidierung, Kombination und Klassifikation von heterogenen, multimodalen Daten aus verschiedenster Quellen, um handlungsrelevante Inhalte automatisch zu erkennen und zu extrahieren und sie dadurch nutzbar zu machen.

Zwischenstand

  • 2. Juni 2014 – Die COMET-Forschungsarbeit «Linked Enterprise Data for Fine Grained Named Entity Linking and Web Intelligence» («Verknüpfte Unternehmensdaten für optimiertes Entity Linking und Web Intelligence») wird an der 4th International Conference on Web Intelligence, Mining and Semantics (4. Internationale Konferenz zu Web Intelligence, Mining und Semantik; WIMS 2014) in Thessaloniki, Griechenland, vorgestellt.
     
  • 28. Mai 2014 – Das Projektteam reicht den zweiten Projektbericht bei Innosuisse (Kommission für Technologie und Innovation KTI) ein.
     
  • 26. April 2014 – Der Artikel «Enriching Semantic Knowledge Bases for Opinion Mining in Big Data Applications» («Anreicherung von semantischen Wissensgrundlagen zum Opinion Mining in Big-Data-Anwendungen») wird zur Veröffentlichung im Knowledge-Based System angenommen.
     
  • 27. März 2014 – COMET-Planungstreffen in Zürich.
     
  • 8. Januar 2014 – Das Projektteam hat wöchentliche Treffen geplant, um die Entwicklung des COMET XML-Austauschformats und seiner Web-API zu koordinieren.
     
  • 30. November 2013 – Das Projektteam reicht den ersten Projektbericht bei Innosuisse (Kommission für Technologie und Innovation KTI) ein.
     
  • 2. September 2013 – COMET-Auftakttreffen in Zürich.
     
  • 1. September 2013 – Offizieller Projektstart.

Umsetzung

So unterstützen die entwickelten Technologien die Domänen-Expertinnen und -Experten beim Hinzufügen von relevanten Artikeln, indem sie ihnen die Ergebnisse einer automatischen Inhaltsanalyse des Artikels zur Verfügung stellen. Diese enthält unter anderem (i) das Sentiment (positive versus negative Wahrnehmung) von Produkten, Personen oder Unternehmen im Artikel, (ii) die automatische Klassifikation des Artikels in bekannte Produktsegmente sowie (iii) automatisch generierte Metadaten. Des Weiteren werden ähnliche Artikel automatisch erkannt und – sofern bereits vorhanden – mit Annotationen versehen.

Durch diese Vorgehensweise konnten die Effizienz und Effektivität von Auswertungsprozessen und die Datenqualität der Ergebnisse erheblich gesteigert werden. Die annotierten, entscheidungsrelevanten Dokumente werden automatisch aggregiert und stehen Entscheidungsträgerinnen bzw. Entscheidungsträgern in Form von Statistiken und dem klassischen Pressespiegel zur Verfügung. Sie unterstützen die Verantwortlichen somit bei der Optimierung ihrer Public Relations, Marketing- und Markenstrategie.

Obwohl ein Grossteil der relevanten Dokumente elektronisch vorliegt, nutzt COMET eine medienübergreifende Infrastruktur. Diese erfasst sowohl elektronische Dokumente als auch klassische Printmedien. Printmedien werden gescannt und anschliessend mittels OCR (optical character recognition) in Textdokumente übersetzt. In diesem Prozessschritt kommt es häufig zu Erkennungsfehlern, die eine grosse Herausforderung für das Projekt darstellen. Ähnliche Probleme werden auch durch Schreibfehler, nicht standardisierte Schreibformen und Abkürzungen sowie Navigations- und Werbeelemente auf Webseiten hervorgerufen.

Resultate

Ein Kernelement des COMET-Projekts ist daher die Entwicklung von Algorithmen, durch welche die negativen Auswirkungen dieses Rauschens minimiert werden. Das bereinigte Dokument wird anschliessend nach Zielobjekten (Personen, Organisationen, Produkten etc.) durchsucht und das auf sie bezogene Sentiment sowie das Sentiment des Dokuments an sich werden bestimmt. Ausserdem wird eine Klassifizierung des Artikels anhand der vorliegenden Textbausteine und Objekte vorgenommen. Durch die Automatisierung dieser Arbeitsschritte konnten die Produktivität und die Ergebnisqualität des Geschäftsprozesses erheblich gesteigert werden.

Neben Mitarbeitenden der HTW Chur waren folgende Personen am Projekt beteiligt:

  • Kevin Schnell
  • Alistair Buxton
  • Seraina Lutz
  • Peter Metzner
  • Daniel Streiff, ehemals HTW Chur

Weiterführende Information

Research Blog

Unser Research Blog blog.semanticlab.net fasst Artikel, Methoden und Applikationen zusammen, welche für das Projekt COMET relevant sind.

Publikationen

Beteiligte

Das COMET-Projekt wird von Innosuisse (Kommission für Technologie und Innovation KTI) des Eidgenössischen Departements für Wirtschaft, Bildung und Forschung gefördert. Zu den Projektpartnern gehören die Hochschule für Technik und Wirtschaft Chur (Schweizerisches Institut für Informationswissenschaft) und Media Focus – ein Marktforschungsunternehmen, das unabhängige Marketing-Leistungskennzahlen erhebt.