Sie sind hier: HomeTelekommunikation

Informationsmanagement: Gewünscht sind mehr Sprachverständnis und Analysemöglichkeiten

Fortsetzung des Artikels von Teil 1.

Strukturierte und unstrukturierte Daten suchen

funkschau: Viele Informationen liegen in Form von E-Mails oder anderen Textformaten wie beispielsweise Präsentationen vor. Wie lassen sich solch unstrukturierte Daten durch eine intelligente Suche nutzbar machen?
Kögl: Eine moderne Cognitive-Search-Anwendung kombiniert strukturierte und unstrukturierte Inhalte aus verschiedenen Applikationen beziehungsweise Datensilos. Technisch gesehen ist sie in der Lage, aus über 600 verschiedenen Dateiformaten die Nutztexte mit den Metadaten und den entsprechenden Zugriffsrechten in einen Suchindex zu speichern. Das ist der zentrale Kern unserer Lösung. Aber man kann das Ganze auch nicht nur als technischen Suchindex betrachten, sondern als mächtige zentrale Infrastrukturkomponente für das Wissensmanagement im Unternehmen. Auf dieser Basis-Backend-Infrastruktur lassen sich viele verschiedene Applikationen aufsetzen: Enterprise Search, Wissensmanagement oder DSGVO-Suche; also viele Use Cases in ganz unterschiedlichen Ausprägungen, aber auf einer zentralen Informations-Infrastruktur. Die Daten umfassen dabei nicht nur Word-, PDF- und Text-Dokumente, sondern auch E-Mails und Datensätze aus strukturierten Informationsquellen wie Kundendaten aus dem SAP-System, Produktdaten aus einem Produktdatenmanagement-System oder Text- und Video-Dateien, die automatisch transkribiert werden und im gesamten Informationsraum zur Verfügung stehen.

Intrafind Informationsmanagement Bildquelle: © Intrafind

Franz Kögl ist Vorstand der Intrafind Software AG

funkschau: Welche Analysemöglichkeiten bieten moderne Suchmaschinen – auch in Abgrenzung zu denjenigen eines CRM- oder ERP-Systems?
Kögl: Moderne Cognitive-Search-Anwendungen und Insight Engines eröffnen sehr umfangreiche Analysemöglichkeiten. Sie bieten linguistische Verfahren für tiefes Textverständis, semantische Verknüpfungen, kombinieren eine leistungsfähige Volltextsuche mit Content Analytics und KI-Verfahren und verbinden semantische Modellierung mit einer Graphdatenbank. So ermöglichen sie eine schier unerschöpfliche Menge an Use Cases für das Auffindbarmachen, das Vernetzen und das Auswerten von Daten – selbst bei sehr großen Dokumentenbeständen.

Dabei sind sehr flexible Analysen möglich, ohne dass irgendetwas vordefiniert werden muss. Eine suchgetriebene Filterung über beliebig komplexe Queries und natürlichsprachliche Suchanfragen ermöglichen es den Nutzern, einfach ad hoc Fragen an das System zu stellen, über Applikationsgrenzen hinweg, sowohl für unstrukturierte als auch für strukturierte Daten. Das grenzt eine moderne Insight Engine stark von CRM-, ERP- oder DM-Systemen ab, aber auch von Business-Intelligence-Lösungen.

funkschau: Ist eine intelligente Suche nur etwas für größere Unternehmen? Ab welcher Größe macht solch eine Lösung Sinn?
Kögl: Eine derartige Lösung ist nicht zwingend nur etwas für größere Unternehmen. Zu unseren Kunden zählen zwar auch Unternehmen, bei denen hunderttausende Mitarbeiter von den intelligenten Lösungen in ganz unterschiedlichen Ausprägungen profitieren. Wir haben aber auch Kunden, bei denen kleine Teams unsere Standardlösung aufsetzen, um ihre spezifischen Bedürfnisse zu erfüllen.  Ein klassisches Beispiel dafür ist eine intelligente Help-Desk-Lösung für eine begrenzte Anzahl von Mitarbeitern, um die Antwortzeiten im Customer Service zu reduzieren.

funkschau: Ein letztes Stichwort: DSGVO. Bei deren Einführung war unklar, um welche Informationen es eigentlich geht und wie sich personenbezogene Daten identifizieren lassen. Darauf haben Anbieter reagiert und entsprechende Lösungen entwickelt. Was sollte solch ein „DSGVO-Tool“ können?
Kögl: In strukturierten Applikationen wie SAP oder CRM-Systemen ist in der Regel bekannt, wo genau relevante personenbezogene Daten liegen und wie sie prozessiert werden. Eine intelligente kognitive Suchmaschine wie der iFinder von Intrafind erschließt zum Beispiel dem Datenschutzbeauftragten und der IT die unstrukturierten Dokumentenbestände. Dabei kann sie zwei Use Cases sinnvoll abdecken.

Erstens die Unterstützung im Falle eines Auskunftsersuchens, bei dem alle relevanten Stellen eines bestimmten personenbezogenen Datums gefunden werden müssen – sei es in E-Mails, auf File-Server-Ablagen oder in UNC-Pfaden. Der zweite Use Case betrifft Analysen. So ist der iFinder etwa in der Lage, Häufungen von personenbezogenen Daten zu identifizieren. Das lässt sich auf Mitarbeiterdaten einschränken, kann aber auch auf die Daten von externen Personen angewendet werden, die nicht im Mitarbeiterstamm vorhanden sind. So kann man sich einen Überblick verschaffen, wo überhaupt im unstrukturierten Raum diese Daten zu finden sind. In weitergehenden Analysen können dann alle Dokumente angezeigt werden, in denen mehr als ein personenbezogenes Datum vorhanden ist, also beispielsweise eine Mitarbeiterliste oder eine gehäufte Auflistung innerhalb eines Dokuments.