Der Weg zum intelligenten Assistenten

Machine Learning, Künstliche Intelligenz und Cognitive Search

Mit Machine Learning Methoden können größere Datenmengen durch trainierte Systeme eigenständig erfasst und kategorisiert werden. Dabei erkennt die Maschine den Inhalt des Dokuments und ordnet dieses basierend auf vorherigen Erfahrungen entsprechend ein. Für die Suche ergeben sich aufgrund der dahinter liegenden Vektor-Mathematik zusätzliche Anwendungsszenarien wie bspw. die übergreifende Suche in fremdsprachigen Texten ohne deren Übersetzung.

Spätestens seit dem Einzug sprachbasierter Alltagshelfer wie Amazon Alexa, Apples Siri oder Google Home übernehmen Maschinen immer häufiger Aufgaben, die uns früher Zeit, Kraft und Mühe gekostet haben. „Alexa, setze Hundefutter auf meine Einkaufsliste!“. „Siri, suche mir ein Restaurant in der Nähe!“. „OK Google. Spiele klassische Musik!“ Mit jeder Eingabe und jedem Befehl lernen diese Geräte dazu und nach kurzer Zeit kennen uns Google, Facebook und Co. beinahe besser als wir uns selbst.

Auch wenn manche Entwicklungen kritisch zu betrachten sind, ergibt sich in den meisten Fällen ein Mehrwert und die Vorteile maschinellen Lernens werden einen ähnlichen Einfluss auf unser Leben haben wie die Erfindung des Kühlschranks oder des Telefons. Ein Überleben ohne beides ist immer möglich, aber mit ihnen macht es unseren Alltag wesentlich angenehmer.

Begrifflichkeiten und Technologie

Bevor wir uns dem digitalen Assistenten zuwenden, sollten noch einige Begrifflichkeiten geklärt werden. Befeuert durch die Medien und die Präsenz der Schlagworte „künstliche Intelligenz“, „Machine Learning“ und „neuronale Netze“ in vielen Publikationen, herrscht dennoch eine gewisse Unsicherheit über die entscheidenden Termini und bevor wir die Möglichkeiten kognitiver Suche beginnen auszuloten, sollten wir diese Begriffe klären.

  • Künstliche Intelligenz ist der eigentliche Oberbegriff und ein Teilgebiet der Informatik. Ziel der KI (oder AI im englischen Sprachraum) ist die Imitation menschlichen Verhaltens. Maschinen folgen dabei menschlichen Entscheidungsmustern und werden durch Programmierung dazu befähigt eigenständige Entscheidungen zu treffen.
  • Machine Learning ist wiederum ein Teilgebiet der künstlichen Intelligenz und steht für Methoden und Ansätze die Ziele der KI umzusetzen. Hauptmerkmal des ML ist das Anlernen bzw. Trainieren von Maschinen (oder Computern) anhand von Beispielen. Aus diesen entwickelt die Maschine ein Muster und kann ab einem bestimmten Punkt eigenständig entsprechende Entscheidungen treffen.
  • Cognitive Search ist ein Anwendungsfall bzw. ein Spezialgebiet des maschinellen Lernens und beschäftigt sich hauptsächlich mit Suche und der Informationsgewinnung von Suchergebnissen auf Basis neuronaler Netze.

Fordern Sie hier unsere kostenlose Whitepaper zu den Themen:

  • Deep Learning – der Generalschlüssel für Dokumentanalysen
  • Be smart – Information Management! Mit KI-Methoden und Machine Learning

für weitere Informationen an.

Basis für jedes Machine Learning ist ein breites und zum Teil wachsendes Datenfundament. Je besser der Fundus an Informationen, desto genauer die späteren Ergebnisse. Aus diesen Daten werden Trainingsdaten ausgewählt und die Maschine von einem Data Scientist angelernt. Daraus ergibt sich ein Modell, welches nach einem bestimmten Reifegrad fähig ist, eigenständige Entscheidungen zu treffen. Diese basieren auf Erkenntnissen und Vermutungen aus vorhandenen Daten. Am Ende bedarf das Modell keiner oder nur geringen menschlichen Eingreifens, sollten Ergebnisse zu weit abweichen.

Machine Learning Prozess

Der Prozess des Machine Learnings

Bei der Textverarbeitung mit Methoden maschinellen Lernens wie z.B. Word-Embeddings werden Begriffe in einen multidimensionalen Vektorraum übernommen. Jeder Begriff erhält aufgrund verschiedener ihm zugeordneter Parameter (Häufigkeit, Dichte, etc.) eine Position innerhalb dieses Raumes und ist dadurch mathematisch beschreibbar. Mittels Methoden aus der Vektorrechnung lassen sich so Zusammenhänge zwischen Termini beschreiben und neue Erkenntnisse gewinnen. Am Beispiel der Worte Schuh und Kufe lassen sich so z.B. die Worte Schlittschuh oder Inlineskates ermitteln, da sich diese im Vektorraum zwischen beiden befinden.

vektorisierte Begriffe in einem 2D Raum

Vektorisierte Begriffe in einem 2D Raum

In der Arbeit mit Texten und Sprache ergeben sich jedoch einige Stolperfallen, die bisher nur mit einigem Aufwand gelöst werden konnten. Die Vielfalt der Sprache in Ausdrucksweise und Bedeutung führt zu Problemen, wenn mehrere Wörter bspw. die selbe Bedeutung (Synonyme) oder ein Suchwort multiple Bedeutungen (Homonym) haben kann. Hier musste bisher über Listen und Thesauri Zusammenhänge hergestellt werden. Denken wir hier bspw. an das Wort „Gericht“, was eine juristische Funktion aber auch eine Mahlzeit sein kann. Suchmaschinen konnten bisher den Sinnzusammenhang nicht herstellen.

Mittels Word Embeddings bzw. Word Co-Occurrence – zwei Methoden maschinellem Lernens – kann ein Sinnzusammenhang durch ein assoziatives Netzwerk hergestellt werden. Wichtig ist dabei die Frage in welchen Zusammenhängen ein Wort mit anderen Wörtern steht. Das nachfolgende Beispiel illustriert die Idee am Beispiel des Wortes „Flügel“. Ein Flügel hat dabei mehrere Bedeutungen, die sich erst aus dem Zusammenhang erschließen. Geht es innerhalb des Dokumentes um Pedale, Cembalo oder Instrumente, ist das Musikinstrument gemeint. Fallen jedoch Begriffe wie Fliegen, Oberarmknochen oder Vögel, wird das Flugorgan gemeint sein.

Flügel als Homonym

Das Beispiel des Wortes Flügel als Homonym

Der Mehrwert für die Suche

Was ist nun der eigentliche Mehrwert für eine Suchfunktion? Für die Suche in Dokumenten und Texten sind die Ansätze aus dem Machine Learning ein Zugewinn. Speziell die Klassifikation von Inhalten größerer Datenmengen kann nun einer trainierten Maschine überlassen werden, die eigenständig zum Teil bestehende, als auch neue Zusammenhänge erschließt. Dokumente können zusätzlich automatisch aus dem eigenen Inhalt mit Schlagworten versehen werden, was zu einer Anreicherung der Information führt.

Durch die Vektorisierung von Wörtern und deren Übertragung in die Mathematik ergibt sich ein weiterer Vorteil. Begriffe aus unterschiedliche Sprachen bilden ähnliche Muster innerhalb des Vektorraums.

vektorisierte Begriffe

Zusammengefassste Begriffe in einem Vektorraum

vektorisierte Begriffe auf Deutsch

Die deutsche Entsprechung der vektorisierten Begriffe

Anstatt also Inhalte zu übersetzen, kann die Suche Muster in unterschiedlichen Sprachräumen finden, die sich ähneln.

Die obigen Beispiele zeigen zusätzlich einen weiteren Aspekt von Cognitive Search. Begriffe im Umkreis eines Suchwortes können zukünftig als Suche in ähnlichen Inhalten dienen. Sucht man bspw. nach Auto, kann die Suche die Ergebnisse auf Reifen oder Zug ausweiten.

Die Methoden des Machine Learnings und speziell der Cognitive Search eröffnen neue Anwendungsfälle:

  • Textklassifikation: als Teil eines Sortier- und Klassifizierungssystem können E-Mails an eine zentrale Adresse erkannt und automatisch einem korrekten Empfänger zugeordnet werden. Organisationen oder Unternehmen mit einer ständigen und großen Menge an hereinkommenden Daten (Versicherungen, Banken, etc.) profitieren von einer automatisierten Zuordnung.
  • Bilderkennung/ Gesichtserkennung: große Bildarchive oder Medienverlage, die DAM Systeme nutzen, müssen immer noch Bilder manuell verschlagworten und kategorisieren. Mit Hilfe von Methoden des Machine Learnings können Inhalte von Bilddaten automatisch erkannt und zugeordnet werden. So stehen sie im Anschluss auch in der Suche besser zur Verfügung als bisher.
  • Konzeptsuche: dieser Ansatz findet sich bei großen Datenbeständen, die in einen Zusammenhang gebracht werden müssen. Patent- oder Vertragsrecherchen sind hier Schlüsselindustrien, die Dokumente mit bereits vorhandenen abgleichen und evaluieren müssen. Dafür ist die Erfassung des Inhalts von großer Bedeutung und die Cognitive Search ein wesentlicher Vorteil.