Methoden zur Extraktion von implizitem Expertenwissen (GenAI zur intelligenten Wissensvernetzung)

Projektübersicht

Anzahl Studierende	1
Art	Studienprojekt (interdisziplinär, fachbereichsübergreifend; enge Anbindung an geförderte Projekte)
Projektverantwortung	Prof. Dr. M. Kohlhase & M. Schöne
Projektkontext	Das Projekt findet in enger Zusammenarbeit mit dem Center for Applied Data Science (CfADS) Gütersloh, dem Institute for Data Science Solutions (IDaS) und einem öffentlich geförderten KI-Start-up statt. Eine parallele Anstellung als WHK im Start-up ist möglich.

Abstrakt

Deutsche produzierende KMU stehen vor großen Herausforderungen, insbesondere durch den zunehmenden Fachkräftemangel und den drohenden Wissensverlust. Der demografische Wandel und die steigende Nachfrage nach qualifizierten Arbeitskräften führen dazu, dass es immer schwieriger wird, offene Stellen zu besetzen und neues Personal effizient einzuarbeiten. Gleichzeitig droht wertvolles Expertenwissen verloren zu gehen, da erfahrene Mitarbeiter*innen in den Ruhestand gehen oder das Unternehmen verlassen. Dieser Verlust von Know-how beeinträchtigt die Innovationsfähigkeit und Effizienz der Unternehmen erheblich. Um wettbewerbsfähig zu bleiben, benötigen KMU daher KI-Lösungen, die Wissen nachhaltig sichern, die Einarbeitung neuer Mitarbeiter*innen beschleunigen und weniger erfahrene Fachkräfte in die Lage versetzen, komplexe Aufgaben zu bewältigen.

Kurzbeschreibung

Produzierende Unternehmen müssen im Bereich der Wartung und Instandhaltung in Bezug auf Datendokumentation und Wissensvermittlung massive, digitale und infrastrukturelle Herausforderungen bewältigen. Ein zentrales Problem ist der drohende Wissensverlust aufgrund des Fachkräftemangels. Gleichzeitig wächst die Menge an instandhaltungsrelevantem Wissen und Daten exponentiell. Diese Informationen sind oft verteilt - von Wartungsprotokollen und Bedienungsanleitungen bis hin zu Live-Daten aus bspw. IoT-Geräten. Die Wissensfragmentierung erschwert es Unternehmen, schnell und gezielt auf relevante Informationen zuzugreifen, was zu ineffizienten Wartungsprozessen und längeren Ausfallzeiten führt. Ein weiteres Problem ist die zunehmende Datenflut, die von IoT-Sensoren und Produktionssystemen erzeugt wird. Diese Daten sind unstrukturiert und in ihrer Form oft schwer nutzbar. Unternehmen benötigen eine Lösung, die diese Informationen aufbereitet, analysiert und den Nutzer*innen textuell sowie grafisch zur Verfügung stellt, um Ausfälle zu vermeiden und Wartungsmaßnahmen zu optimieren. Hinzu kommt der wachsende Druck, Stillstandzeiten zu reduzieren, die Produktivität zu steigern und gleichzeitig die Qualität und Sicherheit der Instandhaltung zu gewährleisten. Ungeplante Ausfälle können erhebliche Kosten verursachen und die Wettbewerbsfähigkeit beeinträchtigen. Außerdem ist die Skalierung von Expertenwissen in der Produktion, aufgrund von Schichtarbeit und der damit verbundene Einsatz von Zeitarbeitnehmer*innen mit unterschiedlichem Ausbildungsgrad, essenziell ist. Diese müssen schnell eingearbeitet werden, um auch komplexere Aufgaben übernehmen zu können. Durch die Skalierung des Expertenwissens lässt sich die Einarbeitungszeit verkürzen. Das Wissen im Unternehmensnetzwerk zu verteilen ist für global agierende Unternehmen eine weitere Herausforderung, da Mitarbeiter*innen häufig wenig Möglichkeit haben, ihr Wissen international und mehrsprachig weiterzugeben. Das Expertenwissen nachhaltig festzuhalten und zu dokumentieren, stellt ein zusätzliches Problem dar. Der gezielte Wissenstransfer von Expertenwissen erfordert eine hohe soziale und didaktische Kompetenz und muss so ausgestaltet sein, dass Expert*innen in die Lage versetzt werden, ihr Wissen zu teilen ohne sich gleich im Unternehmen ersetzt zu fühlen.

Das hier beschriebene Teilprojekt Methoden zur Extraktion von implizitem Expertenwissen ist Bestandteil des Gesamtprojekts GenAI zur intelligenten Wissensvernetzung und steht in engem Zusammenhang mit einem in Gründung befindlichen KI-Start-up. Dieses beabsichtigt, aufbauend auf einem bereits erfolgreich durchgeführten Vorprojekt, die Entwicklung und Vermarktung eines neuartigen KI-basierten Wissensmanagementsystems.

Aufgabenstellung

Das Teilvorhaben Methoden zur Extraktion von implizitem Expertenwissen beschäftigt sich primär mit der Fragestellung, wie implizites Expertenwissen von Mitarbeiter*innen eines Unternehmens automatisiert erhoben, verarbeitet und in Form von explizitem Wissen in einem Wissensmanagementsystem bzw. in einem Wissensgraphen integriert werden kann. Dafür gilt es zuerst existierende Methoden aus dem Stand der Technik zu sichten, einzugruppieren und zu erproben. Darauf aufbauend wird die Eignung bestehender Methoden für das hier skizzierte Vorhaben bewertet, mögliche Verbesserungspotentiale aufgedeckt und die jeweilige Method ggf. zur Nutzung dieser Potentiale adaptiert. Anschließend wird die Eignung aktueller KI-Methoden wie bspw. GenAI und Active Learning untersucht. Zusammen mit den Beteiligten des KI-Start-up werden basierend auf diesen KI-Methoden neuartige Methoden zur Extraktion von Expertenwissen entwickelt und getestet. Die praktische Evaluation der ausgewählten und (weiter)entwickelten Methoden hat in diesem Teilprojekt eine hohe Relevanz. Dafür stehen unterschiedliche reale Use-Cases zur Verfügung, die von den Projektpartnern des KI-Start-ups in Form von z. B. Anlagendokumentationen und Produktionsmitarbeiter*innen gestellt werden.

Bezug zum Thema Data Science

Das Projekt hat in jeder Hinsicht einen sehr engen Bezug zum Thema Data Science: Von der Daten-sammlung über die Datenintegration bis hin zur Datenanalyse mit aktuellen Verfahren aus den Bereichen Active Learning, Large Language Models und Knowledge Graphs. Zu entwickelnde Methoden können auf der Cloud-Plattform (Cluster) des CfADS umgesetzt (Programmierung und Softwaretest) und aufgrund der ausgeprägten Rechenkapazität des Clusters schnell und einfach ausgeführt werden (Deployment). Folglich können die in den Veranstaltungen zum Forschungsmaster erworbenen Erkenntnisse direkt im Projekt sehr praxisnah angewendet werden. Außerdem hat der/die Studierende die Möglichkeit, bei der Entstehung des KI-Start-ups und der Überführung von KI-Methoden in eine operative und kommerzielle Umgebung mitzuwirken.

Verfügbare Ressourcen

Der Data-Analytics-Cluster des CfADS steht über die Projektlaufzeit zur Verfügung.
Es existiert ein Wissensgraph einer IoT-Factory basierend auf Dokumenten und IoT-Daten
Aktive Unterstützung beim Erstellen von wissenschaftlichen Arbeiten, die auf (internationalen) Konferenzen präsentiert werden.
Die Betreuung durch das Team der Ansprechpartner ist über die Projektlaufzeit gewährleistet.
Reale Daten und Use-Cases von Projektpartnern des KI-Start-ups

Projektplan

Erstes Semester: Ziel des ersten Semesters ist es, sich in die für das Projekt relevanten Themenbereiche einzuarbeiten und eine systematische Literaturrecherche durchzuführen. Ergebnis ist eine stark verdichtete Menge an relevanten wissenschaftlichen Arbeiten. Zur Bewertung werden relevante Kriterien für die spätere Umsetzung (Semester 2-4) hergeleitet und die Literatur systematisch bewertet und sortiert. Die Prüfungsleistung ist das Erstellen eines Forschungsexposés auf Englisch oder Deutsch.

Zweites Semester: Ausgehend vom gesichteten Stand der Technik werden in diesem Semester etablierte Methoden zur Extraktion von Expertenwissen ausgewählt und implementiert. Es folgt eine Erprobung und Bewertung dieser Methoden in der eigenen Validierungsumgebung des CfADS (IoT-factory) sowie eine abschließende Erprobung der am besten geeigneten Methoden bei einem Projektpartner des KI-Start-ups. Als Prüfungsleistung wird der im ersten Semester ausgearbeitete Stand der Technik zu einem umfassenden Stand der Technik und Forschung tiefergelegt. Die Verschriftlichung erfolgt in Form eines Survey-Papers wahlweise in Englisch oder Deutsch.

Drittes Semester: Im dritten Semester soll die prototypische Entwicklung einer neuartigen Methode für die Extraktion von Expertenwissen basierend auf aktuellen KI-Methoden aus bspw. den Bereichen GenAI und Active Learning stattfinden. Zur Sicherstellung der Machbarkeit der Masterarbeit wird diese erste prototypische Entwicklung in einem Proof-Of-Concept (PoC) erprobt und zu behebende Fehler und Verbesserungspotentiale erarbeitet. Für den PoC wird erneut die IoT-Factory des CfADS herangezogen. Als Prüfungsleistung wird ein Qualitativer und Quantitativer Vergleich etablierter Methoden und aktueller KI-Methoden durchgeführt und in Form eines Conference-Papers auf Englisch verschriftlicht. Ziel ist es, das Conference-Paper auf einer internationalen Konferenz einzureichen.

Viertes Semester: Das vierte Semester umfasst die Masterarbeit und das dazugehörige Kolloquium, die zugleich Prüfungsleistung dieses Semesters sind. In der Masterarbeit sollen die in Semester 2 und 3 ausgewählten, erprobten und teilweise selbst entwickelten Methoden verbessert und adaptiert werden. Hierbei wird die Weiterentwicklung der Ergebnisse des dritten Semesters (neuartigen KI-Methode) fokussiert. Zudem soll eine umfassende Customer-Clinic erfolgen, in der die unterschiedlichen Methoden (Semester 2 & 3) anhand von Use-Cases der Projektpartner intensiv erprobt, bewertet und verglichen werden. Das Thema der Masterarbeit konkretisiert sich während der ersten drei Semester und wird in Absprache mit den Betreuern definiert.

Eignungskriterien

Zwingend:

Bachelorabschluss in einer einschlägigen Fachrichtung (Informatik o.ä.)
Umfassende Programmierkenntnisse in mindestens einer objektorientierten Programmiersprache
Gutes Englisch in Wort und Schrift
Gutes logisches und mathematisches Verständnis
Teamfähigkeit und Interesse an wissenschaftlicher Arbeit

Optional:

Programmierkenntnisse in Python
Grundkenntnisse in NoSQL-Datenbanken
Containerisierung

Erwerbbare Kompetenzen

Der/die Studierende ist nach Abschluss des Projekts in der Lage,

für das Themenfeld relevante KI-Algorithmen in Tiefe verstanden zu haben,
Wissensgraphen zu erzeugen und für die Wissensabfrage zu nutzen,
algorithmische Komponenten in Form von Services in existierende Workflows zu integrieren,
die theoretischen Anforderungen von ML-Verfahren mit den Erfordernissen der Praxis in Einklang zu bringen,
textbasierte Dialogsysteme anzuwenden,
in einem dynamischen Forschungsteam mitzuarbeiten,
die eigenen Forschungsergebnisse vor einem Fachpublikum zu präsentieren
und wissenschaftliche Texte zu verfassen.