Entwicklung eines mehrsprachigen Feedbacksystems zur Nutzerinteraktion (GenAI zur intelligenten Wissensvernetzung)

Projektübersicht

Anzahl Studierende	1
Art	Studienprojekt (interdisziplinär, fachbereichsübergreifend; enge Anbindung an geförderte Projekte)
Projektverantwortung	Prof. Dr. M. Kohlhase & N. Migenda
Projektkontext	Das Projekt findet in enger Zusammenarbeit mit dem Center for Applied Data Science (CfADS) Gütersloh und dem Institute for Data Science Solutions (IDaS) statt. Eine parallele Anstellung als WHK im Start-up ist möglich.

Abstrakt

Deutsche produzierende KMU stehen vor großen Herausforderungen, insbesondere durch den zunehmenden Fachkräftemangel und den drohenden Wissensverlust. Der demografische Wandel und die steigende Nachfrage nach qualifizierten Arbeitskräften führen dazu, dass es immer schwieriger wird, offene Stellen zu besetzen und neues Personal effizient einzuarbeiten. Gleichzeitig droht wertvolles Expertenwissen verloren zu gehen, da erfahrene Mitarbeiter in den Ruhestand gehen oder das Unternehmen verlassen. Dieser Verlust von Know-how beeinträchtigt die Innovationsfähigkeit und Effizienz der Unternehmen erheblich. Um wettbewerbsfähig zu bleiben, benötigen KMU daher KI-Lösungen, die Wissen nachhaltig sichern, die Einarbeitung neuer Mitarbeiter beschleunigen und weniger erfahrene Fachkräfte in die Lage versetzen, komplexe Aufgaben zu bewältigen.

Kurzbeschreibung

Produzierenden Unternehmen müssen im Bereich der Wartung und Instandhaltung in Bezug auf Datendokumentation und Wissensvermittlung massive, digitale und infrastrukturelle Herausforderungen bewältigen. Ein zentrales Problem ist der drohende Wissensverlust aufgrund des Fachkräftemangels. Gleichzeitig wächst die Menge an instandhaltungsrelevantem Wissen und Daten exponentiell. Diese Informationen sind oft verteilt - von Wartungsprotokollen und Bedienungsanleitungen bis hin zu Live-Daten aus bspw. IoT-Geräten. Die Wissensfragmentierung erschwert es Unternehmen, schnell und gezielt auf relevante Informationen zuzugreifen, was zu ineffizienten Wartungsprozessen und längeren Ausfallzeiten führt. Ein weiteres Problem ist die zunehmende Datenflut, die von IoT-Sensoren und Produktionssystemen erzeugt wird. Diese Daten sind unstrukturiert und in ihrer Form oft schwer nutzbar. Unternehmen benötigen eine Lösung, die diese Informationen aufbereitet, analysiert und den Nutzer*innen textuell sowie grafisch zur Verfügung stellt, um Ausfälle zu vermeiden und Wartungsmaßnahmen zu optimieren. Hinzu kommt der wachsende Druck, Stillstandzeiten zu reduzieren, die Produktivität zu steigern und gleichzeitig die Qualität und Sicherheit der Instandhaltung zu gewährleisten. Ungeplante Ausfälle können erhebliche Kosten verursachen und die Wettbewerbsfähigkeit beeinträchtigen. Außerdem ist die Skalierung von Expertenwissen in der Produktion, aufgrund von Schichtarbeit und der damit verbundene Einsatz von Zeitarbeitnehmer*innen mit unterschiedlichem Ausbildungsgrad, essenziell ist. Diese müssen schnell eingearbeitet werden, um auch komplexere Aufgaben übernehmen zu können. Durch die Skalierung des Expertenwissens lässt sich die Einarbeitungszeit verkürzen. Das Wissen im Unternehmensnetzwerk zu verteilen ist für global agierende Unternehmen eine weitere Herausforderung, da Mitarbeiter*innen häufig wenig Möglichkeit haben, ihr Wissen international und mehrsprachig weiterzugeben. Das Expertenwissen nachhaltig festzuhalten und zu dokumentieren, stellt ein zusätzliches Problem dar. Der gezielte Wissenstransfer von Expertenwissen erfordert eine hohe soziale und didaktische Kompetenz und muss so ausgestaltet sein, dass Expert*innen in die Lage versetzt werden, ihr Wissen zu teilen ohne sich gleich im Unternehmen ersetzt zu fühlen.

Das hier beschriebene Teilprojekt Entwicklung eines mehrsprachigen Feedbacksystems zur Nutzerinteraktion ist Bestandteil des Gesamtprojekts GenAI zur intelligenten Wissensvernetzung und steht in engem Zusammenhang mit einem in Gründung befindlichen KI-Start-up. Dieses beabsichtigt, aufbauend auf einem bereits erfolgreich durchgeführten Vorprojekt, die Entwicklung und Vermarktung eines neuartigen KI-basierten Wissensmanagementsystems.

Aufgabenstellung

Das Teilvorhaben Entwicklung eines mehrsprachigen Feedbacksystems zur Nutzerinteraktion umfasst die Implementierung von Algorithmen mit denen Nutzerfeedback aufgenommen und in einem Wissensgraphen vernetzt werden. Hierfür werden nächst über 100 existierende deutsche und englisch Dokumente der IoT-Factory Gütersloh verwendet. Diese Datenbasis wird während des Forschungsmasters um Dokumente anderer Sprachen (bspw. Indisch) und Produktionsanlagen von Projektpartnerunternehmen ergänzt.

Bezug zum Thema Data Science

Das Projekt hat in jeder Hinsicht einen sehr engen Bezug zum Thema Data Science: Von der Daten-sammlung über die Datenintegration bis hin zur Datenanalyse mit aktuellen Verfahren aus den Bereichen Large Language Models & Knowledge Graphs.

Verfügbare Ressourcen

Der Data-Analytics-Cluster des CfADS steht über die Projektlaufzeit zur Verfügung.
Es existiert ein Wissensgraph einer IoT-Factory basierend auf Dokumenten und IoT-Daten
Aktive Unterstützung beim Erstellen von wissenschaftlichen Arbeiten, die auf (internationalen) Konferenzen präsentiert werden.
Die Betreuung durch das Team der Ansprechpartner ist über die Projektlaufzeit gewährleistet.

Projektplan

Erstes Semester: Ziel des ersten Semesters ist es sich in die für das Projekt relevanten Themenbereiche einzuarbeiten und eine systematische Literaturrecherche durchzuführen. Ergebnis ist eine stark verdichtete Menge an relevanten wissenschaftlichen Arbeiten. Zur Bewertung werden relevante Kriterien für die spätere Umsetzung (Semester 2-4) hergeleitet und die Paper systematisch bewertet. Die Prüfungsleistung ist das Erstellen eines Forschungsexposés auf Englisch und ein dazugehöriges Kolloquium. Alternativ zum Forschungsexposé kann die Abgabe auch in Form eines Papers nach internationaler Norm verdichtet eingereicht werden.

Zweites Semester: Ziel des zweiten Semesters ist basierend auf den Ergebnissen des ersten Semesters die vielversprechendsten Algorithmen in einem Benchmark mit IoT-Factory-Dokumenten gegenüberzustellen. Hierfür sind mind. drei Algorithmen in Python zu Implementieren und mit fachüblichen Bewertungsmaßen zu bewerten. Die Prüfungsleistung ist das Schreiben eines Short-Papers, welches idealerweise auf einer (internationalen) Konferenz eingereicht und präsentiert wird.

Drittes Semester: Ziel des dritten Semesters ist es einen der zuvor gebenchmarkten Algorithmen weiterzuentwickeln. Hierbei sollen neue algorithmische Komponenten zur Verbesserung der Performance auf den zuvor verwendeten IoT-Factory-Dokumenten durchgeführt werden. Zudem ist ein Template zur systematischen Erfassung von Nutzerwissen zu entwickeln und mit dem Algorithmus zu verbinden. Im Vordergrund steht zudem das Schreiben eines Full-Papers. Dieses ist zugleich auch die Prüfungsleistung und wird auf einer (internationalen) Konferenz eingereicht und ggf. präsentiert.

Viertes Semester: In der Masterarbeit sollen die Algorithmen in einer realen Umgebung erprobt werden. Dies bedeutet, sich aus der sicheren internen Umgebung heraus zu begeben und die Funktionalität in der realen Welt auf die Probe zu stellen. Dies birgt viele unvorhersehbare Herausforderungen, die für den Praxiseinsatz aber höchst relevant sind. Das Thema der Masterarbeit formt sich, während der drei ersten Semester und wird in Absprache mit den Betreuern definiert.

Eignungskriterien

Zwingend:

Bachelorabschluss in einer einschlägigen Fachrichtung (Informatik, Kognitionswissenschaft, o.ä. mit umfassenden Informatikkenntnissen)
Umfassende Programmierkenntnisse in mindestens einer objektorientierten Programmiersprache
Fließendes Englisch in Wort und Schrift

Optional:

Programmierkenntnisse in Python
Grundkenntnisse in NoSQL-Datenbanken
Large Language Modelle
Containerisierung

Erwerbbare Kompetenzen

Der/die Studierende ist nach Abschluss des Projekts in der Lage,

LLM-Algorithmen in Tiefe verstanden zu haben,
Wissensgraphen automatisiert aufbauen und verwalten zu können,
Algorithmische Komponenten in Form von Services in existierende Workflows zu integrieren,
die theoretischen Anforderungen von ML-Verfahren mit den Erfordernissen der Praxis in Einklang zu bringen,
textbasierte Dialogsysteme anzuwenden,
die eigenen Forschungsergebnisse vor einem Fachpublikum zu präsentieren
und wissenschaftliche Texte zu verfassen.