22.04.2025

HSBI-Forscherin entwickelt KI für effizientere Zellsegmentierung – gut z.B. für die Pharmaforschung

20250304_ZellsegementierungKi_Pollmeier_0693_Slider
Eiram Mahera Sheikh entwickelt im Rahmen ihrer Promotion an der HSBI KI-Anwendungen für effizientere Zellsegmentierung. © P. Pollmeier/HSBI
Drei Personen sitzen vor einem Laptop
Gemeinsam will das Forschungsteam ermöglichen, dass das notwendige Training der Zellsegmentierungs-KI schneller vonstatten gehen kann als bisher und greift dabei ihrerseits auf ein KI-Verfahren zurück. © P. Pollmeier/HSBI
Die Silhouette eines Mannes vor einer Projektion an einer Wand
Die KI soll Bildregionen identifizieren, die für das Erlernen der Zellsegmentierung besonders wichtig sind. Damit bräuchten nicht mehr sämtliche Bildpixel von Hand gelabelt werden, sondern nur noch diejenigen, die als Trainingsdaten besonders wertvoll sind. © P. Pollmeier/HSBI
Eine Frau steht vor einer weißen Wand und blickt seitlich an der Kamera vorbei
Sie bringt den Bedarf der Praxis ein: Informatikerin Dr. Constanze Schwan lehrt am Fachbereich Ingenieurwissenschaften und Mathematik und und arbeitet zugleich auch in der Forschungsabteilung von Miltenyi Biotec in Göttingen. © P. Pollmeier/HSBI
20250304_ZellsegementierungKi_Pollmeier_0291_Slider
Prof. Dr. Wolfram Schenck, wissenschaftlicher Leiter des Data-Analytics-Clusters des Center for Applied Data Science (CfADS) am Campus Gütersloh und HSBI-Sprecher im Projekt SAIL, betreut Eiram Mahera Sheiks Promotion. © P. Pollmeier/HSBI
20250304_ZellsegementierungKi_Pollmeier_0561_Slider
Bilder von segmentierten Zellen sind in der biomedizinischen Forschung und Diagnostik enorm wichtig. © P. Pollmeier/HSBI
EIn mann blickt in die Kamera
Dr. Alaa Othman ist Elektroingenieur und Juniorforschungsgruppenleiter im SAIL-Netzwerk und betreut Sheiks Promotion gemeinsam mit Prof. Schenck. © P. Pollmeier/HSBI
Bilder von segmentierten Zellen sind in der biomedizinischen Forschung und Diagnostik enorm wichtig. Und enorm teuer. Zwar kann mittlerweile auch Künstliche Intelligenz (KI) die Zellsegmentierung übernehmen, sie braucht dafür aber ein Training mit einer großen Menge gelabelter Daten: Daten, die von Expert:innen manuell gekennzeichnet werden müssen. Wie sich dieser Prozess intelligent beschleunigen lässt, erforscht die Doktorandin Eiram Mahera Sheikh an der Hochschule Bielefeld im Rahmen des SAIL-Forschungsnetzwerks. Sie setzt schon bei der Vorbereitung der Trainingsdaten auf KI, genauer: auf Deep Active Learning.

Bielefeld (hsbi). Die beiden im Computer aufgerufenen Darstellungen sind Abbilder der gleichen biologischen Zellen. Links das mikroskopische Bild einiger Bauchspeicheldrüsen-Stammzellen auf einem porösen Substrat: Die kleinen weißen Flecken, unterschiedlich groß, länglich geformt, leicht verschwommen vor grauem Hintergrund, sind die individuellen Zellen. Hier ist es nicht so leicht zu unterscheiden, ob ein Pixel noch zur Zelle gehört oder schon zum Hintergrund. Eiram Mahera Sheikh lenkt die Aufmerksamkeit der Besucher auf die rechte Seite: dieselbe Anordnung der Zellen, diesmal aber unterschiedlich eingefärbt und deutlich abgegrenzt zum nun schwarzen Hintergrund. „Mit dieser Maske ist das Bild für die Analyse viel besser zu gebrauchen. Hier sind die Zellen deutlich segmentiert, und zwar mit Hilfe von KI, also Künstlicher Intelligenz.“ Sheikh will dafür sorgen, dass dieses Verfahren künftig noch effizienter geschehen kann – und zwar, indem sie die KI mittels KI schlau macht. Mit anderen Worten: Sie will ermöglichen, dass das notwendige Training der Zellsegmentierungs-KI schneller vonstatten gehen kann als bisher und greift dabei ihrerseits auf ein KI-Verfahren zurück.

EIn Man zeigt auf Bilder von segmentierten Zellen, das mit Beamer an eine Wand projiziert ist
Bilder von segmentierten Zellen sind in der biomedizinischen Forschung und Diagnostik enorm wichtig.

Wertvoll u.a. für die Krebstherapie: Zellsegmentierung liefert Erkenntnisse über Veränderungen auf Zellebene

„Die Analyse von Bildern segmentierter Zellen liefert wichtige Erkenntnisse über die Merkmale von Zellen, über pathologische Veränderungen oder darüber, wie Zellen auf bestimmte Wirkstoffe reagieren.“

Eiram Mahera Sheikh

Doch der Reihe nach: Nach mehreren Jahren im Beruf hat sich die 33-jährige Informatikerin mit indischen Wurzeln in Zuge eines Masterstudiums auf Data Science und KI spezialisiert. Nun ist sie als Doktorandin an die Hochschule Bielefeld (HSBI) gekommen. Mit der Zellsegmentierung hat sie ein Thema gewählt, dass in der biomedizinischen Forschung und Diagnostik von großer Bedeutung ist: „Die Analyse von Bildern segmentierter Zellen liefert wichtige Erkenntnisse über die Merkmale von Zellen, über pathologische Veränderungen oder darüber, wie Zellen auf bestimmte Wirkstoffe reagieren“, erläutert Eiram Mahera Sheikh. „Das sind Informationen, die zum Beispiel in der Krebstherapie oder in der pharmakologischen Forschung von Bedeutung sind.“ Sheiks Forschung setzt allerdings zwei Schritte früher an – sozusagen auf einer Metaebene. „Die Zellsegmentierung kann mittlerweile auch von KIs übernommen werden. Mich interessiert das Training dieser KI.“ Und das hat es in sich…

Promotion über Zellsementierung wird im Rahmen des OWL-Forschungsnetzwerks SAIL realisiert

In einem Besprechungsraum der HSBI sitzt Prof. Dr. Wolfram Schenck. Konzentriert lauscht er Sheikhs Ausführungen und blickt auf die an die Wand projizierten Bilder. Die Zwischenergebnisse der Promovendin werden diskutiert. Das Projekt ist Teil des interdisziplinären Forschungsnetzwerks SAIL. Das steht für SustAInable Life-Cicle of Intelligent Socio-Technical Systems – grob übersetzt: Nachhaltiger Lebenszyklus intelligenter soziotechnischer Systeme. In dem vom Land NRW mit bis zu 14,8 Millionen Euro geförderten Verbund kooperieren die Universität Bielefeld als Konsortionalführerin (Konsortialführung), die HSBI, die TH OWL und die Universität Paderborn mit dem Ziel, KI-Systeme über ihren gesamten Lebenszyklus transparent, sicher, nachhaltig und robust arbeiten zu lassen. Zu diesem Zweck wird ein 360-Grad-Blick auf KI geworfen: Die rund 90 Wissenschaftler:innen des Netzwerks befassen sich mit der Grundlagenforschung im Bereich der KI ebenso wie mit ihren Auswirkungen auf Mensch und Gesellschaft sowie mit konkreten Anwendungen im Bereich der Industrie 4.0 und der intelligenten Gesundheitsversorgung. Wolfram Schenck, Professor für Ingenieurinformatik, wissenschaftlicher Leiter des Data-Analytics-Clusters des Center for Applied Data Science (CfADS) am Campus Gütersloh und HSBI-Sprecher im Projekt SAIL, betreut Eiram Mahera Sheikhs Promotion, die an der Schnittstelle von Grundlagenforschung und Gesundheitsversorgung verortet ist, aber durchaus auch Erkenntnisse darüber hinaus liefert.

Labeling von Bilddaten: Wie kann Zeit von hochspezialisierten Expert:innen gespart werden?

Eine Frau steht vor einem Poster mit verschiedenen Bildern von Zellsegmentierungen
Um die Zellsegmentierung zu erlernen, braucht die Zellsegmentierungs-KI sehr viele gelabelte Daten für das Training. Das sind Bilddaten auf Pixelebene, die mit zusätzlichen Informationen versehen und klassifiziert sind.

Schenck erklärt die Herausforderungen von Sheikhs Arbeit: „Um die Zellsegmentierung zu erlernen, braucht die Zellsegmetierungs-KI sehr viele gelabelte Daten für das Training. Das sind Bilddaten auf Pixelebene, die mit zusätzlichen Informationen versehen und klassifiziert sind.“ Ein aufwendiges Verfahren, denn konkret bedeutet das: Für jedes Pixel eines Bildes von biologischen Zellen muss festgelegt werden, ob es beispielsweise zur Klasse „Hintergrund“, zur Klasse „Membran“ oder zur Klasse „Zellkörper“ gehört. Schenck verdeutlicht: „Dieses sogenannte Labeling kann heute nur manuell von Expert:innen vorgenommen werden, die genau wissen, was zu sehen ist.“ Zellmembran? Abgestorbene Zelle? Hintergrund? – Pixel für Pixel muss jemand, der etwas von der Sache versteht, die mühselige, etwas eintönige Arbeit verrichten, bevor die KI fit gemacht werden kann für die Segmentierung von gewissen Zellen.

„Weil die Arbeit so zeitintensiv und eintönig ist, wird sie von den Expert:innen nur ungern gemacht“, wirft Dr. Constanze Schwan ein. „Abgesehen davon ist das Labeling durch die Langwierigkeit und den Einsatz der hochausgebildeten Fachkräfte auch sehr teuer.“ Schwan hat sich der Besprechung angeschlossen. Die Informatikerin im Career@BI-Programm der HSBI lehrt nicht nur am Fachbereich für Ingenieurwissenschaften und Mathematik, sondern arbeitet zugleich auch in der Forschungsabteilung des Biotech-Unternehmens Miltenyi Biotec in Göttingen. Sie bringt den Bedarf der Praxis ein: „Es wäre ein großer Fortschritt, gäbe es ein Modell beziehungsweise einen Algorithmus, der den Aufwand für das Labeling reduzieren würde.“ Denn existierende Segmentierungsverfahren, die etwa für das autonome Fahren geeignet sind, geraten im Fall mikroskopischer Bilder an ihre Grenzen. Dies liegt unter anderem an den komplexeren und feineren Strukturen, die sich in den Bildern finden. Das sind häufig auch Bildstapel auf einer Zeitachse für 3D-Strukturen. „Diese Bilder oder Bildstapel enthalten oft komplexe Strukturen, die schwer zu segmentieren sind“, erklärt Dr. Alaa Othman, der die Runde komplettiert. Als Juniorforschungsgruppenleiter im SAIL-Netzwerk betreut der Elektroingenieur Sheikhs Promotion gemeinsam mit Prof. Schenck.

20250304_ZellsegementierungKi_Pollmeier_0714_Panorama
Eiram Mahera Sheikhs KI soll Bildregionen identifizieren, die für das Erlernen der Zellsegmentierung besonders wichtig sind. Damit bräuchten nicht mehr sämtliche Bildpixel von Hand gelabelt werden, sondern nur noch diejenigen, die als Trainingsdaten besonders wertvoll sind.

Fortschritt in Sicht: Sheikhs KI sortiert die unwichtigen Trainingsdaten aus

Eine Grafik mit der Überschrift Learning Model
Weil die KI-Algorithmen für die Zellsegmentierung aus dem sogenannten ‚Deep Learning‘ kommen, spricht das Forschungsteam von ‚Deep Active Learning'.

Um das Problem der komplexen Strukturen zu umgehen und um die Spezialistenteams zu entlasten, die die Zellsegmentierungs-KI trainieren müssen, setzt Eiram Mahera Sheikh ihrerseits auf KI. „Es geht mir darum, die Bildregionen zu identifizieren, die für das Erlernen der Zellsegmentierung besonders wichtig sind. Damit bräuchten nicht mehr sämtliche Bildpixel von Hand gelabelt werden, sondern nur noch diejenigen, die als Trainingsdaten besonders wertvoll sind.“ Solch ein gezieltes Herauspicken potentieller Trainingsdaten wird „Aktives Lernen“ bzw. „Active Learning“ genannt, erläutert Schenck: „Und weil die KI-Algorithmen für die Zellsegmentierung aus dem sogenannten ‚Deep Learning‘ kommen, sprechen wir hier auch von ‚Deep Active Learning‘.“

Welche die wertvollen Trainingsdaten sind, hat Sheikh mittlerweile identifiziert: „Es sind die unsichersten, die, bei denen der KI-Algorithmus Schwierigkeiten hat, zum Beispiel wegen des schlechten Bildkontrasts oder aufgrund von Zellen, die sich überlappen oder eine ungleichmäßige Form aufweisen.“ Nur diese sollten also künftig von Expert:innen angeschaut und gelabelt werden, während der Aufwand in den eindeutigen Fälle gespart werden könnte, weil Sheikhs KI das Labeling schon vorgenommen hat. „Imgrunde lernt die Zellsegmentierungs-KI so mit weniger Daten  und dennoch so effektiv, dass sie später trotzdem präzise Zellsegmentierungen vornehmen kann“, fasst Alaa Othman zusammen.

Übertragung der Erkenntnisse auf weitere Anwendungen möglich, z.B. aufs autonome Fahren

Bleibt die Frage, wie die Wichtigkeit der potentiellen Trainingsdaten bestimmt wird. Sollte das gesamte Bild betrachtet werden? Oder braucht es lokale und ausschnittsweise Entscheidungen? Die Gruppe vertieft sich in die Diskussion, der ein Laie zügig nicht mehr zu folgen vermag. „Letztlich leistet das Projekt anwendungsorientierte Grundlagenforschung“, sagt Wolfram Schenck. Denn die von Eiram Mahera Sheikh entwickelten Algorithmen für Deep Active Learning, die die Bilddaten in für das KI-Training wichtige und unwichtige Regionen aufteilen und die Zellsegmentierung damit insgesamt effektiver und effizienter machen, können auch für andere Anwendungsfälle eingesetzt werden, etwa in der medizinischen Bildgebung, beim autonomen Fahren oder in der Analyse von Satellitenbildern. Schenck: „So wiederum wird einmal mehr der ganzheitlich-nachhaltige Ansatz des SAIL-Projekts deutlich.“ (uh)

Weitere Informationen

Forschungsnetzwerk SAIL (Sustainable Life-Cicle of Intelligent Socio-Technical Systems)
https://www.sail.nrw/
https://www.sail.nrw/project/robust-deep-active-learning-for-data-streams/

Career@BI

Für weiteres Bildmaterial können Sie sich gerne an presse@hsbi.de wenden.