Stellt euch mal ein schönes Glas Wein vor. So, und hättet ihr jetzt gewusst oder gedacht, dass in so einem Glas Wein dutzende unbekannte Moleküle drinstecken? Ich nicht. Also ich hätte gedacht, das ist längst alles erforscht. Warum das nicht so ist und was dieses Glas Wein mit unserem Universum gemeinsam hat, das erfahrt ihr heute bei uns hier im Spektrum Podcast. Mein Name ist Max Zimmer. Schön, dass ihr dabei seid. Spektrum der Wissenschaft. Der Podcast von detektor.fm. Ja, wer Wein liebt, der weiß, ein Glas kann nach Beeren duften und ein anderes dann nach Früchten. Und eins schmeckt fruchtig und das andere schmeckt nach Holz. Ein Wein ist spritzig auf der Zunge, der andere liegt eher samtig da. Also die Möglichkeiten scheinen unbegrenzt. Aber was genau steckt eigentlich dahinter? Chemisch betrachtet ist Wein ein hochkomplexes Gemisch aus hunderten, vielleicht sogar tausenden Molekülen. Und überraschenderweise kennen wir einen großen Teil davon bis heute nicht. Was Forschenden natürlich ein Dorn im Auge ist. Deshalb sind sie diesen verborgenen Substanzen mit künstlicher Intelligenz auf der Spur. Und das ist nicht nur für den Wein wichtig, sondern auch gleich für das Verständnis unseres gesamten Universums. Und darüber spreche ich heute mit Verena Tang. Die ist Chemikerin und Redakteurin bei Spektrum der Wissenschaft. Hallo Verena. Hallo Max. Verena, ihr habt euch das, finde ich, ja erstmal einen guten Ansatz, ein Glas Wein oder einen Wein analysieren lassen für dieses Thema bei Spektrum. Vielleicht erstmal vorneweg: Was für ein Wein denn? Genau, unser Autor der Chemiker Philipp Pflüger, der hat für uns, also für diesen einen Artikel, einen Weißwein analysiert. Und er hat sich dazu einen ausgesucht vom Weingut Ella. Das ist in Rheinhessen, Scheurebe Spätlese Feinherb, Jahrgang 22. Klingt erstmal ganz gut. So, und ihr habt euch das angeschaut. Vielleicht reden wir erstmal kurz darüber, welche Rolle… Ich habe ja gerade so ein bisschen diese Geschmacksdimensionen und Geruch und Mundgefühl von Wein so ein bisschen schon angedeutet. Welche Rolle spielen denn überhaupt dann die Moleküle, die da drin sind dabei? Ja, die Moleküle bestimmen alles, was du eben aufgezählt hast. Wenn wir beim Geschmack mal anfangen, das ist das Einfachste: Zucker schmeckt zum Beispiel süß. Der Zuckergehalt beeinflusst, wie lieblich ein Wein ist. Oder andersrum kennt man es eher: Je weniger Zucker, desto trockener ist der Wein. Dann hat man verschiedene organische Säuren, die nehmen wir dann eben als sauer wahr. Das sind also so zwei typische Geschmacksrichtungen. Dann kommt das Mundgefühl dazu. Beim Wein kennt man das charakteristischerweise vor allem vom Rotwein, wenn es einem so den Mund zusammenzieht. Das nennt man astringierend und dieses astringierende Gefühl, das verursacht vor allem Tannine. Und wie gesagt, das ist vor allem beim Rotwein wichtig. Das Augenfälligste oder das Vielfältigste auch beim Wein ist allerdings das Aroma. Das sind die flüchtigen Stoffe, die einem zum einen eben in die Nase steigen, wenn wir schon mal an diesem Glas schnuppern. Aber auch, wenn wir den Wein schon im Mund haben, dann steigen diese Stoffe über den Rachenraum hoch bis zum Riechkolben und docken dort eben an. Dann nehmen wir die auch als Aromen wahr. Das nennt sich dann retronasal. Und von solchen Aromen, also so flüchtigen Stoffen, gibt es ganz, ganz viele. Die nehmen wir dann als ganz vielfältige Eindrücke wahr. Du hast schon ein paar beschrieben. Es gibt Grundtendenzen, zum Beispiel fruchtige Aromen, erdige Aromen, rauchige Aromen und so weiter. Und wenn man das ein bisschen übt oder wenn man das auch wirklich gelernt hat, dann kann man das wirklich auseinanderhalten und sagen: Okay, also da ist Ananas dabei, hier kommt jetzt eine Schwur von Birne durch oder ich habe Beeren dabei, ich habe Vanille, ich schmecke Holz und so weiter. Zahnige, butterige Aromen, da gibt es wirklich hunderte Moleküle. Und da ist es nicht so, dass nur jedes einzelne einen charakteristischen Duft verströmt, sondern die wirken auch zusammen und rufen dann andere Eindrücke wieder hervor. Und letztlich beeinflussen sich eben nicht nur die Aromen untereinander, sondern auch Aromamoleküle in Kombination mit Geschmacksstoffen und dem Mundgefühl. Das alles trägt zu diesem Gesamteindruck bei. Also kann man festhalten: Wein ist ein sehr, sehr gutes Beispiel für die Komplexität chemischer Gemische. Ja, absolut. Und ich muss ja nur eine Komponente verändern und schon verändert sich die ganze Wahrnehmung vom Wein. Stell dir mal vor, du schüttest Wasser in deinen Wein, dann schmeckt der komplett anders. Oder du reduzierst den Alkoholgehalt. Oder du trinkst den Wein bei einer anderen Temperatur. Auch da verändert sich schon die ganze Wahrnehmung. Jetzt ist Wein, wie du gesagt hast, schon ein sehr gut untersuchtes chemisches Gemisch, wenn man das mal so sagen will. Wir wissen sehr viel über Wein. Und trotzdem, wenn jetzt jemand käme und sagen würde: Guck mal, dein Glas Wein, das hier vor dir steht, ich weiß ganz genau, was da alles für Substanzen drin sind, würde ich sagen: Glaube ich dir nicht. Denn wie gesagt, unser Autor hat diesen einen Weißwein für uns analysiert. Und was schätzt du, wie viele Substanzen hat er eindeutig benennen können? Wie viele waren da drin? Hast du so vielleicht eine grobe Idee? Ich sag mal, es sind ja auch doch dann auch trotzdem nur ein Glas Wein. Keine Ahnung, 100? Ja, das ist schon mal ziemlich gut. Also 100 insgesamt oder 100, die man kennt? Insgesamt. Ja, also sie haben tatsächlich in dieser Weinprobe 153 Spuren von Substanzen gefunden. Das heißt also, eindeutig aufgetrennte Moleküle. Und davon haben sie 87 per Abgleich mit Datenbanken direkt identifiziert, also wussten, was es sind. Heißt aber umgekehrt: 66 haben sie eben nicht gewusst, was es sind. Und das ist fast die Hälfte. Fast die Hälfte von den Substanzen oder Molekülen, die da in dem Wein drin sind, kannte man nicht. Genau, oder konnte es zumindest nicht durch Abgleich mit Datenbanken von Chemikalien oder chemischen Stoffen direkt herausfinden. Das heißt, es ist echt eine ganze Menge, die wir über dieses Glas Wein noch nicht wissen. Ja, krass. Wow, das ist mehr als ich dachte. Das dachte ich mir. Es war auch mehr, als ich dachte. Ich hätte es auch nicht erwartet. Und jetzt bringt uns das von dem Glas Wein so ein bisschen weg in die Forschung. Nämlich also man geht davon aus, dass es auf der Erde auch deutlich mehr unbekannte Moleküle noch gibt als bereits erforschte Substanzen. Also ähnlich wie in dem Glas Wein. Sogar noch umgekehrt das Verhältnis. Also es soll mehr Unbekannte geben als erforschte. Das hat mich auch wieder überrascht in der Vorbereitung auf diesen Podcast. Man hatte also irgendwie noch ziemlich Probleme, diese Substanzen irgendwie alle aufzutreiben und zu benennen und herauszufinden, was die genau sind. Ja, genau. Und es ist tatsächlich so. Also Fachleute gehen davon aus, dass wir noch viel mehr Moleküle nicht kennen, als wir schon kennen. Das kann man sich gar nicht so richtig vorstellen. Wir kennen ja schon sehr viele Stoffe, die uns umgeben. In chemischen Datenbanken da sind so ungefähr mehr als eine Milliarde Stoffe verzeichnet. Das heißt, die sind schon irgendwann mal gefunden worden oder hergestellt worden. Und wenn man jetzt überlegt, noch viel mehr kennen wir noch gar nicht. Das ist schon eine echt verrückte Vorstellung. Aber überleg mal, in dem Wein haben wir jetzt fast die Hälfte der Signale erstmal nicht zuordnen können. Und Wein ist eine sehr gut erforschte Substanz. Da gibt es ein recht großes Interesse, zu wissen, was da drin ist und so weiter. Und jetzt stell dir mal vor, du nimmst nicht ein Glas Wein, sondern du nimmst einfach eine Probe aus irgendeinem Fluss oder aus dem Meer oder aus der Luft oder aus dem Boden. Da kommen ja alle möglichen Sachen zusammen. Also Einflüsse, Umwelteinflüsse, Einflüsse von Mikroorganismen, von Menschen, von was weiß ich was. Da kommen alle möglichen Moleküle zusammen. Und dann kann man sich schon so langsam vorstellen, dass da noch viel Unerforschtes ist. Und es kommt auch ein bisschen dazu: Wir können ja auch nur das finden, was wir suchen. Das ist so ein bisschen das Problem bei chemischen Analysen. Ich kann ja nur etwas finden, ja nachdem ich eben gezielt auch nachforsche mit einer bestimmten Methode, bei der ich weiß, ich könnte jetzt auf das und das und das stoßen, weil das Molekül so und so aussieht, nachdem ich suche und so weiter. Und es gibt auch Analysen, da sucht man dann eben nach unbekannten Substanzen. Aber das ist eben deutlich schwieriger. Ja, vor allem nehme ich mal an, du sagst ja, irgendwie über eine Milliarde Stoffe sind schon registriert. Dann wird also, wenn man schon so viele kennt, wird es immer schwieriger, wahrscheinlich nochmal zufällig irgendwo einen zu finden. So, die offensichtlichen hat man wahrscheinlich. Ja, genau. Und die verstecken sich ja natürlich auch in solchen Analysen. Und wenn die in sehr kleinen Mengen oder in sehr kleinen Konzentrationen vorhanden sind, dann ist es natürlich nochmal schwieriger, solchen Sachen auf die Spur zu kommen. Ja, und du hast diese Analysen auch angesprochen, auch von dem Wein, die jetzt bei euch gemacht wurde. Wie analysiert man denn sowas jetzt? Also zum Beispiel jetzt mal dieses Weines. Genau, bleiben wir erst mal beim Wein, denn es gibt natürlich unendlich viele verschiedene Analysemethoden. Und da reden wir vielleicht erst mal, was wir hier gemacht haben und wie die Forscher dann hier versuchen, das zu verbessern. Also bei dem Wein, der wurde mittels Gaschromatographie Massenspektrometrie analysiert. Das ist im Endeffekt ein Verfahren, bei dem man zwei verschiedene Analysemethoden koppelt. Ganz grob macht man erst mal eine Gaschromatographie und da trennt man die Probe sozusagen in die einzelnen Substanzen auf. Und bei der Massenspektrometrie kann man dann jede einzelne dieser Fraktionen oder jede einzelne dieser Proben nochmal analysieren und gucken, was für ein Molekül ist es denn? Also das ist so das ganz Grobe. Also ich trenne es erst auf in die verschiedenen Bestandteile und dann gucke ich, worum handelt es sich bei welchem Bestandteil. Wenn wir jetzt noch ein bisschen konkreter werden. Also bei der Gaschromatographie, da lässt man also erstmal ganz grob die Probe über eine Säule laufen. Die besteht aus einem bestimmten Trägermaterial und dann trennt sich diese Probe auf. Wenn du dir das vorstellst, du hast eine Lösung mit ganz vielen verschiedenen Molekülen, Molekülsorten, die sehen dann alle unterschiedlich aus. Manche sind vielleicht länger, manche sind kürzer. Das eine ist vielleicht eine lange Kette, das andere ist vielleicht eher so ein verzweigtes etwas. Dann gibt es Moleküle, die haben hauptsächlich Kohlenstoff- und Wasserstoffatome. Andere haben vielleicht Sauerstoff drin oder mehr Stickstoff oder noch andere Sachen. Also sehr, sehr viele unterschiedliche Molekülformen und Zusammensetzungen. Und dementsprechend wechselwirkt auch jedes dieser Moleküle anders mit dem Material, das auf der Säule ist. Das bindet anders dran. Das eine haftet vielleicht stark dran, das andere bindet nur ganz locker oder flutscht direkt vorbei. Und wegen diesen unterschiedlichen Bindungsverhalten kommt jede Molekülsorte im Idealfall zu einer anderen Zeit am Ende wieder von der Säule raus. Du kannst es dir ganz bildlich vorstellen, wenn du Leute von der Ziellinie losschickst und machen ein Wettrennen und jeder hat eben eine andere Geschwindigkeit. Und am Ende trägst du das quasi über die Zeit auf und zu jedem Zeitpunkt hast du eben dann ein Signal. Und jedes Signal, wenn es gut aufgetrennt ist, entspricht dann eben einer Molekülsorte. Das ist quasi das. Das ist erstmal diese Auftrennung. Genau, das ist die Gaschromatographie. Und was man jetzt macht, ist, man koppelt es mit einer Massenspektrometrie. Und da analysiert man dann eben quasi ein einzelnes Signal, das am Ende rauskommt, macht davon eine Massenspektrometrie und das eben für diese ganzen Signale. Und bei der Massenspektrometrie kommt die Probe in einen Massenspektrometer und wird dann eben mit hochenergetischer Strahlung beschossen. Und dabei wird es ionisiert. Das heißt, ein Elektron wird ihm abgezogen. Das ist jetzt einfach so. Und bei dieser Prozedur zerbricht das Molekül in viele kleine Bruchstücke. Und am Ende haben die verschiedenen Bruchstücke dann unterschiedliche Massen. Also das Ursprungsmolekül hat so die Gesamtmasse und die kleineren Bruchstücke natürlich nur Teile davon. Ja, klar. Logisch. Und am Ende kriegst du eben Signale bei den unterschiedlichen Massen. Das heißt, du siehst, welche Massen haben die Bruchstücke, die ich bekomme, wenn ich dieses Molekül mit dieser Methode sozusagen zerschieße. Und dann analysieren Chemiker eben aufgrund dieser Massenverteilung, wie könnte das Molekül ursprünglich ausgesehen haben? Das klingt ziemlich kompliziert und das ist es auch. Also es ist wirklich eine Puzzlearbeit. Also man guckt sich eben diese Fragmente an und sieht: Okay, die höchste Masse ist natürlich die Originalmasse, so schwer ist ein Molekül. Dementsprechend kann ich dann eben verschiedene Möglichkeiten aufzählen, wie könnte sich das zusammensetzen? Also Kohlenstoff wiegt so und so viel, Wasserstoff wiegt so und so viel und so weiter. Und dann weiß ich also ungefähr, welche Möglichkeiten habe ich. Und Chemiker können dann anhand dieser Bruchstücke gucken, wie könnte das Molekül ausgesehen haben, weil sie halt auch mit viel Erfahrung und viel chemischem Wissen wissen, was passiert unter diesen Massenspektrometriebedingungen. Also wenn du es jetzt wirklich ganz, ganz basic dir vorstellst, ist es vielleicht ein Vergleich, der ein bisschen hinkt, aber stell dir vor, du kommst nach Hause, es liegen irgendwie Scherben unter deinem Schrank und du überlegst, was zur Hölle ist da runtergefallen. Und dann kannst du überlegen: War es jetzt irgendwie eher ein Teller oder eher eine Tasse? Findest du in Henkel, war es vielleicht eher eine Tasse? Also ganz so einfach ist es natürlich nicht. Aber vielleicht, um das sich so ein bisschen zu verdeutlichen. Ja, alles klar. Okay, also so geht man vor. So geht man vor. Natürlich ist es in der Praxis so, und das ist eigentlich das Schöne an diesen Methoden: Wenn du jetzt ein Molekül durch das Massenspektrometer schickst, dann passiert da immer das Gleiche. Das heißt, am Ende kommt immer das gleiche Muster raus. Also es ist nicht so, dass es mal so zerbricht und mal so, sondern du kriegst da immer das gleiche Bild. Das heißt, das kann man sich schon ganz gut vorstellen. Es gibt inzwischen auch viele Datenbanken mit Spektren. Das heißt, wenn du ein Spektrum misst von einem Molekül, dann guckst du erst: Passt es zu irgendwas, was es in der Datenbank gibt? Und wenn du dann ein Treffer hast, dann weißt du: Okay, mein Molekül war zum Beispiel, was weiß ich, Ethanol. Ethanol wäre jetzt auch nicht überraschend im Wein, aber egal. Du weißt, was ich meine. Also in deinem Bild wäre jetzt, wenn das Molekül eine Tasse ist, dann würde die Tasse immer auf die gleiche Weise zerbrechen, wenn sie runterfällt. Genau. Ja, alles klar. So, und das klingt ja nach einer super komplexen und ziemlich genauen Analysemethode eigentlich. Aber so richtig zufrieden sind Forschende aber trotzdem noch nicht, schreibt ihr. Also warum denn? Wo hapert es noch? Naja, du hast ja schon gemerkt, es klingt so ein bisschen kompliziert und aufwendig, und das ist es natürlich auch. Also das ist wirklich eine schwierige Arbeit. Und natürlich sind Fachleute heute sehr gut darin, das alles zu machen. Aber trotzdem, wenn du jetzt dir vorstellst, du hast so ein Massenspektrum und du findest das in der Datenbank, dann ist es super. Dann hast du das zugeordnet und fertig. Hast du ein unbekanntes Massenspektrum, dann weißt du dich hin und überlegst: Was könnte das sein? Das dauert schon mal mehrere Stunden, ein Molekül so aufzuschlüsseln oder vielleicht auch Tage, wenn es ein sehr schwieriges Molekül ist. Und dann stell dir jetzt doch mal vor, wir haben 153 Substanzen, davon sind 87 bekannt und 66 musst du noch auswerten. Das war aber nur ein Wein. Ja, dann kannst du dir vorstellen, dass das wirklich extrem lange, aufwendige Arbeit ist. Und das ist Wahnsinn. Also dementsprechend, es gibt schon viele Spektren, die man natürlich heute kennt. Aber wenn man das vergleicht mit der Zahl an Substanzen, die wir überhaupt kennen, ist es schon wieder ein ziemlich krasser Unterschied. Vielleicht kann ich das kurz deutlich machen mit einer Zahl. Wir haben ja gesagt, ungefähr oder mehr als eine Milliarde chemische Strukturen sind in Datenbanken weltweit katalogisiert. Aber verlässliche geprüfte Massenspektren gibt es nur von ein paar hunderttausend davon. Also für weniger als 0,1 Prozent der bekannten Moleküle gibt es auch Spektren, mit denen ich mich sinnvoll auseinandersetzen kann und die vergleichen kann. Das muss man sich mal überlegen, was da für eine Arbeit einfach noch dahintersteckt. Also unser Autor hat auch in seinem Text aufgeschlüsselt, wie lange wie viele Leute arbeiten müssen. Und diese riesige Lücke aufzuholen, das ist unvorstellbar. Ja, wow. Es ist also wirklich eine mühsame und sehr, sehr aufwendige Arbeit. Und dann kommt noch was dazu. Denn wenn ich das dann rausgefunden habe und sage: Okay, ich habe jetzt hier dieses Massenspektrum, ich habe es darüber nachgedacht, die Substanz sieht so und so aus, dann musst du das auch noch validieren, also bestätigen. Das heißt, du musst die Substanz im besten Fall im Labor erst mal herstellen und dann ein Spektrum messen und dann muss es genauso aussehen. Das kann auch mal Wochen dauern. Okay, ja, also selbst von den bekannten Strukturen haben wir super wenig überhaupt in diesem Massenspektrum schon gemacht und dann kommen auch die ganzen Unbekannten dazu. Also ein Heidenaufwand. Ja, absolut. Um das alles zu machen. Und deshalb hat man schon in der Vergangenheit versucht, diese, ich nenne es mal, Detektivarbeit so ein bisschen zu automatisieren. Das ist ja immer gut, wenn man schneller vorankommen will. Da gab es ein Projekt, das hieß Dendral oder Dendril. Was waren das und warum ist es? Das kann ich schon mal vorwegnehmen: Gescheitert. Ja, Dendral ist ein Projekt, das gab es in den 1960er Jahren und es war genau der Versuch, diese Arbeit zu automatisieren. Man wollte einem Computer quasi beibringen, zu denken wie eine Chemikerin oder ein Chemiker und diese Arbeit abzunehmen, diese Puzzlearbeit, also zu einem Massenspektrum mögliche Molekülstrukturen vorzuschlagen. Und dann haben Wissenschaftler also ein Programm geschrieben, ein Computerprogramm, das eben diese Daten auswerten sollte. Und dazu haben sie dem Programm eben versucht, alle möglichen Regeln beizubringen, wie Moleküle und höhere Bedingungen im Massenspektrometer zerbrechen. Sie haben das mit Informationen gefüttert: Wie sehen stabile atomare Bausteine aus? Welche Regeln muss ich anwenden und so weiter? Das Problem ist, das war einfach so komplex. Es gab unglaublich viele Möglichkeiten. Im Endeffekt aus diesen Regeln Molekülstrukturen zu kombinieren. Das Ganze war einfach nicht machbar. Im Endeffekt ist es an zwei Hauptproblemen gescheitert. Zum einen war es unmöglich, alle chemischen Regeln zu programmieren. Also diese ganzen Regeln, das war einfach viel zu viele. Und das alles in Computercode zu überführen, unmöglich. Und zum anderen hat es einfach an Rechenleistung gefehlt, um diese Milliarden von möglichen Strukturen auszuprobieren. Und dann ist dieses Projekt eingestellt worden. Ist aber auch schon eine Weile her. Und beim Stichwort Rechenleistung, da klingelt es vielleicht bei einigen schon. Natürlich haben wir heute davon deutlich mehr. Und wir nutzen die ja auch ständig schon in manchen Bereichen, natürlich mehr in anderen weniger. Aber das Stichwort ist natürlich das große Stichwort: Künstliche Intelligenz und Machine Learning. Das geht ja mithilfe dieser Technologien in vielen Bereichen gerade echt voran. Und auch in der Chemie kommt das immer wieder zum Einsatz. Ist es denn so, Verena, dass da die Chancen jetzt besser sind, sich durch diesen Dickicht da einmal irgendwie durchzuschlagen? Und wenn ja, warum? Ja, die Situation ist, wie du richtig gesagt hast, heute komplett anders. Man muss noch sagen, das Projekt ist zwar eingestellt worden, aber die grundsätzliche Idee, die ist natürlich nach wie vor irgendwie sinnvoll und auch nicht unmöglich, dass ein Computer einfach das übernimmt, was ein Mensch macht. Es basiert ja alles auf Logik und aus Erfahrung. Und wie wir heute wissen, kann man einer Maschine sowas auch beibringen. Und du hast ein Ding schon gesagt: Na, ein Problem war Rechenleistung. Dazu muss ich, glaube ich, nicht so viel sagen. Klar, wir haben heute natürlich ganz andere Möglichkeiten als damals. Viel mehr Rechenpower. Das zweite Problem war: Nicht alle Regeln lassen sich kodieren. Und da kommen jetzt eben selbstlernende Algorithmen ins Spiel, die du erwähnt hast. So funktioniert ja maschinelles Lernen. Genau, eben, dass man nicht ein Programm schreibt, das feste Regeln befolgt, sondern man schafft halt ein System, das anhand von Beispielen lernt. Von vielen Beispielen und sich das dann selbst beibringt. Und genau das hat jetzt das Team um unseren Autor gemacht. Das war ein Team von Wissenschaftlern an der Uni Münster. Und die haben ein Modell entwickelt, das eben genau zu einem gemessenen Massenspektrum dann die passende Moleküle vorschlägt. Und das heißt Metis, das Modell. Und daran haben die jetzt fünf Jahre lang entwickelt und gearbeitet. Und dieses System lernt quasi genau wie ein Chemiker, der lernt, solche Spektren auszuwerten. Dieses Programm sieht ganz viele Spektren, Tausende, und eben die dazugehörigen Moleküle. So wird es trainiert, also anhand von Beispielen. Und dann lernt das natürlich noch andere Dinge. Na, welche Fragmente gehören zu welchen Massen und so weiter. Und das trainierte System schlägt dann zu einem gemessenen Spektrogramm mögliche Molekülstrukturen vor. Jetzt ist es nicht so ganz trivial, so ein Programm zu erstellen. Zum einen das ist, glaube ich, auch ein Grund, warum es in der Chemie noch gar nicht so viele KI-Anwendungen gibt, ist: Ich brauche irgendwie eine Form von Sprache und Moleküle in Sprache zu übersetzen. Naja, okay, das ist ja nicht ganz so trivial. Aber es gibt da eine quasi universelle Sprache, die Moleküle in Computer-Code übersetzt. Und die muss man quasi auch diesem System erst mal beibringen. Und dann kann man auch mit Sprachmodellen arbeiten. Und das ist das eine, was sie gemacht haben. Dann ein weiterer Punkt: Du brauchst unendlich viele Daten. Also so eine KI ist sehr, sehr datenhungrig. Die funktioniert nur gut und zuverlässig, wenn sie mit vielen Daten trainiert wurde. Ja, Problem ist, in der Chemie gibt es nicht so viele Daten. Also du brauchst in dem Fall, wie gesagt, Datenbanken mit Molekülen und den dazugehörigen Spektren. Und wie wir gerade gehört haben, da gibt es nicht Millionen. Und was die Wissenschaftler tatsächlich gemacht haben, ist, dass sie ein Jahr lang systematisch bekannte Moleküle genommen haben, zu denen es keine Spektren gab, haben die dann mit GCMS vermessen, haben die Daten also erst mal selbst erzeugt, zusätzlich zu denen, die sie schon in Datenbanken natürlich hatten und haben dann ihr System trainiert. Dann haben sie in der KI ausgesucht, trainiert und so weiter. Und nach fünf Jahren Arbeit ist Jasmeth heute so weit, dass es ein GCMS-Spektrum sieht und in ein paar Sekunden mögliche Moleküle vorschlägt und zum Teil auch hunderte Vorschläge machen kann. Und das funktioniert schon einigermaßen gut heutzutage. Also ich stelle es mir so ein bisschen vor wie so ein Lexikon, in dem man mal was nachschlagen kann. Nee, es ist ein bisschen anders. Also es ist tatsächlich so, dass du quasi direkt eine Probe misst und dann sagst du zum Beispiel: Ich möchte zu dem und dem Peak irgendwie wissen, was könnte das für ein Molekül sein. Und dann kannst du live am Computer sehen, wie dann da eben ein paar Strukturen erscheinen. Und dann rankt der dir auch so die, die wahrscheinlichste und so weiter oder die besten fünf oder wie auch immer. Und dann kannst du dir diese Moleküle angucken und sagen: Okay, das sieht aber nicht logisch aus. Und okay, ich probiere mal das und vielleicht könnte es das sein. Und du kannst das dann als Mensch Also der Mensch muss immer noch mitarbeiten. Dazu kommen wir wahrscheinlich gleich. Aber es ist nicht so, dass das System jetzt automatisch all deine Spektren analysiert und du dich darauf verlassen kannst. Und das wie so ein Nachschlagewerk ist. Nein, sondern das System arbeitet live mit dem, was Du misst eben direkt im Labor. Und du guckst dir das dann als Chemiker an und entscheidest dann, welche von diesen Strukturen sinnvoll erscheint. Also, krasse Arbeit auf jeden Fall. Der Kollege Pflüger heißt ja euer Autor und sein Team, da machen. Und du bringst mich eigentlich hast mich schon direkt zu einer Frage gebracht, die ich unbedingt noch stellen wollte zum Schluss. Nämlich, oft wenn wir über künstliche Intelligenz reden, reden wir auch über das Thema: Braucht man uns dann noch? Und gerade in der Chemie ist das natürlich auch eine Frage. Welche Rolle spielt denn der Mensch da noch weiterhin? Auch wenn diese Entwicklung, jetzt sage ich mal, an Rasantz noch zunimmt mit der KI, auch in der chemischen Analyse? Ja, wir haben es gerade schon so ein bisschen angerissen. Also, was die KI bisher macht, sind Vorschläge. Das heißt, der Mensch bleibt erst mal wichtig, um diese Vorschläge zu prüfen. Die sind jetzt auch noch nicht so treffsicher. Also, noch nicht wer weiß, noch nicht so treffsicher, dass man damit routinemäßig Untersuchungen machen könnte oder so etwas. Sondern ein Mensch prüft die wahrscheinlichsten Vorschläge und guckt dann, sind die plausibel? Vielleicht, um mal so einen Eindruck zu bekommen, wie weit das Ganze im Moment ist: Der erste Vorschlag ist momentan in einem Drittel der Fälle richtig. Und wenn man die besten fünf Vorschläge anschaut, dann liegt es ungefähr in der Hälfte der Fälle das richtige Molekül dabei. Also, es ist schon sehr gut. Natürlich kann man sich fragen, warum ist es nicht besser oder warum ist das so schwer? Das liegt zum einen Teil eben wieder daran, dass es nicht so viele Trainingsdaten gibt. Das heißt, es gibt da eben Moleküle, die kommen so selten vor, dass sie in den Trainingsdaten halt noch nie aufgetaucht sind, wenn die KI dann im Ernstfall auf das Molekül stößt. Und dann gibt es Moleküle, deren Spektren sich sehr ähneln. Die kann man dann auch leicht verwechseln. Also, da sind so Schwierigkeiten. Es ist aber auch nützlich, wenn ich eine falsche Vorhersage habe, denn die enthalten dann vielleicht einen Teil der korrekten Struktur. Vielleicht wäre ich als Mensch nicht sofort drauf gekommen und kann dann eben damit weiterarbeiten. Also, die Vorschläge bilden auch eine Basis, mit der man dann die Fachleute weiterdenken können oder vielleicht auch auf die richtige Spur kommen. Also, sie nehmen einfach eine ganze Menge an Puzzlearbeit schon ab. Also, grenzt das schon mal ein bisschen ein, auch wenn es falsch liegt, zum Beispiel. Genau, genau. Du musst nicht von null anfangen, sondern du hast schon mal eine Ausgangsbasis. Und schlussendlich, weil du ja nach der Rolle des Menschen gefragt hast, kommt natürlich noch der weitere Schritt dazu, über den wir auch ganz kurz schon mal gesprochen haben. Jede Struktur muss wieder validiert werden. Das heißt, ich muss das Molekül noch mal im Labor herstellen und ein Spektrum der echten Substanz machen und gucken, passt es? Und das brauchst du momentan auch weiterhin. Da gibt es auch Ansätze, solche Kontrollen zu automatisieren. Aber momentan ist das auch noch nicht möglich und das steht auch noch am Anfang. Aber sehr, sehr, sehr spannende Forschung, die da betrieben wird. Mehr dazu erfahrt ihr auf spektrum.de. Da könnt ihr den gesamten Artikel auch noch mal nachlesen. Und Verena, man kann auf jeden Fall eine Sache mitnehmen: Nämlich, wenn man das nächste Mal bei einem Weinabend ist und jemand da rumposant, was er alles über Wein weiß, dann kann man mal sagen: In dem Glas, das du in der Hand hältst, sind wahrscheinlich die Hälfte der Substanzen oder Strukturen, die da drin sind, noch gar nicht bekannt. Ja, auf jeden Fall. Das wäre auf jeden Fall super, gerade um so Leute zu bremsen, die mit ihrem Weinwissen immer sich extrem, wie nennt sich das? Produzieren. Ja, sehr gut. Dann sage ich Verena, vielen, vielen Dank für diesen Funfact und natürlich fürs Erklären. Ja, gerne. Und das war’s für diese Woche von uns hier beim Spektrum Podcast. Euch vielen, vielen Dank fürs Zuhören. Gerne auch kommende Woche wieder dabei sein. Wie immer am Freitag gibt’s dann eine neue Folge von uns. Und bis dahin würde ich mich freuen, wenn ihr den Podcast abonniert, kommentiert, bewertet und natürlich teilt. Für die Reichweite ist klar, das hilft uns sehr. Auch dafür vielen vielen Dank. Mein Name ist Max Zimmer und ich sag Tschüss und macht’s gut. Spektrum der Wissenschaft, der Podcast von detektor.fm.