Autor: Milad Safar, Managing Partner der Weissenberg Group
In der Vergangenheit wurde der Begriff generative k?nstliche Intelligenz (KI) vor allem mit Deepfakes und Datenjournalismus in Verbindung gebracht. Doch die Technologie spielt eine immer wichtigere Rolle bei der Automatisierung von sich wiederholenden Prozessen in der digitalen Bild- und Audiokorrektur. Wann immer KI eigene Inhalte generiert, sei es Text, Bilder oder Multimedia, hat generative KI ihre Finger im Spiel. Dabei handelt es sich um Technologien, die selbstst?ndig Bilder produzieren und aus den im Internet gesammelten Informationen eigenst?ndig Website-Artikel, Artikelzusammenfassungen, Unternehmensbrosch?ren, Pressemitteilungen und White Paper erstellen. Kurz gesagt, generative KI-Modelle dienen dem Zweck, synthetische Daten zu erzeugen, die einen Turing-Test bestehen k?nnen.
Was ist generative KI?
Generative KI ist eine Technologie, die KI und Algorithmen des maschinellen Lernens einsetzt, um Maschinen in die Lage zu versetzen, aus vorhandenen Texten, Audiodateien, Bildern oder Originalmustern Inhalte zu erstellen. Bei der generativen KI verwenden Computer ihre Trainingsdaten, um das zugrundeliegende Muster zu erkennen, das mit der Eingabe verbunden ist, und Inhalte so zu produzieren, dass die Benutzer sie f?r echt halten. Was bisher dem Menschen vorbehalten war, n?mlich das Erzeugen von Artefakten, kann nun die generative KI leisten. Dabei liefert sie originelle Ergebnisse, die auf menschlichem Denken und menschlicher Erfahrung beruhen, und zwar ohne Voreingenommenheit. So kann generative KI beispielsweise Inhalte erstellen, die den Anschein erwecken, von Menschen geschrieben zu sein. Generative KI erstellt automatisch neue Objekte oder Strukturen auf der Grundlage vorhandener Daten und Erkenntnisse, anstatt nur selbstlernende Algorithmen zu verwenden.
Wie funktioniert generative KI?
Bei der generativen KI handelt es sich im Grunde um Programme, die vorhandene Inhalte wie Texte, Audiodateien oder Bilder verwenden, um neue koh?rente und ?berzeugende Inhalte zu erstellen. Die Computer sind in der Lage, das zugrundeliegende Muster in Bezug auf die Eingabe zu erlernen und es dann zu verwenden, um ?hnliche Inhalte zu erzeugen. Drei Techniken bilden die Grundlage der generativen KI: Generative Adversarial Networks (GAN), Transformers und Variational Autoencoders.
Generative Adversarial Netzworks (GANs)
GANs bestehen aus zwei neuronalen Netzen – einem Generator und einem Diskriminator. Der Generator ist, wie der Name schon sagt, f?r die Erzeugung neuer Daten oder Inhalte zust?ndig, die den Quelldaten ?hneln. Der Diskriminator ist f?r die Unterscheidung zwischen den Quelldaten und den generierten Daten zust?ndig. In st?ndig wechselnden Trainingszyklen lernt der Generator fortlaufend, realistischere Daten zu erzeugen, w?hrend der Diskriminator trainiert wird, gef?lschte Daten von echten Daten zu unterscheiden.
Transformatoren
Transformatoren wie GPT-3, LaMDA und Wu-Dao ahmen die kognitive Aufmerksamkeit nach und messen die Bedeutung der Eingabedaten auf unterschiedliche Weise. Sie werden darauf trainiert, die Sprache oder das Bild zu verstehen, Klassifizierungsaufgaben zu erlernen und Text oder Bilder aus gro?en Datens?tzen zu generieren.
Variational Autoencoder (VAE)
Variational Autoencoder ist eine Deep-Learning-Technik, mit der komplexe generative Datenmodelle entworfen und an gro?e Datens?tze angepasst werden k?nnen. Diese Technik kann Bilder von fiktiven Gesichtern prominenter Personen und hochaufl?sende digitale Kunstwerke erstellen. Wie das GAN, so sorgt auch die VAE daf?r, dass die Genauigkeit der Ausgabe verbessert wird.
Vom abstrakten Konzept zum t?uschend echten Objekt
Laut Gartner geht es bei der generativen KI darum, aktuelle innovative Arbeitsabl?ufe gemeinsam mit Menschen zu verbessern. Generative KI kann zur Entwicklung von Objekten oder Gegenst?nden eingesetzt werden, die den Menschen bei der Erf?llung kreativer Aufgaben unterst?tzen. Sie k?nnen jedoch keine v?llig neuen Bilder oder Texte erstellen, weil sie das, was sie wissen, auf bestm?gliche Weise miteinander kombinieren. Generative KI unterst?tzt ML-Modelle, befreit sie von Verzerrungen und realisiert abstraktere Konzepte durch Nachahmung der realen Welt. Mit generativer KI erstellte Avatare werden zum Schutz von Personen eingesetzt, die ihre Identit?t bei Vorstellungsgespr?chen, Interviews oder bei der Arbeit nicht preisgeben wollen. Die generative Modellierung kann sicherstellen, dass Modelle f?r maschinelles Lernen weniger voreingenommen sind, und es Bots erm?glichen, abstrakte Konzepte in Simulationen und in der realen Welt zu verstehen.
Aus Alt mach Neu
Generative KI erzeugt realistisch aussehende Fotos von menschlichen Gesichtern, Objekten und Szenen. Das Anwendungsszenario in der Film- und Werbeindustrie ist deshalb breit gef?chert. Bilder, die bei schlechten Licht- oder Wetterbedingungen aufgenommen wurden, k?nnen in die gew?nschten Bedingungen umgewandelt werden. Sie ?ndert Farbbilder in Schwarz-Wei?-Bilder und Fotos bei Tag in Fotos bei Nacht. Mit Hilfe von Gesichtssynthese und Stimmenklonen kann die Originalstimme des Schauspielers mit einer Lippensynchronisation abgeglichen werden. Generative KI kann alte, niedrig aufgel?ste Bilder und Filme durch Hochskalierung auf 4K und h?her verbessern, um genauere, klarere und detailliertere Bilder zu erhalten. Sie erzeugt 60 Bilder pro Sekunde anstelle von 23 oder weniger, beseitigt Rauschen und f?gt Farbe hinzu.
Optimierte Gesichtsidentifizierung und Suchergebnisse
Generative KI wandelt Eingaben in Form von semantischen Bildern oder Skizzen in fotorealistische Bilder um. Bei der Erzeugung von Frontalansichten von Gesichtern generiert die generative KI Frontalfotos aus Fotos, die aus verschiedenen Winkeln aufgenommen wurden, zwecks Optimierung von Systemen zur Gesichts?berpr?fung oder -identifizierung. Andere Anwendungsf?lle sind die Umwandlung von realen Fotos in Emojis oder in kleine Cartoon-Gesichter oder die Alterung von Gesichtern auf der Grundlage eines Fotos eines jungen Gesichts. Generative KI ist auch in der Lage, Suchmaschinendienste beispielsweise durch Text-zu-Bild-?bersetzung auf die n?chste Stufe zu heben. Sie erzeugt realistische Fotografien aus Textbeschreibungen von Objekten wie z.B. V?geln und Blumen.
Bessere Auswertung von R?ntgenbildern und optimierten Prothesen
Im Gesundheitswesen kann generative KI beispielsweise zur Fr?herkennung b?sartiger Tumore eingesetzt werden, indem das Generative Adversarial Networks Modeling (GAN) verschiedene Winkel einer R?ntgenaufnahme berechnet, um das m?gliche Ausma? des Tumors zu visualisieren. Mediziner k?nnen mit Hilfe von maschinellem Lernen das Verhalten und die Bewegungsmuster von Patienten beobachten, bevor sie mit Hilfe generativer KI das Design der Prothese berechnen und eine perfekte Prothese entwickeln.
Mehr als nur Anzeigentexte
Generative KI spielt auch bei der Texterstellung eine nicht zu untersch?tzende Rolle. Mittlerweile gibt es schon Tools, deren F?higkeiten ?ber das Generieren von Anzeigenzeilen, Produktbeschreibungen und Betreffzeilen f?r Outreach-Kampagnen hinausgehen. Dazu ben?tigt man nur noch eine Reihe von Schl?sselw?rtern und die KI erstellt im Handumdrehen einen kompletten Text. Die Tools k?nnen auch analysieren, welche Texte am erfolgreichsten sind und dementsprechend neue, ?hnlich konzipierte, aber bessere Texte verfassen. Die britische Zeitung „The Guardian“ hat bereits versuchsweise generative KI benutzt, um einen Aufsatz von Grund auf zu schreiben, mit einem aus Sicht der Journalisten besorgniserregenden Ergebnis.
Maschinenbasierte Kunstwerke
Ein weiterer interessanter Anwendungsbereich sind nicht-fungible Token (NFTs), die derzeit boomen und einen der lukrativsten M?rkte in der Krypto Welt darstellen. Der neueste Trend sind nicht mehr Karikaturen, sondern maschinenbasierte Kunstwerke, die mit generativer KI und menschlicher Vorstellungskraft erstellt werden. Sogenannte KI-Kunstgeneratoren k?nnen Text in Kunst verwandeln oder Bilder zu einem neuen Foto kombinieren.
Vielversprechende Aussichten
Mit generativer KI k?nnen Muster in einem bestimmten Inhalt erkannt werden, um neue, qualitativ hochwertige Objekte und Gegenst?nde durch Selbstlernen aus jedem Datensatz zu erschaffen. Unterschiedliche Auspr?gungen der generativen KI haben sich bereits in verschiedenen Anwendungsbereichen als sehr n?tzlich erwiesen, z. B. in der Bildproduktion, der Filmrestaurierung und der Erstellung von 3D-Umgebungen. Angesichts ihrer besonderen F?higkeiten, synthetische Daten zu erzeugen, um ihre eigenen Modelle zu trainieren, gilt generative KI als einer der vielversprechendsten Fortschritte in der Welt der KI. W?hrend die bisher verwendeten KI-Modelle Aufgaben ausf?hren, die auf ein bestimmtes Ergebnis hin trainiert wurden, bringt die generative KI eine ganz neue Dynamik ins Spiel, da ihre Algorithmen eine realistische, neuartige Version dessen erstellen k?nnen, wof?r sie trainiert wurden.
Keywords:Weissenberg, Generative KI, K?nstliche Intelligenz