OpenAI präsentiert GPT-4

ChatGPT auf Bildschirm eines Laptops©Elke Mayr

ChatGPT ist wohl das zur Zeit bekannteste und schlagkräftigste Künstliche-Intelligenz-Sprachmodell. Wie ist das Tool der Firma OpenAI aufgebaut und wie genau funktioniert es? Eine Übersicht.

von

Ann Kathrin Hermes

Inhalt

Was ist ChatGPT?

ChatGPT ist ein KI-Tool des Unternehmens OpenAI, das im November 2022 gelauncht wurde. ChatGPT ist die Abkürzung für „Chatbot Generative Pre-trained Transformer“ und dahinter verbirgt sich – simple übersetzt – ein Tool, das mithilfe von künstlicher Intelligenz (KI) die unterschiedlichsten Anfragen beantworten kann und zwar in einer bislang nahezu unbekannten Qualität.

Wofür kann ChatGPT eingesetzt werden?

Das Sprachmodell ist in der Lage, Aufforderungen in natürlicher Sprache zu verstehen und darauf zu reagieren. ChatGPT kann für eine Vielzahl von Aufgaben eingesetzt werden – wie beispielsweise:

zur Beantwortung von Fragen
zum Schreiben von Codes
zur Fehlerbehebung in ebensolchen
zur Strukturierung von Texten
zum Übersetzung von Texten
zur Zusammenfassung von Texten

Let's build GPT: from scratch, in code, spelled out.[VIDEO]Andrej Karpathy, einer der Gründer von OpenAI, über die Funktionen von GPT-3 und ChatGPT

Worin liegt der Unterschied zwischen ChatGPT und GPT-3?

Oftmals werden ChatGPT und GPT-3 gleichgesetzt. Doch es handelt sich nicht um dasselbe.
GPT-3 steht für Generative Pre-trained Transformer 3 und ist das künstliche neuronale Netzwerk-Sprachmodell, auf dem auch ChatGPT aufbaut.
Die Technologie basiert auf sogenannten tiefen neuronalen Netzen. Dieses tiefe Lernen („Deep Learning“) ist eine noch anspruchsvollere Version des maschinellen Lernens („machine Learning“), bei der spezielle Algorithmen mit riesigen Datenmengen darauf trainiert werden, bestimmte Zusammenhänge zu erkennen und später auch auf unbekannte Daten anwenden zu können.

Blurred image background — OpenAI hat den Trainingsprozess von ChatGPT auf ihrer Website veröffentlicht
© Screenshot/OpenAI

Die unterschiedlichen Trainingsstufen von ChatGPT — OpenAI hat den Trainingsprozess von ChatGPT auf ihrer Website veröffentlicht
© Screenshot/OpenAI

Zudem wurde ChatGPT mit menschlichem Feedback trainiert (einer Technik, die dem Reinforcement Learning (Bestärkendes Lernen) zuzuordnen ist). Diese trainingsmethode ist ausschlaggebend für die hohe Qualtiät des Outputs. Denn durch das Feedback lernt(e) die KI, was Menschen erwarten, wenn sie eine Frage stellen – welche Intention dahintersteckt.

GPT-4: Was es kann & der Unterschied zu GPT-3.5

Im März 2022 präsentierte OpenAI GPT-4. Zugänglich - im ersten Schritt - für Abonennten von ChatGPT Plus und Entwickler:innen. "GPT-4 ist kreativer und kollaborativer als je zuvor. Es kann gemeinsam mit Nutzern kreative und technische Schreibaufgaben erstellen, bearbeiten und iterieren; wie z.B. das Komponieren von Songs, das Schreiben von Drehbüchern oder das Lernen des Schreibstils eines Nutzers."

Wo liegt der Unterschied zwischen GPT-3.5 und GPT-4?

GPT-4 ist kein reines Sprachmodell mehr. Die KI "versteht" nun auch Bilder - "GPT-4 ist nicht nur ein Sprachmodell, sondern auch ein visuelles Modell", erklärte Greg Brokman, Präsident und Mitgründer von OpenAI, bei der Präsentation des Tools. Diese Funktion wurde gemeinsam mit der Firma Be My Eyes entwickelt.

Was heißt "versteht" in diesem Kontext? GPT-4 ist nicht nur in der Lage Objekte visuell zu erfassen; heißt: Wenn Bilder von Luftballons zu sehen sind, erkennt das Tool das Objekt Luftballons; sondern GPT-4 formuliert, was mit dem Objekt passieren kann, wenn eine Handlung am Objekt durchgeführt wird.

GPT-4 wurde gefragt, was passieren würde, wenn die Schnüre, an denen die Ballons befestigt sind, durchgeschnitten werden würden. Die Antwort des Systems: Die Ballons würden davonfliegen.

Praxisrelevant wird diese Funktion, wenn man sich folgendes Beispiel anschaut: Man erstellt ein Mock-Up einer Website, fotografiert dieses und die künstliche Intelligenz entwickelt daraufhin einen passenden HTML-Code.

"GPT-4 übertrifft ChatGPT in seinen fortschrittlichen Argumentationsfähigkeiten", heißt es von Seiten des Unternehmens.

Zudem wurde die potenzielle Länge der Antworten wesentlich erhöht. War GPT-3 noch in der Lage Antworten mit bis zu 3000 Wörtern zu generieren, kann GPT-4 Antworten mit bis zu 25.000 Wörtern erzeugen.

Nutzer:innen können folgerichtig auch nun größere Inhalte bzw komplexere Kontexte als Input verwenden.

"Wir haben 6 Monate damit verbracht, GPT-4 sicherer zu machen. GPT-4 antwortet 82% seltener auf Anfragen nach unzulässigen Inhalten und liefert 40% eher sachliche Antworten als GPT-3.5 in unseren internen Auswertungen", hieß es von Seiten OpenAI.

Welcher Datensatz wurde für das Training von ChatGPT verwendet?

Bei ChatGPT handelt es sich um ein „Large Language Model“ (LLM). Das heißt, wie auch andere LLMs wurde ChatGPT mit großen und vielfältigen Datenquellen „gefüttert“: Bücher, (Nachrichten)Artikeln, Wissenschaftliche Artikel, Websites oder Beiträge, Kommentare aus den sozialen Netzwerken. Das System wird darauf trainiert, Muster und Strukturen zu erkennen und so menschenähnliche Sprache zu entwickeln.

Laut einem Paper der Stanford Universität (Hier geht es zum Paper) umfasst GPT-3 „175 Milliarden Parameter und wurde auf 570 Gigabyte Text trainiert. Zum Vergleich: Sein Vorgänger, GPT-2, war mit 1,5 Milliarden Parametern über 100 Mal kleiner. Diese Vergrößerung verändert das Verhalten des Modells drastisch - GPT-3 ist in der Lage, Aufgaben auszuführen, für die es nicht explizit trainiert wurde, wie z. B. die Übersetzung von Sätzen aus dem Englischen ins Französische, und das mit wenigen bis gar keinen Trainingsbeispielen.“
Zudem: Das System lernt mit jeder Eingabe der User:innen dazu.

Falsche Antworten und ein Zeitstempel von 2021 - Was kann ChatGPT nicht?

Betrachtet man die Datensätze, ist damit unweigerlich auch das Limit des Tools verbunden. Was kann ChatGPT nicht?
Die Software ist nicht direkt mit dem Internet verbunden und arbeitet nicht aktuell. Die Datensätze haben einen Zeitstempel von 2021. Damit kann das System nicht auf Fragen antworten, die sich mit Themen nach 2021 befassen.

Zudem mögen zahlreiche Antworten plausibel klingen, sind jedoch faktisch falsch. Hier muss man sich erneut das Modell hinter ChatGPT vor Augen führen. Es ist ein Sprachmodell; das auf Grundlage einer Wahrscheinlichkeitsverteilung von Wortfolgen arbeitet.

OpenAI selbst streicht fünf „Limitations“ hervor:

„ChatGPT schreibt manchmal plausibel klingende, aber falsche oder unsinnige Antworten. Dieses Problem zu beheben ist eine Herausforderung, da: (1) während des RL (Anm. „Reinforcement Learning“)-Trainings gibt es derzeit keine Quelle der Wahrheit; (2) das Trainieren des Modells dahingehend, dass es vorsichtiger, zurückhaltender agiert, führt dazu, dass es Fragen ablehnt, die es korrekt beantworten könnte; und (3) überwachtes Training führt das Modell in die Irre, weil die ideale Antwort davon abhängt, was das Modell weiß, und nicht, was der menschliche Demonstrator weiß.
ChatGPT reagiert empfindlich auf Änderungen der Eingabe oder auf mehrfache Eingabeersuche mit der gleichen Frage. Zum Beispiel kann das Modell bei einer Frage behaupten, die Antwort nicht zu kennen, kann aber bei einer leichten Umformulierung die Frage richtig beantworten.
Das Modell ist oft übermäßig langatmig und verwendet bestimmte Phrasen zu oft, wie z. B. den Hinweis, dass es sich um ein von OpenAI trainiertes Sprachmodell handelt. Diese Probleme entstehen durch Verzerrungen in den Trainingsdaten (Trainer:innen bevorzugen längere Antworten, die umfassender aussehen) und bekannte Überoptimierungsprobleme.
Im Idealfall würde das Modell klärende Fragen stellen, wenn der Benutzer eine mehrdeutige Anfrage stellt. Stattdessen raten unsere aktuellen Modelle in der Regel, was der Nutzer beabsichtigt.
Obwohl wir uns bemüht haben, das Modell dazu zu bringen, unangemessene Anfragen abzulehnen, wird es manchmal auf ebensolche Anweisungen reagieren oder ein voreingenommenes Verhalten zeigen. Wir verwenden die Moderations-API, um bestimmte Arten von Inhalten zu kennzeichnen oder zu blockieren, aber wir gehen davon aus, dass es im Moment noch einige falsch negative und positive Ergebnisse geben wird. Wir sind gespannt auf das Feedback der Nutzer, um dieses System weiter zu verbessern.“

ChatGPT auf dem Bildschirm eines Laptops
© Elke Mayr

Von der Theorie zum Test – Wie verwende ich ChatGPT?

Eine Schritt für Schritt Anleitung, wie man ChatGPT verwenden kann.

Erstellen Sie einen kostenlosen OpenAI Account. Gehen Sie dazu auf die Website von OpenAI und klicken Sie auf „Sign up“

Userinterface von OpenAI — Die Website von OpenAI
© Screenshot/ChatGPT

Geben Sie eine E-Mail Adresse sowie eine Telefonnummer an und bestätigen Sie Ihre Anmeldung.

LoginOpenAI — In wenigen Klicks kann man sich einloggen
© Screenshot/ChatGPT

Nachdem Sie einen Account angelegt und aktiviert haben, rufen Sie direkt die Website des Tools ChatGPT auf.

Geben Sie ihren Prompt direkt in das Eingabefeld ein

Userinterface von ChatGPT — die Eingabemaske von ChatGPT
© Screenshot/ChatGPT

Was ist ein Prompt?

Sehr einfach formuliert: Ein Prompt ist jene Information, die Sie einer KI geben, damit sie das tut, was Sie von ihr wollen.

Prompts sind Grundlage aller KI-Tools
Die Qualität eines Prompts definiert die Qualtiät des Resultats. Heißt: Je präziser der Prompt formuliert wird, desto hochwertiger und exakter ist der Output, den die KI liefert.

Die von Ihnen getätigten Eingaben können (sollen) aufeinander aufbauen. Sie können demnach Bezug auf bereits getätigte Aussagen/Fragen nehmen.
Zu beachten ist: Jeder neuen ChatGPT-Konversation fehlt der Kontext. Hier existiert kein „KI-Gedächtnis“

Tipps für bessere ChatGPT Resultate

Formulieren Sie den Prompt so präzise wie möglich
Stellen Sie sich die Frage: Welches Ziel soll mit dem Prompt erreicht werden?
Definieren Sie die Länger der Textergebnisse und die Darstellungsform
Stellen Sie sich die Frage: Wofür soll das Ergebnis eingesetzt werden?

Wie kann man die Künstliche Intelligenz genau bedienen? Mehr zum Thema "Prompt" lesen Sie hier

Deutsch, Englisch, Französisch – Welche Sprachen „spricht“ ChatGPT?

Zwar wurde das KI-Tool hauptsächlich mit englischen Texten trainiert; doch es ist in der Lage auch weitere Sprachen zu verstehen. Auch wenn die Resultate qualitativ hochwertiger sind, wenn sie in englischer Sprache ausgegeben werden. OpenAI gibt an, dass das Tool mit folgenden Sprachen arbeiten kann: „Spanisch, Französisch, Deutsch, Italienisch, Russisch, Portugiesisch, Chinesisch, Japanisch und „viele mehr“.

Möchte man eine Ausgabe auf Deutsch erhalten, kann man den Prompt gleich auf Deutsch verfassen.

Zudem spricht ChatGPT auch alle gängigen Programmiersprachen, wie beispielsweise Java, Python, Swift,C++, JavaScript, Ruby, PHP, Go und Kotlin.

7 Alternativen zu ChatGPT

ChatGPT ist nicht das einzige KI Textgenerator-Tool. Anbei ein paar Alternativen:

Gratis oder kostenpflichtig - Was zahle ich für ChatGPT?

In der Preview-Phase lässt sich der Dienst gratis testen. Im Februar 2023 etablierte OpenAI ein Abo-Geschäftsmodell. Für 20 US-Dollar im Monat erhalten zahlende Kund:innen verlässlich Zugang zur Software und schnellere Ergebnisse auch bei hoher Auslastung, so das Unternehmen. Zudem sollen Abonnent:innen früher Zugriff auf neue Funktionen erhalten.

Was kostet GPT-4?

Von Seiten OpenAI heißt es dazu:

gpt-4 mit einem 8K Kontextfenster (etwa 13 Seiten Text) kostet 0,03 US-Dollar pro 1K Prompt-Token und 0,06 US-Dollar pro 1K Completion-Token.

gpt-4-32k mit einem 32K-Kontextfenster (ca. 52 Seiten Text) kostet 0,06 US-Dollar pro 1K Prompt-Token und 0.12 US-Dollar pro 1K Completion-Token.

Suchmaschine ChatGPT: Ist das Tool eine Alternative zu Google und Co.?

Bisher noch nicht, nein. Wesentlich dafür sind zwei Punkte:

ChatGPT ist nicht direkt mit dem Internet verbunden
Das Modell ist primär nicht dafür ausgerichtet konkrete Fakten abzuspeichern & wiederzugeben

Doch Suchmaschinen, wie wir sie heute kennen und verwenden, könnten sich mit der Zeit verändern.

Vorteile von ChatGPT

Geschwindigkeit: In wenigen Minuten werden umfangreiche Datensätze generiert
Anwendungsgebiet: Das Tool ist vielseitig einsetzbar (vgl. „Wofür kann ChatGPT eingesetzt werden?)
Datenmenge: ChatGPT wurde aus Basis einer großen, vielfältigen Datenmenge trainiert
Natürliche Sprachverarbeitung: ChatGPT generiert menschenähnliche Antworten auf Fragen und Aufgaben
Verfügbarkeit: Online jederzeit verfügbar und leicht zugänglich

Nachteile von ChatGPT

Quellenangaben: Es ist nicht nachvollziehbar, woher genau das Tool seine Daten bezieht. Auch Urheberrechtsfragen gilt es noch zu klären.
Korrekte Antworten: Nicht immer sind die Antworten von ChatGPT faktisch richtig. Es gilt das Ergebnis genau zu prüfen.
Datenschutz: Mit den Daten, die User:innen eingeben, lernt die KI. Doch es muss einem bewusst werden, dass – auch wenn Datenschutzmaßnahmen implementiert sind – die Übertragung von sensiblen (personenbezogenenen bspw.) Daten niemals vollständig sicher ist.
Algorithmic Bias: Wie bei zahlreichen KI-Anwendungen kann es bei dem Tool zu einer algorithmischen Voreingenommenheit und Verzerrung kommen.

Wird ChatGPT verboten?

Ob nun Hausarbeit oder Seminararbeit, immer wieder kommt es vor, dass textbasierte generative Sprachmodelle dazu genutzt werden, die Arbeit zu übernehmen. Statt von Schüler:innen oder Student:innen werden Arbeiten nun von der KI verfasst. Das veranlasste einige Schulen wie auch Universitäten dazu, ChatGPT zu verbieten oder die Nutzung stark zu reglementieren. Ein generelles Verbot gibt es aber nicht.

Detektor: So können KI-Texte erkannt werden

Die oben erwähnte Frage nach einem Verbot des Tools, ist unabdingbar mit der Frage "Ist das ein - von einer KI verfasster - Text?" verbunden. OpenAI hat selbst ein Programm veröffentlicht, mit dem Texte von Menschen und Computern erkannt werden soll. Das Tool heißt "AI Classifier". Es wurde, wie auch ChatGPT selbst, überwiegend mit englischen Daten trainiert; will heißen: Hier erzielt das Programm wesentlich bessere Ergebnisse als mit anderen Sprachen. OpenAI selbst weiß von den Schwachstellen weist darauf hin, dass der "AI Classifier" noch nicht hundertprozentig korrekte Ergebnisse liefert.

Alternativ zum "AI Classifier" gibt es noch weitere KI-Text-Detektoren. Beispielsweise:

Fazit

ChatGPT ist einfach zu bedienen, gut zugänglich und de facto selbsterklärend. Das Tool kann Geschäftsprozesse in Text übersetzen und darauf basierend Prozesse vergleichen, effizienter machen oder ganz neue Prozesse für neue Geschäftsmodelle von Grund auf kreieren.
Das Tool wird uns sicherlich noch eine Weile begleiten; man sollte aber nicht außer Acht lassen, dass es auch noch andere textbasierte Sprachmodelle gibt.

Digital Künstliche Intelligenz

Über die Autoren