ChatGPT (Aussprache [tʃætdʒiːpiːˈtiː]; von englisch to chat ‚plaudern‘, ‚sich unterhalten‘, auch ‚sich Kurznachrichten schreiben‘ und generative pre-trained transformer, „generativer vortrainierter Transformer“) ist ein im November 2022 vorgestellter Chatbot des US-amerikanischen Softwareunternehmens OpenAI, mit dem Nutzer über textbasierte Nachrichten und Bilder ähnlich wie mit einem Menschen kommunizieren können. Die Grundlage von ChatGPT ist ein Large Language Model. Dabei handelt es sich um ein sehr leistungsfähiges Sprachmodell, das mit einer Vielzahl von Textdokumenten trainiert wurde.
OpenAI, das Unternehmen hinter ChatGPT, wurde 2015 gegründet.[2] Das erste Sprachmodell, GPT-1, welches auf der 2017 erstmals vorgestellten Transformer-Architektur aufbaute, wurde im Juni 2018 eingeführt. Es bestand aus 117 Millionen vortrainierten Parametern.[3] Die Anzahl der Parameter definiert u. a. die Leistungsfähigkeit eines KI-Modells, je höher deren Anzahl, desto besser die Leistungsfähigkeit. Der im Februar 2019 gestartete Nachfolger, GPT-2 umfasste bereits 1,5 Milliarden Parameter. Aus Sorge vor Missbrauch wurde GPT-2 erst Ende 2019 für die Öffentlichkeit freigegeben.[4] GPT-3 folgte im Juni 2020 – es war mit 175 Milliarden Parametern trainiert worden und das erste Modell, das in der Lage war, umfassendere und unterschiedlichere Aufgaben zu bearbeiten: vom Verfassen von E-Mails und sonstigen Texten über Übersetzungen bis hin zur Erstellung von Programmcode.[5] Zudem war es erstmals in der Lage, umfassend Antworten zu frei formulierten Fragen von Nutzern zu generieren.[6][7]
Quelle: Wikipedia