AI Chatbots - Funktionsweise

6 bookmarks

Custom sorting

The Surprising Power of Next Word Prediction: Large Language Models Explained, Part 1 | Center for Security and Emerging Technology

Die überraschende Kraft der Vorhersage des nächsten Wortes: Erklärung großer Sprachmodelle, Teil 1

Matthew Burtell, Helen Toner, 8. März 2024

Große Sprachmodelle (LLMs), die Technologie, die Produkte der generativen künstlichen Intelligenz (KI) wie ChatGPT oder Google Gemini antreibt, werden oft als Chatbots betrachtet, die das nächste Wort vorhersagen. Aber das ist nicht die ganze Geschichte darüber, was LLMs sind und wie sie funktionieren. Dies ist der erste Blogbeitrag einer dreiteiligen Serie, in der einige Schlüsselelemente der Funktionsweise von LLMs erläutert werden. In diesem Blogbeitrag geht es um das Vortraining – den Prozess, durch den LLMs lernen, das nächste Wort vorherzusagen – und warum es so überraschend leistungsstark ist.

·cset.georgetown.edu·May 28, 2024

The Surprising Power of Next Word Prediction: Large Language Models Explained, Part 1 | Center for Security and Emerging Technology

How Developers Steer Language Model Outputs: Large Language Models Explained, Part 2 | Center for Security and Emerging Technology

Wie Entwickler Sprachmodellausgaben steuern: Große Sprachmodelle erklärt, Teil 2

Thomas Woodside , Helen Toner 8. März 2024

Große Sprachmodelle (LLMs), die Technologie, die Produkte der generativen künstlichen Intelligenz (KI) wie ChatGPT oder Google Gemini antreibt, werden oft als Chatbots betrachtet, die das nächste Wort vorhersagen. Aber das ist nicht die ganze Geschichte darüber, was LLMs sind und wie sie funktionieren. Dies ist der zweite Blogbeitrag einer dreiteiligen Serie, in der einige Schlüsselelemente der Funktionsweise von LLMs erläutert werden. In diesem Blogbeitrag geht es um die Feinabstimmung – eine Reihe von Techniken, mit denen die Art der Ausgabe geändert wird, die vorab trainierte Modelle erzeugen.

·cset.georgetown.edu·May 28, 2024

How Developers Steer Language Model Outputs: Large Language Models Explained, Part 2 | Center for Security and Emerging Technology