LLM (großes Sprachmodell)
Was ist ein LLM (großes Sprachmodell)?
Definition
Ein großes Sprachmodell (LLM) ist ein neuronales Netz, das auf riesigen Textmengen trainiert wird, um das nächste Token einer Sequenz vorherzusagen. In diesem Maßstab lernt es, natürliche Sprache zu erzeugen, zusammenzufassen, zu übersetzen und zu verarbeiten — und treibt Chatbots, KI-Agenten und die meisten modernen KI-Funktionen an.
Inhaltsverzeichnis
Ein großes Sprachmodell (LLM) ist die Engine hinter dem heutigen KI-Boom — die Technologie in ChatGPT, Claude und Gemini. Es ist ein neuronales Netz mit Milliarden von Parametern, das darauf trainiert wurde, Text vorherzusagen, und sich dabei als erstaunlich gut bei Sprachaufgaben erweist.
Wie ein LLM funktioniert
Ein LLM wird auf einem riesigen Textkorpus mit einem täuschend einfachen Ziel trainiert: das nächste Token vorhersagen (ein Wort oder Wortteil) auf Basis von allem davor. Über Billionen von Wörtern wiederholt, lernt das Modell so Grammatik, Fakten, Stile und Denkmuster. Zur Laufzeit erzeugt es Text Token für Token, wobei jede Vorhersage in die nächste einfließt.
Tokens & Kontextfenster
LLMs lesen nicht direkt Zeichen oder Wörter, sondern Tokens — Bausteine von etwa 3–4 Zeichen. Das Kontextfenster gibt an, wie viele Tokens das Modell gleichzeitig berücksichtigen kann (sein Arbeitsgedächtnis). Ein größeres Fenster erlaubt längere Dokumente, doch jedes Token kostet Rechenleistung und Geld — weshalb Kostenkontrolle in Produktion entscheidend ist.
Grenzen & Halluzinationen
Da ein LLM plausiblen Text vorhersagt, statt Fakten nachzuschlagen, kann es „halluzinieren" — selbstbewusst, aber falsch antworten. Außerdem ist sein Wissen zum Trainingszeitpunkt eingefroren. Beide Grenzen adressiert die Retrieval-augmentierte Generierung (RAG), die dem Modell echte, aktuelle Daten zur Verankerung liefert.
Wo LLMs eingesetzt werden
Ein LLM allein beantwortet Prompts. Mit Tools und einem Ziel umhüllt, wird es zu einem KI-Agenten; an Ihre Daten angebunden, treibt es Suche, Texterstellung, Klassifizierung und Support an. Das Modell ist der Motor — der Wert entsteht durch die Einbindung in echte Workflows.
Fazit
Ein LLM ist ein Next-Token-Prädiktor, trainiert in gewaltigem Maßstab. Tokens, Kontextfenster und Halluzinationen zu verstehen ist die Grundlage für einen verantwortungsvollen Einsatz — und für produktive Systeme, die präzise und bezahlbar bleiben.
Häufige Fragen
Was ist der Unterschied zwischen einem LLM und KI?
KI ist das übergeordnete Feld; ein LLM ist eine spezifische Art von KI, spezialisiert auf Sprache. Das meiste, was man heute „KI" nennt — Chatbots, Schreibassistenten, KI-Agenten — basiert auf LLMs.
Warum machen LLMs Fehler?
Ein LLM erzeugt statistisch wahrscheinlichen Text, statt geprüfte Fakten abzurufen — daher kann es selbstbewusst, aber falsch antworten. Die Verankerung mit Retrieval (RAG) und Validierung reduziert das deutlich.
Mehr aus dem Wiki-Lexikon
Was ist ein KI-Agent?
Ein KI-Agent ist Software, die mit einem Sprachmodell zielgerichtet plant und handelt — Tools aufruft, entscheidet und mehrstufige Aufgaben autonom erledigt. Definition, Funktionsweise und Beispiele.
Was ist RAG (Retrieval-augmentierte Generierung)?
RAG (Retrieval-augmentierte Generierung) liefert einem LLM relevante, aktuelle Daten zur Anfragezeit, damit seine Antworten in Ihren Fakten verankert sind — nicht nur im Training. Definition, Funktionsweise und Nutzen.
Was ist Prompt Engineering?
Prompt Engineering ist die Kunst, Anweisungen zu formulieren, die einem LLM zuverlässige, präzise Ergebnisse entlocken. Definition, Kerntechniken (Kontext, Beispiele, Struktur) und Bedeutung in Produktion.
Was ist eine Vektordatenbank (und Embeddings)?
Eine Vektordatenbank speichert Text als Embeddings — numerische Bedeutungsvektoren — damit KI nach Ähnlichkeit suchen kann, nicht nur nach Stichwörtern. Definition, Funktionsweise von Embeddings und warum Vektorsuche RAG antreibt.