LLM (großes Sprachmodell)

Was ist ein LLM (großes Sprachmodell)?

Alex GrygorievAktualisiert 5. Juni 20261 Min. Lesezeit

Definition

Ein großes Sprachmodell (LLM) ist ein neuronales Netz, das auf riesigen Textmengen trainiert wird, um das nächste Token einer Sequenz vorherzusagen. In diesem Maßstab lernt es, natürliche Sprache zu erzeugen, zusammenzufassen, zu übersetzen und zu verarbeiten — und treibt Chatbots, KI-Agenten und die meisten modernen KI-Funktionen an.

Inhaltsverzeichnis

Ein großes Sprachmodell (LLM) ist die Engine hinter dem heutigen KI-Boom — die Technologie in ChatGPT, Claude und Gemini. Es ist ein neuronales Netz mit Milliarden von Parametern, das darauf trainiert wurde, Text vorherzusagen, und sich dabei als erstaunlich gut bei Sprachaufgaben erweist.

Wie ein LLM funktioniert

Ein LLM wird auf einem riesigen Textkorpus mit einem täuschend einfachen Ziel trainiert: das nächste Token vorhersagen (ein Wort oder Wortteil) auf Basis von allem davor. Über Billionen von Wörtern wiederholt, lernt das Modell so Grammatik, Fakten, Stile und Denkmuster. Zur Laufzeit erzeugt es Text Token für Token, wobei jede Vorhersage in die nächste einfließt.

Tokens & Kontextfenster

LLMs lesen nicht direkt Zeichen oder Wörter, sondern Tokens — Bausteine von etwa 3–4 Zeichen. Das Kontextfenster gibt an, wie viele Tokens das Modell gleichzeitig berücksichtigen kann (sein Arbeitsgedächtnis). Ein größeres Fenster erlaubt längere Dokumente, doch jedes Token kostet Rechenleistung und Geld — weshalb Kostenkontrolle in Produktion entscheidend ist.

Grenzen & Halluzinationen

Da ein LLM plausiblen Text vorhersagt, statt Fakten nachzuschlagen, kann es „halluzinieren" — selbstbewusst, aber falsch antworten. Außerdem ist sein Wissen zum Trainingszeitpunkt eingefroren. Beide Grenzen adressiert die Retrieval-augmentierte Generierung (RAG), die dem Modell echte, aktuelle Daten zur Verankerung liefert.

Wo LLMs eingesetzt werden

Ein LLM allein beantwortet Prompts. Mit Tools und einem Ziel umhüllt, wird es zu einem KI-Agenten; an Ihre Daten angebunden, treibt es Suche, Texterstellung, Klassifizierung und Support an. Das Modell ist der Motor — der Wert entsteht durch die Einbindung in echte Workflows.

Fazit

Ein LLM ist ein Next-Token-Prädiktor, trainiert in gewaltigem Maßstab. Tokens, Kontextfenster und Halluzinationen zu verstehen ist die Grundlage für einen verantwortungsvollen Einsatz — und für produktive Systeme, die präzise und bezahlbar bleiben.

Häufige Fragen

Was ist der Unterschied zwischen einem LLM und KI?

KI ist das übergeordnete Feld; ein LLM ist eine spezifische Art von KI, spezialisiert auf Sprache. Das meiste, was man heute „KI" nennt — Chatbots, Schreibassistenten, KI-Agenten — basiert auf LLMs.

Warum machen LLMs Fehler?

Ein LLM erzeugt statistisch wahrscheinlichen Text, statt geprüfte Fakten abzurufen — daher kann es selbstbewusst, aber falsch antworten. Die Verankerung mit Retrieval (RAG) und Validierung reduziert das deutlich.

KI in Ihrem Unternehmen einsetzen

Was ist ein LLM (großes Sprachmodell)?

Wie ein LLM funktioniert

Tokens & Kontextfenster

Grenzen & Halluzinationen

Wo LLMs eingesetzt werden

Fazit

Häufige Fragen

Mehr aus dem Wiki-Lexikon

Was ist ein KI-Agent?

Was ist RAG (Retrieval-augmentierte Generierung)?

Was ist Prompt Engineering?

Was ist eine Vektordatenbank (und Embeddings)?