Was ist ein LLM?
Next-Token-Vorhersage in einfachen Worten — und was ein LLM nicht ist.
Tokens, Kontext & Gedächtnis
Wie Modelle Text lesen und sich merken, und warum lange Chats abdriften.
System-, User- & Assistant-Rollen
Die Anatomie einer Konversation und warum der System-Prompt dein bester Hebel ist.
Sampling-Steuerung: Temperature & Co.
Temperature, top-p und Stop-Sequenzen — wann man heiß und wann man kalt fahren sollte.
Halluzinationen & wie man sie reduziert
Warum Modelle Dinge erfinden, die Hochrisikozonen und ein konkreter Werkzeugkasten zur Verifizierung.
Embeddings & Vektorsuche
Bedeutung als Vektor, und wie semantische Suche funktioniert.
Retrieval-Augmented Generation (RAG)
Bring jedes Modell dazu, über deine Daten Auskunft zu geben — und die Fehlerquellen, die du vermeiden solltest.
Fine-Tuning vs. Prompting vs. RAG
Das Entscheidungsframework, das die meisten falsch machen, mit einer Reihenfolge-Regel.
KI-Qualität bewerten (Evals)
Erstelle ein Golden Set, wähle Metriken und entdecke Regressionen, bevor es die Nutzer tun.
Datenschutz & Datenverarbeitung
Was du gefahrlos einfügen kannst, das Training mit deinen Daten und wann du lokal arbeiten solltest.
Kosten- & Latenz-Abwägungen
Das Dreieck aus Kosten/Qualität/Geschwindigkeit, Modellabstufung, Caching und Batching.
Ein Modell & einen Anbieter auswählen
Eine anbieterneutrale Methode, ein Modell auszuwählen — und Benchmarks skeptisch zu lesen.
Claude vs. ChatGPT, Gemini & Copilot
Eine ehrliche, zeitlose Methode, die großen Assistenten für deine Bedürfnisse zu vergleichen.
KI-Mediengenerierung (Bilder, Audio, Video)
Wo die Generierung von Bildern/Audio/Video hingehört — und wo Claude das kann und wo nicht.