Что такое LLM?
Предсказание следующего токена простым языком — и чем LLM не является.
Токены, контекст и память
Как модели читают и запоминают текст, и почему длинные чаты дрейфуют.
Роли System, User и Assistant
Анатомия разговора и почему системный промпт — ваш лучший рычаг.
Управление сэмплированием: температура и компания
Температура, top-p и стоп-последовательности — когда работать горячо, а когда холодно.
Галлюцинации и как их уменьшить
Почему модели выдумывают, зоны высокого риска и конкретный набор инструментов для проверки.
Эмбеддинги и векторный поиск
Смысл как вектор, и как работает семантический поиск.
Генерация с дополнением извлечением (RAG)
Заставьте любую модель отвечать по вашим данным — и режимы сбоев, которых стоит избегать.
Дообучение против промптинга против RAG
Фреймворк принятия решений, в котором люди ошибаются, с правилом «пробуй в этом порядке».
Оценка качества ИИ (Evals)
Соберите эталонный набор, выберите метрики и ловите регрессии раньше пользователей.
Приватность и обработка данных
Что безопасно вставлять, обучение на ваших данных и когда запускать локально.
Компромиссы стоимости и задержки
Треугольник стоимость/качество/скорость, уровни моделей, кэширование и пакетная обработка.
Выбор модели и провайдера
Нейтральный к вендорам способ выбрать модель — и читать бенчмарки скептически.
Claude против ChatGPT, Gemini и Copilot
Честный, не устаревающий способ сравнить основные ассистенты под ваши задачи.
Генерация медиа с помощью ИИ (изображения, аудио, видео)
Где находит применение генерация изображений/аудио/видео — и где Claude это делает, а где нет.