본문으로 건너뛰기

LLM이란 무엇인가?

초급

대규모 언어 모델(Large Language Model, LLM) — Claude의 기반 기술 — 은 겉보기에 단순한 한 가지를 합니다: 텍스트를 읽고 다음에 무엇이 올지를 예측합니다, 한 번에 한 덩어리씩. 그게 전부입니다. 나머지 모든 것은 그 일을 놀랍도록 잘함으로써 떠오릅니다.

한 문장짜리 멘탈 모델

LLM은 엄청난 양의 텍스트를 읽고, 언어 — 그리고 그 안에 담긴 생각 — 이 어떻게 이어지는지의 패턴을 학습한, 매우 정교한 자동완성입니다.

질문을 하면 모델은 답을 "찾아보는" 것이 아닙니다. 당신의 텍스트에 가장 그럴듯하게 이어지는 내용을 토큰 단위로 생성하고 있는 것입니다(토큰 및 컨텍스트 참고). 좋은 질문에 그럴듯하게 이어지는 내용은 보통 좋은 답입니다 — 그래서 이게 애초에 작동하는 것입니다.

왜 이것이 그 강점을 설명하는가

글, 코드, 추론 전반의 패턴을 학습했기 때문에, LLM은 쓰기, 요약, 번역, 설명, 코딩을 유려하게 할 수 있습니다 — 이 모두가 "이 텍스트를 합리적으로 이어 가기"이기 때문입니다. 명확한 설정을 주면 강력한 이어짐을 만들어 냅니다. 그래서 프롬프팅이 그렇게 중요한 것입니다: 당신은 모델이 이어 갈 텍스트의 시작을 빚고 있는 셈입니다.

왜 이것이 그 별난 점을 설명하는가

같은 메커니즘이 거친 부분도 설명합니다:

  • 자신 있게 틀릴 수 있습니다. 유려하게 들리는 이어짐이 항상 참인 것은 아닙니다 — 그게 할루시네이션입니다.
  • 당신이 제공하거나 조회할 도구가 없는 한, 오늘의 사실을 진정으로 "알지" 못합니다.
  • 당신이 어떤 형태로든 주지 않는 한, 대화 사이에 메모리가 없습니다.

LLM이 아닌

:::warning 기대치를 조정하면 더 나은 결과를 얻습니다

  • 데이터베이스나 검색 엔진이 아닙니다. 생성할 뿐, 검증된 레코드를 검색하지 않습니다.
  • 계산기가 아닙니다. 수학에 대해 추론할 수는 있지만 정확함이 보장되지 않습니다 — 그건 도구를 주세요.
  • 사람이 아닙니다. 감정도, 의도도, 지속적인 메모리도 없습니다. 강력한 텍스트 엔진입니다. :::

가끔 잘못 기억하는, 똑똑하고 빠르며 박식한 어시스턴트로 다루고 — 중요한 것은 검증하세요.

다음