cmod.ify
[AI Tool] Claude Code #2 - 토큰, 왜 이렇게 빨리 닳을까? (실전 기준으로 토큰 절약하기) 본문
"왜 Claude 쓰면 토큰이 이렇게 빨리 닳지?"
같은 작업인데도
누군가는 10번 쓰고 끝내고,
누군가는 3번 만에 끝냅니다.
차이는 '토큰'이 아니라
AI를 쓰는 방식입니다.
1. 내가 토큰을 얼마나 쓰고 있는지 확인하기
먼저 현재 사용량부터 파악해야 합니다.
웹에서 확인하는 법

Claude Code에서 확인하는 법
세선 안에서 /usage를 치면 됩니다.

2. 토큰이 뭔가요?
AI가 텍스트를 처리하는 최소 단위입니다.
한글 1글자 ≈ 2~3 tokens
영어 단어 1개 ≈ 1 token
그래서 같은 내용을 한글로 쓰면 영어보다 토큰을 2~3배 더 씁니다.
💡 그렇다고 영어로 써야 한다는 뜻은 아닙니다. 이건 뒤에서 자세히 다룰게요.
토큰이 많이 쌓이면 어떻게 될까요? → 컨텍스트가 터집니다.
3. 토큰 문제 vs 컨텍스트 문제 (이 둘은 다릅니다)
많은 분들이 이걸 헷갈려하는데, 사실 완전히 다른 문제입니다.
토큰 = 비용 문제 → 돈이 얼마나 드는가
컨텍스트 = 성능 문제 → Claude가 얼마나 기억하는가
컨텍스트 윈도우란 Claude가 한 번에 기억할 수 있는 공간입니다 (200k tokens).
대화가 길어질수록 이 공간이 채워지고, 꽉 차면 앞 내용부터 잊어버리기 시작합니다. 그래서 중간에 /compact로 압축해줘야 합니다.
/context로 확인 가능합니다

읽는 법
System prompt: 6.3k ← Claude Code 기본 지침 (고정값, 매 요청마다 포함됨)
System tools: 19.3k ← 파일 읽기/쓰기 도구 설명 (고정값)
MCP tools: 31.3k ← 연결된 MCP 서버 설명 (연결할수록 증가)
Messages: 99.4k ← 내가 주고받은 대화 전부 (누적됨)
Free space: 10k ← 남은 공간
여기서 포인트는 Messages 항목.
System 영역은 사실 어쩔 수 없는 고정 비용입니다. 근데 Messages는 대화할수록 계속 쌓입니다. 즉 세션이 길어질수록 같은 질문 하나에 드는 토큰이 점점 커집니다.
/compact Focus on CSS 분리 작업
깃허브에서도 한 이슈를 마치면 close 하듯이, 클로드도 한 이슈가 지나면 압축해줍시다.
안 하면 세션이 강제 종료되거나, Claude가 앞에서 한 작업을 까먹는 상황이 발생합니다.
4. 요금제별 체감 (수치보다 경험 기준)
공식 수치보다 실제 작업 기준으로 보는 게 더 와닿습니다.
| 작업 | 대략적인 토큰 소모 |
|---|---|
| CSS 인라인 분리 (파일 3~4개) | 약 15k~25k |
| GitHub PR 생성 + 설명 작성 | 약 10k~20k |
| 버그 디버깅 (로그 분석 포함) | 약 30k~50k |
CLAUDE.md 작성 (/init) |
약 5k~10k |
Pro 기준으로 하루 종일 개발 작업하면 체감상 오후쯤 속도 제한이 걸리기 시작합니다. 특히 MCP 연결하면 System 영역만 30k 이상이라 기본 소모가 꽤 큽니다.
하루 작업량이 많다면 Max 요금제가 유리합니다.
Pro는 가볍게 쓸 때, Max는 하루 종일 붙잡고 개발할 때 기준으로 보면 됩니다.
하루 2~3시간 가볍게 쓰면 Pro
하루 종일 개발하면 Max
(개인적 의견입니다)
간단한 이슈 생성 및 add, commit 은 ! 를 작성해서 스스로 작성하여 토큰을 아껴봅시다

5. 토큰보다 중요한 건 결과 타입이다
이게 이 글에서 가장 하고 싶은 말입니다.
토큰을 아끼는 사람 vs 잘 쓰는 사람의 차이
❌ 프롬프트를 잘 쓰는 사람
✅ 결과를 설계하는 사람
영어가 토큰 효율이 좋다는 건 사실입니다. 근데 그게 전부가 아닙니다.
내가 어색한 영어로 의도를 전달하다 생기는 오차 가 토큰 낭비보다 훨씬 큰 비용입니다. 수정 요청, 재질문, 맥락 재설명… 이게 다 토큰이거든요.
그래서 저는 이렇게 생각합니다.
자연어(언어)가 중요한 게 아니라, 결과 타입 정의가 중요하다.
예시 1 - draw.io 다이어그램
Claude한테 "다이어그램 그려줘" 하면 어색한 SVG가 나옵니다.
근데 "이 구조를 draw.io XML 포맷으로 출력해줘" 하면?
→ XML 그대로 복사해서 draw.io에 import하면 깔끔한 다이어그램 완성입니다.

예시 2 - PPT
Claude한테 직접 PPT 만들어달라고 하는 것보다,
"이 내용으로 Genspark용 프롬프트 정의해줘" 하고
→ 그 프롬프트를 Genspark에 붙여넣으면 훨씬 퀄리티 좋은 PPT가 나옵니다.

핵심은 이겁니다.
Claude를 최종 결과물 생성기로 쓰지 말고, 원하는 결과에 맞는 형태로 출력하는 변환기로 쓰는 거임.
그러면 언어가 영어든 한국어든 크게 상관없습니다. 내가 정확하게 의도를 전달할 수 있는 언어로 쓰는 게 결국 더 효율적입니다.
6. 토큰 낭비하는 사람 특징
공감되는 항목이 있다면 고쳐야 할 습관입니다.
- 한 세션에서 모든 작업을 다 하려 함
- 자연어로만 설명하고 결과 형식을 정의 안 함
- /compact 없이 세션을 계속 이어감
- MCP 다 연결해두고 안 씀 (System 토큰만 잡아먹음)
- haiku로 충분한 작업에 sonnet/opus 씀
현재(2026년 3월) 기준 가격은 이렇습니다. MetaCTO
| 모델 | input | output |
| Haiku 4.5 | $1 | $5 |
| Sonnet 4.6 | $3 | $15 |
| Opus 4.6 | $5 | $25 |
그래서 배수 계산하면:
- Haiku vs Sonnet : 3배 차이
- Sonnet vs Opus : 약 1.7배 차이
- Haiku vs Opus : 5배 차이
해당 수치는 API 호출 기준이며 Pro 및 Max 구독에 대한 정확한 토큰은 공개되지 않았습니다.
7. 실전 토큰 절약 팁
단순 팁보다 왜 해야 하는지 까지 설명합니다.
| 방법 | 이유 |
|---|---|
/compact 80%마다 실행 |
컨텍스트 유지 + 성능 저하 방지 |
| 작업 단위로 세션 분리 | 맥락 오염 방지. 관계없는 대화가 섞이면 Claude가 혼선을 겪음 |
| haiku로 단순 작업 처리 | CSS 분리, 파일 이동 같은 작업은 haiku로 충분. sonnet 대비 비용 차이 큼 |
!git 명령어 직접 실행 |
! 붙이면 셸 명령어 직접 실행. 토큰 0 소모 |
| CLAUDE.md 잘 써두기 | 매 세션마다 프로젝트 설명 안 해도 됨. 반복 설명 = 토큰 낭비 |
| 필요한 MCP만 연결 | MCP 하나당 System 토큰 수천~수만 추가됨. 안 쓰는 건 끊어두는 게 이득 |
| 결과 타입 명시하기 | "JSON으로 출력해줘", "draw.io XML로 줘" → 재질문 없이 한 번에 끝남 |
정리
토큰을 아끼는 건 결국 AI를 어떻게 쓰느냐의 문제입니다.
언어보다 의도 전달이 중요하고
프롬프트보다 결과 타입 정의가 중요하고
많이 쓰는 것보다 잘 쓰는 게 중요합니다.
다음 글에서는 실제 아키텍쳐 다이어그램을 표현하는 방법을 좀 더 깊게 다뤄볼 예정입니다.
참고: Claude Code 공식 문서 https://code.claude.com/docs
'AI' 카테고리의 다른 글
| [AI Tool] Claude Code #1 - Claude CLI로 코딩하기 (설치부터 GitHub MCP 연동까지) (0) | 2026.03.27 |
|---|