클로드 코드 토큰이 뭔가요?

토큰은 AI가 글자를 세는 단위입니다. 클로드 코드는 토큰으로 사용량을 매기기 때문에, 대화할수록 토큰이 소모되고 한도를 넘으면 리밋이 걸립니다. 한국어는 한 글자당 보통 1~2토큰 정도입니다.

클로드 코드 사용량은 어디서 확인하나요?

클로드 코드에서 `/context`를 입력하면 지금 이 대화 창의 토큰 구성이 뜨고, `/usage`를 입력하면 최근 24시간~1주일 누적 사용 패턴과 "무엇이 한도를 잡아먹고 있는지" 진단까지 볼 수 있습니다. `/usage`는 긴 컨텍스트·서브에이전트 남용·Opus 과사용 같은 원인을 구체적으로 짚어줍니다.

클로드 코드 리밋이 걸리면 어떻게 하나요?

두 가지 방법이 있습니다. 첫째, 세션 시작 시점 기준 5시간이 지나면 한도가 리셋됩니다. 둘째, `/extra-usage`로 구독 플랜에 부가 사용량을 충전해서 바로 이어갈 수 있습니다. 자주 걸린다면 `/compact`와 `/clear`로 대화를 정리하는 습관을 먼저 들이세요.

클로드 요금제는 어떤 것이 있나요?

Pro($20/월, 기본), Max 5x($100/월, 5배 한도), Max 20x($200/월, 20배 한도) 세 가지입니다. 한도는 세션 시작 후 5시간 윈도우와 주간 한도 두 축에서 함께 관리됩니다.

클로드 코드 토큰을 아끼는 가장 좋은 방법은?

작업이 바뀔 때마다 `/clear`로 새 세션을 시작하고, 긴 대화 중에는 `/compact`로 요약·압축하는 것이 가장 효과적입니다. 간단한 작업에는 Opus 대신 Sonnet·Haiku로 바꾸고, 안 쓰는 MCP 도구는 정리하세요.

/usage와 /context는 뭐가 다른가요?

`/context`는 "지금 이 대화 창의 토큰 구성"을 보여주는 속도계이고, `/usage`는 "최근 며칠간 내가 어떤 패턴으로 썼는지"를 보여주는 연비 리포트입니다. 리밋이 자주 걸린다면 `/usage`의 사용 패턴 진단 섹션부터 먼저 확인해야 원인을 찾을 수 있습니다.

클로드 코드, 왜 이렇게 빨리 리밋 걸리죠? — 토큰 사용량 확인하고 아끼는 법

AI 한입

검색어를 입력하세요

오늘도 AI 한입 하세요 🍊

새 아티클이 발행되면 이메일로 알려드릴게요.

클로드 코드, 왜 이렇게 빨리 리밋 걸리죠? — 토큰 사용량 확인하고 아끼는 법 | AI한입

클로드 코드(Claude Code)를 쓰다 보면 어느 순간 갑자기 "사용량 한도에 도달했습니다"라는 메시지가 뜹니다. 분명 몇 마디 안 했는데, 도대체 뭘 그렇게 많이 쓴 걸까요?

리밋이 걸려서 당황한 클로드 코드 사용자

이 글에서는 클로드 코드의 토큰이 뭔지, 왜 생각보다 빨리 소진되는지, 그리고 어떻게 하면 아낄 수 있는지를 정리합니다. 같은 클로드 요금제(월 20달러)인데 어떤 사람은 하루 만에 리밋이 걸리고, 어떤 사람은 일주일을 거뜬히 쓰는 차이가 여기에 있습니다.

클로드 코드 토큰은 데이터 요금과 같습니다 — 대화할수록 소모됩니다

토큰이 뭔가요

클로드가 읽고 쓰는 모든 글자에 붙는 가격표입니다

한글 글자가 토큰으로 변환되는 과정

같은 뜻이라도 언어에 따라 토큰 수가 다릅니다.

한글 자모와 영어 알파벳이 토큰으로 변환되는 방식

토큰(Token)은 AI가 글자를 세는 단위입니다. 사람은 글자를 "한 글자, 두 글자"로 세지만, AI는 "한 토큰, 두 토큰"으로 셉니다. 한국어 기준으로 한 글자가 대부분 1에서 2토큰 정도이고, 드물게 3토큰까지 올라가는 글자도 있습니다. 참고로 클로드는 GPT와는 다른 방식으로 글자를 토큰으로 쪼개기 때문에, ChatGPT에서 본 숫자와 정확히 일치하지 않을 수 있습니다.

왜 이게 중요할까요? 클로드 코드는 토큰으로 사용량을 매기기 때문입니다. 휴대폰 데이터 요금제를 생각하면 쉽습니다. 유튜브를 보면 데이터가 쭉쭉 빠지듯이, 클로드 코드로 대화하면 토큰이 쭉쭉 빠집니다. 토큰을 다 쓰면 리밋이 걸려서 일정 시간 동안 사용할 수 없게 됩니다.

내가 보는 건 2글자, AI가 쓰는 건 수천 토큰

문제는, 눈에 보이는 것보다 훨씬 많은 토큰이 소모된다는 점입니다. 내가 "안녕"이라고 두 글자를 입력해도, 클로드는 뒤에서 수천 토큰을 사용하고 있습니다. 왜 그런지는 잠시 후에 설명하겠습니다.

클로드 코드 사용량, 어디서 확인하나요

리밋이 걸리기 전에 클로드 사용량 확인부터 해봅시다

/context — 내 토큰이 얼마나 남았는지 확인하기

클로드 코드에서 /context를 입력하면, 지금 토큰을 얼마나 쓰고 있는지 카테고리별로 볼 수 있습니다.

실제 /context 명령어 실행 화면 — 카테고리별 토큰 사용량이 표시됩니다

여기서 주목할 항목은 Messages입니다. 이 숫자가 크다면 대화가 너무 길어졌다는 신호입니다. Free space가 바닥나면 클로드가 자동으로 오래된 대화를 정리합니다.

각 항목을 쉽게 설명하면:

System prompt, System tools: 클로드가 작동하기 위해 기본으로 차지하는 공간입니다. 줄일 수 없습니다.
Messages: 내가 대화하면서 쌓이는 공간입니다. 이게 가장 빠르게 늘어납니다.
Free space: 아직 쓸 수 있는 여유 공간입니다.
Autocompact buffer: 자동 정리를 위해 예약된 공간입니다.

Messages가 비정상적으로 큰 비율을 차지하고 있다면, 토큰이 빨리 소진되는 원인을 찾은 겁니다.

/usage — 내 사용 패턴까지 진단하는 새 기능

/context가 "지금 이 순간의 토큰 상태"를 보여준다면, 최근 업데이트된 /usage 명령어는 "최근 며칠 동안 내가 어떤 패턴으로 토큰을 썼는지" 를 분석해서 보여줍니다. 리밋이 자주 걸리는 분이라면 이 명령어를 가장 먼저 확인해야 합니다.

터미널에서 /usage를 입력하면 크게 세 가지 정보가 위에서 아래로 차례로 뜹니다. 아래에서 1, 2, 3 순서대로 하나씩 풀어보겠습니다.

실제 /usage 명령어 출력 — 현재 세션, 주간 사용량, 사용 패턴 진단

1. 지금 이 세션에서 얼마나 썼나요 (Current session)

"세션"이라는 말이 낯설 수 있습니다. 클로드 코드에서 세션이란 대화를 처음 시작한 순간부터 5시간 동안을 한 덩어리로 묶은 단위입니다. 휴대폰 데이터로 치면 "오늘 낮부터 지금까지 쓴 양"과 비슷합니다.

/usage의 첫 줄은 이 5시간짜리 한 덩어리에서 지금까지 몇 퍼센트나 썼는지를 색깔 막대로 보여줍니다. 80%를 넘었다면 곧 리밋에 걸린다는 신호입니다. 그리고 막대 옆에 "언제 리셋되는지"도 같이 뜹니다. 리셋 시각은 대화를 처음 시작한 시각에서 정확히 5시간 뒤입니다. "리밋이 걸린 시점부터 다시 5시간"이 아니라는 점을 잘못 알고 계신 분이 많습니다.

2. 이번 주에 얼마나 썼나요 (Current week)

두 번째로 뜨는 건 최근 7일 동안 누적 사용량입니다. 여기서 한 가지 특이한 점이 있는데, 주간 사용량은 두 줄로 따로 표시됩니다.

첫 번째 줄 (all models) — 어떤 AI 모델을 썼든 다 합쳐서 계산한 양입니다
두 번째 줄 (Sonnet only) — 이 중에서 Sonnet이라는 AI 모델만 따로 센 양입니다

왜 이렇게 두 개가 따로 뜨느냐면, Anthropic이 주간 한도를 두 가지 기준으로 동시에 관리하기 때문입니다. 둘 중 어느 쪽이든 먼저 100%가 되면 리밋에 걸립니다. 예를 들어 더 똑똑한 Opus 모델만 계속 쓰는 분은 "Sonnet only"는 0%인데 "all models"가 먼저 꽉 차서 막히는 경우가 흔합니다.

Opus, Sonnet이 처음 들으시는 분이라면 이 둘은 클로드가 제공하는 AI 모델 이름입니다. 한 글 안에서 상황에 맞게 바꿔 쓸 수 있는데, 뒤에 나오는 "팁 5: 상황에 맞게 모델 바꿔 쓰기" 섹션에서 자세히 설명합니다. 지금은 "AI 모델이 여러 개 있고, 그중 Sonnet만 따로 세는 줄이 하나 있다" 정도만 알고 가셔도 충분합니다.

여기까지가 "지금까지 얼마나 썼는지"를 알려주는 정보입니다. 진짜 핵심은 바로 아래, 세 번째 섹션입니다.

3. 내 습관 중 뭐가 문제인가요 (What's contributing)

/usage의 세 번째이자 가장 유용한 부분은 화면 아래쪽에 새로 추가된 사용 패턴 진단 섹션입니다. 앞의 두 줄이 "얼마나 썼다"를 알려준다면, 여기는 "내 어떤 습관이 그 한도를 빨리 차게 하고 있는지" 원인을 구체적으로 짚어줍니다.

실제 /usage 진단 섹션 — 92%가 150k 이상 긴 컨텍스트, 84%가 서브에이전트 헤비 세션

제 계정으로 직접 찍어본 결과는 이랬습니다.

진단 항목	제 수치	의미
긴 컨텍스트(>150k)에서 쓴 비율	92%	대화를 한 번 시작하면 아주 길게 이어가는 편
서브에이전트 많이 쓴 세션 비율	84%	한 번에 여러 AI 조수를 동시에 부리는 작업이 많음

이 두 가지가 제 토큰을 가장 많이 잡아먹는 주범이라는 뜻입니다. 클로드 코드가 제 최근 사용 기록을 분석해서 "이런 습관 때문에 한도가 빨리 차고 있어요"라고 콕 짚어준 겁니다.

왜 이 진단이 중요한지 비유를 하나 들어보겠습니다. 매달 통신 데이터를 너무 빨리 써서 속도가 느려지는 사람이 있다고 해보겠습니다. 통신사 앱에 들어갔는데 단순히 "이번 달 20GB 중 18GB 사용"이라고만 뜨면 어떤 습관을 고쳐야 할지 모릅니다. 반면 "유튜브에서 15GB, 넷플릭스에서 3GB 썼습니다"라고 뜨면 "아, 출퇴근할 때는 유튜브를 와이파이 연결된 곳에서만 봐야겠네"라고 바로 판단할 수 있습니다. /usage의 진단 섹션이 정확히 이 역할을 해줍니다.

단순 수치 vs 원인 진단 — 데이터 요금 비유로 보는 /usage 진단의 가치

진단 결과별 대응법

진단 화면에 자주 뜨는 문구와, 그에 맞는 대응을 정리하면 이렇습니다.

진단 문구	뜻	대응
`N% of your usage was at >150k context`	대화를 너무 길게 이어감	작업 바뀔 때마다 `/clear`, 중간중간 `/compact`
`N% came from subagent-heavy sessions`	서브에이전트(조수 여러 명) 남용	정말 필요할 때만 쓰기 — 아래 설명
Opus 모델 사용 비중이 크다는 표시	비싼 모델을 기본값처럼 사용	`/model`로 Sonnet·Haiku 전환

"서브에이전트(subagent)"가 뭐냐면, 클로드 코드에서 메인 AI 한 명이 혼자 답하는 게 아니라 "이건 A 조수한테, 이건 B 조수한테 맡겨봐"라고 작은 AI들을 동시에 여러 명 띄워서 일을 나누는 기능입니다. 속도는 빨라지지만, 조수 한 명 한 명이 각자 독립적으로 대화와 파일을 읽기 때문에 토큰 소비가 곱으로 늘어납니다. 메인에서 한 번에 답할 수 있는 일을 굳이 여러 조수로 쪼개면, 같은 결과를 내면서 비용이 몇 배로 뛰는 경우가 흔합니다.

그래서 /usage에서 "서브에이전트 헤비" 진단이 나왔다면, 평소 작업 습관에서 조수를 기본값처럼 부르고 있지 않은지 점검하는 게 좋습니다. 혼자 차근차근 시켜도 되는 일인데 반사적으로 "팀으로 처리해줘", "여러 명한테 동시에 맡겨줘"라고 말하고 있지는 않은지, 반대로 진짜 병렬이 필요한 순간에만 쓰고 있는지를 보시면 됩니다.

세션 한도와 주간 한도, 뭐가 다른가요

/usage의 막대 그래프가 두 개인 이유가 여기 있습니다. 클로드 코드의 사용량 한도는 세션 한도와 주간 한도 두 축에서 동시에 관리됩니다. 두 축은 독립적으로 작동하기 때문에, 둘 중 하나만 차도 리밋에 걸립니다.

세션 한도와 주간 한도 비교 — 5시간 창 vs 7일 롤링, 독립적으로 작동

세션 한도(5시간 창) 는 "짧은 시간에 집중적으로 너무 많이 쓰는 것"을 막습니다. 세션 첫 메시지를 보낸 시각부터 정확히 5시간 뒤 자동 리셋됩니다. 예를 들어 오전 10시에 첫 메시지를 보냈다면, 오후 3시에 그 세션의 한도가 리셋됩니다. "리밋이 걸린 시점 + 5시간"이 아니라 "첫 메시지 시점 + 5시간"이라는 점이 핵심입니다. 리밋이 걸렸다고 해서 그때부터 5시간이 아닙니다.

주간 한도(7일 롤링) 는 "일주일 전체에 너무 많이 쓰는 것"을 막습니다. 최근 7일간의 누적 사용량을 기준으로 하며, 7일이 지난 이전 사용량은 차츰차츰 빠집니다(롤링 방식). 캘린더 주(월~일)가 아니라 지금 시점에서 뒤로 7일을 세는 방식이라고 보면 됩니다.

두 한도의 관계 때문에 독자들이 자주 혼동하는 지점이 있습니다.

세션 한도만 생각하다가 주간 한도를 잊는 경우: "5시간만 기다리면 되겠지" 하고 기다렸는데 리셋이 안 됨. 실제로는 주간 한도까지 차서 그 주가 끝날 때까지 막히는 상황입니다.
주간 한도만 생각하는 경우: "이번 주에 많이 안 썼는데 왜 막히지?" — 한 세션 안에 집중적으로 썼다면 세션 한도가 먼저 걸립니다.

그래서 /usage에서 두 축의 막대 그래프를 함께 봐야 지금 무엇 때문에 걸렸는지, 언제 풀리는지 정확히 알 수 있습니다.

요금제별 한도 수치는요 구체적인 시간 수치(Pro는 몇 시간, Max 5x는 몇 시간...)는 공식 문서에서 공개되지 않습니다. 대신 Pro 대비 상대적 배수로 표시됩니다. 뒤의 "요금제별 비교" 섹션에서 다룹니다.

/context와 /usage, 언제 뭘 쓰나요

둘을 혼동하기 쉬워서 한 번 정리해두면 편합니다.

명령어	확인 범위	이럴 때 씁니다
`/context`	지금 이 대화 창의 토큰 구성	대화 중간에 "내 창이 얼마나 찼지?" 궁금할 때
`/usage`	최근 24시간~1주일 누적 사용 패턴	"왜 요즘 자꾸 리밋이 걸리지?" 원인 찾을 때

쉽게 말해 /context는 속도계이고, /usage는 연비 리포트입니다. 운전 중에 지금 몇 km/h로 달리는지 궁금하면 속도계를 보고, "이번 주 기름값이 왜 이렇게 많이 나왔지?"를 알고 싶으면 연비 리포트를 엽니다. 둘을 함께 쓰면 "지금 당장 이 대화가 무거운가"와 "내 습관 자체가 비싼가"를 모두 파악할 수 있습니다.

상태 표시줄에 토큰 사용률 띄우기 (세팅 필요)

/context를 매번 입력하는 게 번거롭다면, 클로드 코드 화면 맨 아래 상태 표시줄에 토큰 사용률을 상시 표시해두는 방법이 있습니다. 다만 기본 클로드 코드에는 이 기능이 켜져 있지 않습니다. 직접 한 번 설정해야 그 다음부터 자동으로 뜹니다.

클로드 코드 상태 표시줄 예시 — 터미널 하단에 모델명과 사용률이 상시 표시됩니다

가장 쉬운 방법은 /statusline 명령어입니다. 이 명령어 뒤에 평소 말하듯이 "이런 걸 보여줘"라고 써주면, 클로드가 설정 파일과 스크립트를 알아서 만들어줍니다.

> /statusline 모델명이랑 컨텍스트 사용률을 프로그레스 바로 표시해줘

이렇게 입력하면 ~/.claude/ 폴더에 스크립트 파일이 생기고, ~/.claude/settings.json에 statusLine 항목이 자동으로 추가됩니다. 다음 세션부터 터미널 하단에 "모델명 · 사용률 % · 진행률 막대"가 상시 뜨게 됩니다.

수동으로 설정하고 싶다면 ~/.claude/settings.json 파일을 열고 아래 설정을 추가하면 됩니다.

{
  "statusLine": {
    "type": "command",
    "command": "jq -r '\"[\\(.model.display_name)] \\(.context_window.used_percentage // 0)% context\"'"
  }
}

이제 매번 /context를 입력하지 않아도 현재 사용률이 화면 맨 아래에 실시간으로 뜹니다. 사용률이 올라가는 게 눈에 보이면 미리미리 /compact를 쓸지, 새 세션을 시작할지 판단하기 훨씬 쉬워집니다.

토큰이 빨리 소진되는 5가지 원인

"나는 몇 마디 안 했는데?" — 보이지 않는 곳에서 토큰이 새고 있습니다

여기가 이 글의 핵심입니다. 같은 요금제인데 사람마다 리밋에 걸리는 속도가 다른 이유, 그 원인 다섯 가지를 짚어보겠습니다.

1. 대화가 길어지면 토큰이 눈덩이처럼 불어납니다

클로드 코드는 대화할 때마다 이전 대화 내용 전체를 다시 읽습니다. 카카오톡이라면 "새 메시지 1건"만 읽으면 되지만, 클로드는 매번 "처음부터 전부" 다시 읽는 셈입니다.

턴이 쌓일수록 이전 대화 다시 읽기가 누적되어 토큰이 폭증하는 구조

실제로 /context를 찍어보면 이 차이가 바로 보입니다.

시점	Messages 토큰	전체 대비 %
새 세션 직후	0	0%
질문 1개 후	약 2,000	0.2%
질문 10개 후	약 30,000	3%
질문 20개 후	80,000 이상	8%+

처음에는 2,000토큰이던 것이, 대화를 이어갈수록 3만, 5만, 8만 토큰으로 불어납니다. 이게 리밋이 빨리 걸리는 가장 흔한 원인입니다. 한 대화에서 오래 작업하면 할수록, 토큰 소모 속도가 점점 빨라집니다.

2. MCP 도구를 많이 연결하면 기본 소모량이 커집니다

MCP는 클로드 코드에 외부 기능을 연결하는 방식입니다. 피그마, 슬랙, 구글 캘린더 같은 서비스의 기능을 클로드가 "도구"처럼 쓸 수 있게 해줍니다.

여기서 "도구" 란 클로드가 직접 호출해서 뭔가를 시킬 수 있는 작은 기능 단위 하나입니다. 예를 들어 피그마 MCP를 연결하면 클로드가 "피그마 파일 가져오기", "디자인 스크린샷 뽑기", "디자인 정보 읽기" 같은 일을 할 수 있게 됩니다. 이런 "할 수 있는 일" 하나하나가 도구입니다.

피그마 MCP 서버에는 "피그마 파일 가져오기", "디자인 스크린샷 뽑기", "디자인 정보 읽기" 같은 도구들이 묶여 있습니다

조금 더 풀어서 말하면, 각 도구는 클로드가 해당 서비스에 요청을 보낼 수 있는 "작은 창구" 하나입니다. 클로드가 "디자인 스크린샷 뽑기" 도구를 호출하면, 뒤에서 피그마로 실제 요청이 날아가고 이미지가 돌아옵니다. 클로드가 "지금 어떤 창구를 쓸 수 있는지" 알려면 각 도구의 이름과 용도가 적힌 설명을 읽어야 하는데, 이 설명이 곧 뒤에 이야기할 "도구 목록"입니다. 연결된 MCP 서버가 많을수록 이 창구 수가 늘어나고, 그만큼 "도구 목록" 덩어리도 두꺼워집니다.

문제는, 이 도구들을 연결만 해놓아도 매 대화마다 토큰이 쌓인다는 점입니다. 왜 그럴까요? 클로드는 질문을 받을 때마다 "지금 내가 쓸 수 있는 도구 목록이 뭐가 있는지"를 매번 처음부터 다시 전달받습니다. 기억해두고 "어제 봤잖아"라고 넘길 수가 없어요. 그래서 MCP 서버 4개를 연결해두면 도구 설명 20개 이상이 매 질문마다 통째로 클로드에게 전송되고, 이 설명이 전부 토큰으로 계산됩니다.

비유하자면, 매일 등굣길에 가방에 교과서 50권을 전부 넣어서 들고 가야 하는 상황과 비슷합니다. 오늘 실제로 쓰는 건 3권뿐인데도 매일 50권 전체를 짊어지고 가야 하는 거죠. 클로드 코드는 질문 한 번 한 번이 사실상 "가방을 새로 싸는 순간"입니다. 연결된 도구가 많을수록 매 질문마다 짊어지는 짐이 무거워지고, 그만큼 느려지고 비싸집니다.

실제로 제가 쓰고 있는 환경에서 /mcp 명령어를 찍어보면 이런 식으로 서버 목록이 나옵니다.

실제 /mcp 명령어 출력 — 11개 서버가 연결된 상태 (연결/실패/비활성 상태 표시)

11개 서버가 연결돼 있다는 건 이 모든 서버가 제공하는 도구 수십 개의 설명이 매 질문마다 함께 전송된다는 뜻입니다. /context를 찍어보면 바로 확인할 수 있습니다.

MCP 연결 개수별 기본 토큰 소모 — 4개 연결 시 대화 전에 이미 수만 토큰

MCP 상태	대화 전 기본 토큰	전체 대비 %
MCP 0개	0	0%
MCP 2개 서버 (도구 10개)	약 8,000	0.8%
MCP 4개 서버 (도구 20개 이상)	30,000에서 60,000	3에서 6%

위 수치는 커뮤니티 사용자들이 /context로 측정해서 보고한 경험치이며, 실제 값은 연결한 서버와 각 도구 설명의 길이에 따라 달라집니다. 한 사용자는 "MCP 서버 4개 연결했더니 대화 시작 전에 67,000토큰이 이미 차 있었다"고 보고하기도 했습니다.

3. 파일을 읽을 때마다 토큰이 소모됩니다

클로드에게 "이 파일 읽어봐"라고 하면, 파일 내용이 통째로 대화 창에 들어옵니다.

파일 크기별 토큰 소모량 — 폴더 전체 분석은 짧은 대화 20~30개와 맞먹습니다

요청	Messages 증가량
"package.json 읽어봐" (50줄)	+약 1,000토큰
"이 파일 분석해줘" (500줄)	+약 5,000토큰
"src 폴더 전체 분석해줘"	+약 30,000에서 50,000토큰

더 문제는, 같은 파일을 여러 번 읽어도 매번 새로 토큰이 소모된다는 점입니다. "아까 읽었잖아"라고 생각할 수 있지만, 클로드 입장에서는 매번 새로 읽는 것이나 다름없습니다.

4. 클로드의 "속 생각"이 예상 외로 깁니다

클로드는 대답하기 전에 속으로 먼저 "생각"을 합니다. 쉽게 말해 시험 문제를 풀 때 답안지에 옮기기 전, 연습장에 이것저것 끄적이는 것과 같은 과정입니다. 이 "속 생각"이 토큰 이야기에서 왜 중요하냐면, 연습장에 끄적인 내용도 전부 토큰으로 과금되기 때문입니다.

크기 차이가 어느 정도냐면, 내가 실제로 화면에서 읽는 답변은 3천 토큰 정도인데 클로드가 속으로 정리한 생각은 그것의 몇 배, 복잡한 질문에서는 만 단위 토큰까지 늘어나기도 합니다. 눈에 안 보이는 곳에서 더 많이 쓰는 셈이죠.

아래 표의 숫자는 사용자들의 실측 경험 기반 체감치입니다. 실제 값은 질문 난이도, 쓰는 모델, 설정된 "사고 강도(effort)"에 따라 크게 달라지니 참고치로만 보시면 됩니다.

질문 복잡도별 사고 토큰 — 아키텍처 질문은 1만 토큰 이상

질문 유형	사고 토큰	체감
"1+1은?" 같은 단순 질문	약 500	거의 안 느낌
"이 코드 리팩토링해줘"	3,000에서 5,000	살짝 느림
"아키텍처 전체 재설계 제안해줘"	10,000 이상	눈에 띄게 느림

간단한 질문에도 깊이 생각하는 경우가 있어서, "별것 아닌 질문이었는데 토큰이 많이 나갔다"면 이것 때문일 가능성이 높습니다.

5. 스크린샷을 보여주면 토큰이 크게 소모됩니다

같은 에러를 전달하는데, 방법에 따라 토큰 차이가 30배 이상 납니다.

전달 방식에 따른 토큰 차이 — 텍스트 50 vs 스크린샷 1,600

방법	Messages 증가량
에러 메시지를 텍스트로 복사해서 붙여넣기	+약 50토큰
에러 화면 스크린샷 1장 붙여넣기	+약 1,600토큰 (표준 해상도 기준)
스크린샷 3장 붙여넣기	+약 5,000토큰

에러 화면을 설명하려고 스크린샷 서너 장을 붙이면 순식간에 수천 토큰이 사라집니다. 같은 정보인데 전달 방법만 바꿔도 토큰을 크게 아낄 수 있습니다.

토큰이 새는 5가지 원인 — 대화 누적, MCP 도구, 파일 읽기, 속 생각, 스크린샷

토큰 아끼는 7가지 실전 팁

같은 작업을 절반의 토큰으로 끝내는 방법

원인을 알았으니 해결법을 봅시다. 바로 적용할 수 있는 것부터 순서대로 정리했습니다.

팁 1: /compact로 대화 정리하기

가장 쉽고 효과 큰 방법입니다. 대화 중에 /compact를 입력하면, 클로드가 지금까지의 대화 내용을 요약본으로 압축해줍니다.

> /compact

예를 들어 5,000토큰짜리 대화 기록이 500토큰짜리 요약으로 줄어들기도 합니다. 압축 효과는 대화 성격에 따라 보통 수배에서 10배 수준으로 편차가 있습니다. 작업 중간중간, 특히 하나의 작업이 끝날 때마다 /compact를 한 번씩 눌러주면 토큰을 크게 아낄 수 있습니다.

/compact 실행 전후 — 5,000 토큰 대화가 500 토큰 요약으로 축소

팁 2: 작업이 바뀌면 새로 시작하기

"회원가입 기능 만들어줘" 작업이 끝나고 "결제 페이지 수정해줘"로 넘어간다면, 이전 대화 내용은 더 이상 필요 없습니다. 이때 /clear를 입력하면 대화 기록이 깨끗하게 지워져서, 새 작업을 0토큰부터 시작할 수 있습니다.

> /clear

또는 Ctrl + C로 나갔다가 다시 claude를 입력해서 새 세션을 시작해도 같은 효과입니다. 대화를 택배 상자에 비유하면, 새 작업을 시작할 때는 이미 가득 찬 상자에 억지로 넣는 것보다 새 상자를 여는 것이 훨씬 효율적입니다.

기존 세션 유지 vs 새 세션 — 누적된 120K 토큰을 0에서 다시 시작

팁 3: 구체적으로 말하기

"이 프로젝트 전체를 분석해줘"라고 하면, 클로드가 모든 파일을 하나씩 열어보면서 수만 토큰을 소모합니다. 반면 "src/login.ts 파일에서 이메일 검증 부분을 수정해줘"라고 구체적으로 말하면, 해당 파일 하나만 읽으므로 토큰이 훨씬 적게 듭니다.

표현	토큰 소모
"이 코드 전체 개선해줘"	많음 (모든 파일 탐색)
"src/auth.ts 32번 줄 에러 고쳐줘"	적음 (파일 하나만 읽기)

파일 이름과 위치를 정확히 알려줄수록 토큰이 절약됩니다.

모호한 요청 vs 구체적 요청 — 50,000 토큰이 2,000 토큰으로

팁 4: 안 쓰는 MCP 도구 정리하기

클로드 코드에서 /mcp를 입력하면 현재 연결된 MCP 도구 목록이 나옵니다. 지금 쓰지 않는 도구가 있다면 비활성화하세요. 연결만 해놓고 안 쓰는 도구는, 매 대화마다 토큰만 잡아먹는 빈 앱과 같습니다.

/mcp 목록 정리 예시 — 안 쓰는 MCP 2개 제거로 33K 토큰 절약

팁 5: 상황에 맞게 모델 바꿔 쓰기

클로드 코드에서는 세 가지 AI 모델을 선택할 수 있습니다.

모델	특징	구독 쿼터 소진 속도	이럴 때 쓰세요
Haiku	빠르고 가벼움	가장 느림	간단한 질문, 파일 검색
Sonnet	균형 잡힘	보통 (기본값)	일반적인 코딩 작업
Opus	가장 똑똑함	훨씬 빠름	복잡한 설계, 어려운 문제만

간단한 질문에 Opus를 쓰는 건, 동네 편의점 갈 때 택시를 타는 것과 같습니다. 대화 중에 /model을 입력하면 모델을 바꿀 수 있으니, 상황에 맞게 전환하면 토큰을 크게 아낄 수 있습니다.

Haiku / Sonnet / Opus 모델 비교 — 구독 쿼터 소진 속도와 똑똑함 2축 비교

팁 6: 스크린샷 대신 텍스트로 설명하기

"이 화면에서 에러가 나요"라고 스크린샷을 붙이면 1,000토큰 이상이 한 번에 소모됩니다. 반면 에러 메시지를 텍스트로 복사해서 붙여넣으면 50토큰 이하로 끝납니다.

# 토큰 많이 드는 방법
[스크린샷 붙여넣기] → 약 1,500토큰

# 토큰 아끼는 방법
"TypeError: Cannot read property 'id' of undefined
에러가 나요" → 약 50토큰

스크린샷은 "화면이 이상하게 보여요" 같은 시각적 문제에만 쓰고, 에러 메시지나 코드는 텍스트로 복사하는 것이 좋습니다.

스크린샷 1,500 토큰 vs 에러 텍스트 50 토큰 — 같은 정보, 30배 차이

팁 7: CLAUDE.md 파일 다이어트

CLAUDE.md는 클로드 코드를 실행할 때마다 자동으로 읽히는 설정 파일입니다. 권한 설정처럼 프로젝트의 규칙을 적어두는 곳인데, 여기에 너무 많은 내용을 적어두면 매 대화마다 그만큼의 토큰이 기본으로 소모됩니다.

CLAUDE.md에는 "프로젝트 기술 스택", "코딩 스타일 규칙" 같은 핵심 정보만 남기고, 길이를 200줄 이내로 유지하는 것이 좋습니다. 자세한 규칙은 별도 파일로 분리해두면, 필요할 때만 불러와서 토큰을 아낄 수 있습니다.

CLAUDE.md 다이어트 — 600줄(8K 토큰) → 150줄(2K 토큰)

토큰 절약 팁 — /compact, 새 세션, 구체적 지시, MCP 정리, 모델 전환

클로드 요금제별 비교 — 얼마를 내면 얼마나 쓸 수 있나요

월 구독료에 따라 사용량 한도가 달라집니다

클로드 코드는 세 가지 클로드 요금제를 제공합니다.

요금제	월 가격	사용량 (Pro 대비)	체감
Pro	$20 (약 2.7만원)	기본	가벼운 작업 하루 1에서 2시간
Max 5x	$100 (약 13.5만원)	5배	업무용으로 하루 종일 사용 가능
Max 20x	$200 (약 27만원)	20배	헤비 유저용, 리밋 걱정 거의 없음

"Pro만으로 충분한가요?"라는 질문을 많이 받습니다. 결론은 쓰는 방식에 따라 다릅니다. 이 글에서 소개한 절약 팁들을 잘 적용하면 Pro로도 충분히 생산적으로 쓸 수 있습니다. 반면 파일을 자주 읽고, MCP를 많이 연결하고, 대화를 길게 이어가는 분이라면 Max 요금제가 더 맞을 수 있습니다.

리밋 걸렸을 때 대처법

기다리거나, 추가 사용량을 사서 이어가거나

실제로 리밋에 걸렸다면 두 가지 선택지가 있습니다.

방법 1 — 기다리기. 대화를 시작한 시점 기준으로 5시간이 지나면 한도가 리셋됩니다. 급하지 않다면 가장 간단한 방법이고, 추가 비용도 없습니다. 기다리는 사이에 /compact로 대화를 정리해두거나 새로운 세션 계획을 짜두면, 리셋 직후 훨씬 효율적으로 작업을 이어갈 수 있습니다.

방법 2 — /extra-usage로 추가 사용량 설정하기. 리밋에 걸린 순간에도 작업을 멈출 수 없는 상황이라면, 클로드 코드에 /extra-usage를 입력해서 구독 플랜에 부가 사용량을 추가할 수 있습니다. 구독 요금 외에 "딱 지금 필요한 만큼만" 미리 충전한 금액에서 차감되는 방식이라 예측 가능하고, 하루 한도도 따로 설정할 수 있습니다.

토큰을 절약하며 여유롭게 작업하는 모습

정리하면

클로드 코드 비용이 부담된다면, 아래 명령어들만 기억하세요.

하고 싶은 것	입력하는 것
토큰 현황 확인	`/context`
대화 압축	`/compact`
대화 초기화	`/clear`
모델 변경	`/model`
MCP 정리	`/mcp`

토큰 관리의 핵심은 단순합니다. 대화를 짧게 유지하고, 필요한 것만 정확히 요청하는 것. 이 두 가지 습관만 들이면 같은 요금제로도 훨씬 오래 쓸 수 있습니다.

지금 바로 클로드 코드를 열고 /context를 한번 입력해 보세요. 내 토큰이 어디에 쓰이고 있는지 확인하는 것이 절약의 첫걸음입니다.

클로드 코드, 왜 이렇게 빨리 리밋 걸리죠? — 토큰 사용량 확인하고 아끼는 법

이 글을 읽기 전에

자주 묻는 질문

Q.클로드 코드 토큰이 뭔가요?

Q.클로드 코드 사용량은 어디서 확인하나요?

Q.클로드 코드 리밋이 걸리면 어떻게 하나요?

Q.클로드 요금제는 어떤 것이 있나요?

Q.클로드 코드 토큰을 아끼는 가장 좋은 방법은?

Q./usage와 /context는 뭐가 다른가요?

댓글

이 글 다음에 읽으면 좋아요

클로드 코드가 요즘 왜 허술해졌을까요? — effort와 ultrathink 실측 가이드

연관 글

터미널이 뭔가요? — Claude Code 쓰려면 꼭 알아야 합니다

옵시디언 MCP 설정 — 클로드 코드가 내 노트를 직접 읽게 하는 법

클로드 코드에게 매번 설명하기 귀찮다면 — CLAUDE.md 설정법

엑셀 자동화, Claude Code에 파일 던지고 말로 시키세요 — 매크로도 파이썬도 몰라도 됩니다

클로드 코드 스킬(Claude Code Skill) 만드는 법 — 반복 업무를 한 단어로 끝내기

Claude Code, 똑같은 프롬프트 매번 치는 게 귀찮다면 — 슬래시 커맨드와 스킬 만드는 법

클로드 코드 이전 대화, 이어서 하는 법

클로드 코드 매번 Yes 묻는 거 끄는 법 — 권한 자동 허용 완벽 설정

Claude Code, 처음 시작할 때 이것만 따라하세요

클로드 코드 스킬·커맨드·에이전트·팀, 언제 뭘 써야 하나 (사용법 정리)

ChatGPT vs Claude, 뭐가 다를까?