오늘도 AI 한입 하세요 🍊
새 아티클이 발행되면 이메일로 알려드릴게요.
댓글을 남기려면 로그인이 필요합니다.
아직 댓글이 없습니다. 첫 댓글을 남겨보세요!

클로드 코드(Claude Code) 대화를 실수로 닫았을 때 이전 내역을 복구하는 방법을 알려드립니다. 초보자가 알아두면 좋은 터미널 명령어(ls, cd, pwd)도 함께 정리했습니다.
클로드 코드(Claude Code)가 파일 수정할 때마다 Yes를 물어봐서 답답하다면, 권한 자동 허용(bypassPermissions)을 켜면 됩니다. 설정법부터 Shift+Tab 전환, 위험성, plan mode 활용, settings.json 영속화까지 한 글로 끝냅니다.
Claude Code(클로드 코드)를 처음 설치하고 실행하는 방법을 완전 초보 눈높이로 안내합니다. 터미널 여는 법부터 첫 대화, 웹페이지 만들기 실습까지 5분이면 충분합니다.
클로드 코드에서 매번 똑같은 지시를 반복 중이라면, 스킬·커맨드·서브에이전트·에이전트팀 중 뭘 써야 할지 헷갈릴 때가 옵니다. 이 글에서 네 가지 사용법과 선택 기준을 한 번에 정리합니다.
Claude Code와 agent-browser로 웹 링크를 자동 수집하고 분류하는 방법. Pro 요금제에서도 가능한 AI 업무 자동화 실전 가이드.

클로드 코드 사용량을 /context와 /usage 명령어로 진단하고, 토큰이 빨리 소진되는 원인을 분석해 비용을 아끼는 실전 팁까지 정리합니다. 서브에이전트 남용·긴 세션 등 리밋이 걸리는 패턴별 대응법과 요금제 비교 포함.
클로드 코드(Claude Code)에게 매번 '이 프로젝트는 이렇고, 답변은 이렇게...' 반복 설명하고 계신가요? CLAUDE.md 파일 하나면 한 번만 세팅하고 끝입니다. 비개발자도 5분이면 따라할 수 있는 CLAUDE.md 설정법과 실전 템플릿, 웹에서 쓰는 Claude Projects까지 한 번에 정리했습니다.
둘 다 AI인데 어떻게 다를까요? 코딩, 글쓰기, 분석 등 상황별로 어떤 AI를 선택해야 하는지 실전 비교로 정리했습니다.
클로드 코드(Claude Code)에게 매번 같은 커밋·PR·배포 지시를 반복하고 계신가요? 클로드 코드 스킬(Claude Code Skill)을 직접 만들면 /commit, /pr, /deploy 같은 한 단어 명령으로 반복 업무를 끝낼 수 있습니다. 슬래시 커맨드와의 통합, 5분 핸즈온, 자동 호출 트리거, 인자 처리, 실시간 컨텍스트 주입까지 한 번에 정리합니다.
클로드 코드에서 매번 같은 프롬프트를 복붙하고 계신가요? 슬래시 커맨드로 단축키처럼 줄이고, 복잡한 작업은 스킬로 묶어 AI가 알아서 호출하게 만드는 법을 한 번에 정리했습니다.

요즘 클로드 코드를 자주 쓰시는 분들 사이에서 이런 푸념이 조용히 돌고 있습니다.
"요즘 클로드가 좀 이상해요. 존재하지도 않는 커밋 해시를 알려주고, 설치되지도 않은 패키지를 추천해요. 예전엔 이러지 않았던 것 같은데..."
저도 비슷한 경험을 했습니다. 분명 어제까지만 해도 믿고 맡기던 에이전트인데, 어느 순간부터 답변이 짧아지고 단정적이 되고, 가끔 확인해보면 명백히 틀린 사실을 자신 있게 내뱉고 있었습니다. 제 프롬프트가 문제인 줄 알고 이것저것 바꿔봐도 달라지지 않았습니다.

알고 보니 이건 제 탓이 아니었습니다. 2026년 2~3월 사이에 클로드 코드의 기본 설정이 조용히 바뀌었고, 그 여파로 모델이 "알아서 생각 깊이를 줄이는" 상황이 광범위하게 발생하고 있었습니다.
이 글에서는 다음 세 가지를 이야기하겠습니다. 무엇이 바뀌었는지, 제가 직접 같은 질문을 여러 설정으로 돌려본 실측 데이터로 그 차이가 얼마나 큰지, 그리고 지금 당장 답변 품질을 되살리는 구체적인 설정법입니다. 읽고 나시면 상황에 따라 "사고 강도" 설정과 특별 키워드 하나를 자신 있게 골라 쓰실 수 있게 됩니다.
이 글은 이런 분께 개발자가 아니어도 따라올 수 있도록 썼습니다. 클로드 코드에 명령어를 한두 번 쳐본 적이 있고, 답변 품질이 이상해진 걸 느끼고 계시다면 이 글 한 편으로 충분합니다. 복잡한 커맨드라인 지식은 필요 없습니다. 대화창에 슬래시(/)로 시작하는 짧은 명령어를 치는 법만 아시면 됩니다.
클로드 코드가 처음이라면 이 글은 터미널에서
claude를 쳐본 경험이 있는 분 기준입니다. 설치와 첫 대화가 아직이라면 아래 글을 먼저 읽고 오시는 게 좋습니다. 👉 Claude Code, 처음 시작할 때 이것만 따라하세요
모델이 알아서 생각을 줄이는 기능, 문제는 가끔 '0'이 된다는 점

우선 클로드 코드의 "생각"이 어떻게 작동하는지부터 짚어야 합니다.
클로드는 답하기 전에 속으로 먼저 "생각"을 합니다. 사람이 어려운 문제를 받았을 때 머릿속에서 "음, 이건 A 방식으로 풀까, B로 풀까..."를 굴려보는 과정이 있는 것처럼, 클로드도 답을 내놓기 전에 내부적으로 일종의 메모지에 추론 과정을 써봅니다. 이 메모지가 바로 속 생각 토큰(thinking tokens)이고, 클로드 코드에서는 이걸 "확장 사고(Extended Thinking)"라고 부릅니다.
속 생각 토큰이 뭔가요 클로드가 답변을 내기 전에 내부적으로 굴리는 사고 과정입니다. 사용자 눈엔 안 보이지만 토큰(요금 단위)은 실제로 소모되고, 답변의 정확도에 직결됩니다. 더 깊은 원리와 다른 토큰(입력/출력)과의 차이는 토큰 글에서 자세히 다뤘습니다. 👉 클로드 코드, 왜 이렇게 빨리 리밋 걸리죠? — 토큰 사용량 확인하고 아끼는 법
문제는 이 "생각을 얼마나 깊게 할지"를 누가 정하느냐입니다.
2026년 2월 9일까지는 방식이 단순했습니다. 사용자가 /effort high처럼 고정 강도를 정해두면, 클로드는 매 질문마다 무조건 그만큼 생각했습니다. 짧은 질문이든 긴 질문이든 동일한 사고 예산을 받았습니다.
그런데 그날, Anthropic은 조용히 어댑티브 싱킹(Adaptive Thinking)이라는 기능을 기본으로 켰습니다. 한 줄로 요약하면 이렇습니다.
"이제부터 Claude가 질문을 보고, '이건 깊이 생각할 만한 문제인지 아닌지'를 스스로 판단해서 사고 토큰을 할당한다."
이론은 그럴듯합니다. 쉬운 질문에 깊이 생각하면 낭비고, 어려운 질문에만 깊이 파고들면 효율이 좋으니까요. 그런데 현실에서는 두 가지 함정이 생겼습니다.
첫 번째 함정. 2026년 3월 3일, Anthropic은 기본 effort 등급을 high에서 medium으로 조용히 낮췄습니다. 공식 릴리즈 노트에는 강조되지 않았고, 대부분 사용자는 바뀐 줄도 모르고 그대로 썼습니다. 결과적으로 전 세계 클로드 코드 사용자가 한순간에 한 단계 낮은 기본값을 쓰게 된 겁니다.

두 번째 함정. 어댑티브 싱킹이 가끔 사고 토큰을 0으로 할당합니다. "이건 간단한 질문이네"라고 모델이 오판하면 아예 속 생각을 건너뛰고 바로 답을 내버립니다. 이렇게 되면 답이 확신에 차 있지만 근거는 없는 상태가 됩니다. 실제로 AMD의 한 엔지니어가 6,852개 세션을 분석해 본 결과, 2026년 2월 이후 모델의 추론량이 평균 67% 감소했다고 합니다. 클로드 코드 창시자인 Boris Cherny도 해커뉴스에서 "맞다, 이 문제는 실제로 존재한다"고 인정했습니다.

이 두 가지가 겹치면서 나타난 대표적인 증상이 "정확한 형태의 헛소리"입니다. 모양새는 완벽한데 알맹이가 가짜인 답이 이 시기부터 부쩍 늘었습니다.

예시 몇 가지를 구체적으로 옮기면 이런 식입니다.
긴 보고서를 요약해달라고 했더니 원본에는 없던 "3분기 영업이익 12% 증가" 같은 그럴듯한 수치를 끼워 넣어서 돌려줍니다. 숫자 하나가 마치 원문에서 뽑아온 것처럼 자연스럽게 섞여 있기 때문에, 독자가 원본과 대조하지 않으면 눈치채기 어렵습니다.
"이 주제 관련 참고 논문 3편 추천해줘" 했더니 실제로는 존재하지 않는 논문 제목과 저자 이름을 진짜처럼 만들어 냅니다. 저자 이름과 발표 연도, 학술지 이름까지 꽤 그럴듯하게 조합해서 내놓기 때문에 구글에서 찾아보기 전까지는 진짜처럼 보입니다.
엑셀에서 "여러 시트를 한 번에 합치는 함수 이름"을 물었는데, 엑셀에 실제로 없는 함수를 자신 있게 알려줍니다. 문법도 일반 엑셀 함수 규칙에 맞게 예쁘게 써주기 때문에 독자가 그대로 복사해서 시트에 붙여 넣기 전까지는 의심하기 어렵습니다.
세 경우 모두 공통점이 있습니다. "생각을 한 번만 했으면 걸러낼 수 있는 실수"인데, 생각 자체를 건너뛰면서 그대로 나와버린 겁니다. 즉 답변이 허술해진 건 모델이 멍청해져서가 아니라, 머리를 쓰지 않도록 기본 설정이 바뀌었기 때문입니다.
직접 돌린 실측 수치
먼저 간단한 설명부터 드리겠습니다. /effort는 클로드 코드 대화창에서 칠 수 있는 슬래시 명령어입니다. 대화창에서 /effort high처럼 슬래시 뒤에 원하는 등급을 붙여 치면, 그때부터 그 세션의 "기본 사고 강도"가 바뀝니다. 등급은 여섯 가지입니다.
| 등급 | 한 줄 설명 |
|---|---|
low | 사고를 거의 건너뛰고 빠르게 답만 냅니다. |
medium | 비용을 줄이고 싶을 때. 간단한 질문에 적합. |
high | 사고와 비용의 균형. Opus 4.6에서의 기본값. |
xhigh | Opus 4.7 기본값. 대부분의 코딩·에이전트 작업에 권장. (Opus 4.7 전용, 다른 모델은 high로 폴백) |
max | 상한선을 최대로 엽니다. 지나친 사고(overthinking)가 올 수 있어 주의. |
auto | 사용 중인 모델의 기본값으로 리셋. Opus 4.7이면 xhigh, 4.6이면 high. |

대화창에서 /effort까지만 치고 스페이스 한 칸 넣으면, 위 6개 등급이 [low|medium|high|xhigh|max|auto] 형태로 자동완성 힌트에 함께 떠오릅니다. 인자 없이 /effort만 치면 인터랙티브 슬라이더가 열려서 화살표 키로 등급을 고르고 엔터로 확정할 수도 있습니다.

예를 들어 /effort max를 치고 엔터를 누르면, 대화창에 Set effort level to max (this session only): Maximum capability with deepest reasoning 같은 확정 메시지가 한 줄 뜹니다. "(this session only)"이라는 말이 중요합니다. 이 설정은 지금 이 세션 안에서만 적용되고, 터미널을 껐다 켜면 다시 기본값으로 돌아옵니다.

문제는 이 확정 메시지가 대화가 이어지면서 금방 위쪽으로 밀려 올라간다는 점입니다. 나중에 "내가 지금 어떤 등급에 있는지"가 궁금해지면, 대화창에서 인자 없이 /effort만 치고 엔터를 누르시면 됩니다. 그러면 바로 이렇게 돌려줍니다.
> /effort
Current effort level: max (Maximum capability with deepest reasoning)

이 글의 실측에서는 위 여섯 중 네 개(low, medium, high, max)를 비교했습니다. xhigh는 Opus 4.7에서만 사용 가능하고, auto는 단순히 모델 기본값으로 리셋하는 것이므로, 등급 간 차이를 보기 위한 실측에서는 제외했습니다.
"말로만 그렇다"로 넘어가지 않기 위해, 같은 질문 하나를 이 네 등급으로 한 번씩 직접 돌려봤습니다. 질문은 너무 쉽지도 너무 어렵지도 않은 "어떤 개념을 설명해달라"는 중간 난이도의 과제 하나로 고정했습니다.
그리고 매 호출마다 다음 세 가지를 기록했습니다.
각 호출은 완전히 새로운 대화 세션에서 진행해서 이전 대화 내용이 섞이지 않게 했습니다. 속 생각 분량은 어댑티브 싱킹 때문에 매번 달라질 수 있는 값인데, 클로드 코드는 이 "속으로 한 생각"을 필요할 때 눈으로 확인할 수 있는 기능을 제공합니다. 덕분에 추정이 아닌 실측이 가능했습니다.


결과를 표로 정리하면 이렇습니다. 소수점 대신 실측 숫자를 그대로 옮겼습니다.
| effort 등급 | 속 생각 블록 | 속 생각 분량 | 출력 토큰 | 응답 시간 |
|---|---|---|---|---|
low | 0회 | 0자 | 455 | 9.6초 |
medium | 1회 | 86자 | 678 | 12.4초 |
high | 1회 | 159자 | 666 | 13.2초 |
max | 1회 | 181자 | 777 | 13.9초 |
이 표에서 가장 먼저 눈에 띄는 건 첫 번째 줄입니다. /effort low에서는 속 생각이 0회, 즉 한 글자도 생각하지 않고 바로 답변을 뽑았습니다. 앞 섹션에서 말씀드린 "사고 토큰이 0이 되는 순간"이 여기서 그대로 재현된 겁니다. 답변 길이도 455 토큰으로 다른 등급보다 30% 이상 짧았습니다. 그만큼 세부 설명도 빠져 있었습니다.
반대로 max로 올리면 출력 토큰이 777까지 늘어납니다. low 대비 71% 증가입니다. 속 생각 분량도 0자에서 181자로 벌어집니다. 응답 시간은 9.6초에서 13.9초로 44% 증가했지만, 그 대가로 답변이 훨씬 더 풍부해집니다. 쉽게 말해, effort는 "정확도와 속도를 맞바꾸는 슬라이더"인 겁니다.

그런데 흥미로운 예외가 있었습니다. "1+1은?" 같은 아주 사소한 질문은 /effort max로 돌려도 속 생각이 0회였습니다. 출력 토큰은 단 5개, 응답 시간은 3초. 이건 어댑티브 싱킹이 정상 작동한 경우입니다. 모델이 "이건 생각할 거리가 없는 질문"이라고 판단해서 사고를 건너뛴 겁니다.
여기서 중요한 결론이 하나 나옵니다.
/effort max는 "무조건 깊이 생각해라"가 아니라, "필요하면 깊이 생각해도 된다"는 상한선일 뿐입니다. 모델이 필요 없다고 판단하면 max여도 생각을 건너뜁니다.
어댑티브 싱킹을 완전히 우회해서 "진짜로 매번 깊이 생각하게 만들고 싶을 때"는 다른 방법이 필요합니다. 바로 다음에 다루겠습니다.
프롬프트에 단어 하나만 추가하면 effort를 무력화한다
/effort는 세션 전체의 "기본 사고 강도"를 정하는 설정입니다. 반면 클로드 코드에는 이번 한 번의 대화만 강제로 깊이 생각하게 만드는 마법 단어도 있습니다. 바로 ultrathink입니다.
사용법은 놀라울 정도로 단순합니다. 슬래시 명령어도, 설정 파일 수정도 필요 없습니다. 평소처럼 질문을 치는 그 문장 안에 ultrathink라는 단어를 하나 끼워 넣기만 하면 됩니다. 예를 들어 이렇게요.
ultrathink 내년 상반기 우리 팀 예산안을 짜줘. 작년 실적과 이번 신규 프로젝트 2건까지 고려해서.
단어 위치는 앞이든 중간이든 어디든 괜찮습니다. 클로드 코드는 이 단어가 질문 어딘가에 들어 있는 걸 감지하면, 그 한 번의 대화에만 사고 예산을 최대로 열어주는 특수 신호로 해석합니다. 다음 질문부터는 자동으로 원래 설정대로 돌아갑니다. 매번 /effort를 다시 치지 않아도 되는 셈입니다.

실제 화면에서도 이 점이 눈에 보이게 표시됩니다. 클로드 코드는 여러분이 질문에 ultrathink를 쳐 넣는 순간 그 단어만 다른 색으로 하이라이트해줍니다. "이 단어를 인식했고 확장 사고가 켜졌어요"라는 시각적 신호입니다. Boris Cherny도 Threads 게시글에서 이 동작을 공식 확인해줬고, 원하지 않을 때는 /t를 쳐서 하이라이트 감지를 끌 수 있다고 했습니다.
또 하나 확인할 수 있는 곳이 있습니다. 클로드 코드의 로고 옆 상태 표시입니다. 답변이 진행되는 동안 화면 위쪽에 "with high effort", "with xhigh effort" 같은 텍스트가 표시됩니다. 이게 현재 이 턴에 실제로 적용되고 있는 effort 레벨입니다. ultrathink를 썼는데 여기에 "with high effort"가 뜨면 제대로 작동한 거고, 만약 세션을 /effort xhigh로 설정했는데도 "with high effort"라고 나온다면 뒤에서 다룰 다운그레이드 버그에 걸린 상황입니다.

"에이, 단어 하나로 얼마나 달라지겠어"라고 생각하실 수 있습니다. 그래서 이것도 직접 측정해봤습니다. 두 번의 호출 모두 /effort low로 고정했고, 질문도 완전히 동일합니다.
| 프롬프트 | 속 생각 분량 | 출력 토큰 | 응답 시간 |
|---|---|---|---|
| "내년 상반기 우리 팀 예산안을 짜줘" | 19자 | 831 | 15.7초 |
| "ultrathink 내년 상반기 우리 팀 예산안을 짜줘" | 197자 | 1,028 | 20.3초 |
같은 질문, 같은 effort인데 결과가 이렇게 달라졌습니다.
가장 의미심장한 대목은 첫 번째 줄입니다. 원래 /effort low는 앞 섹션에서 봤듯이 속 생각을 거의 건너뛰는 설정입니다. 그런데 질문에 ultrathink가 한 번 등장하는 것만으로 low 설정을 무력화하고 깊은 사고 모드가 켜졌습니다. 실제 생각 내용도 "예산안은 단순 표만 뽑으면 안 되겠다. 작년 실적 대비, 고정비·변동비 구분, 계절성까지 따로 짚어야겠다" 같은, 제가 원하던 수준의 고민이 들어가 있었습니다.
공식 문서의 표현을 빌리면 이렇습니다. ultrathink는 프롬프트 안에 포함된 인컨텍스트 지시입니다. 클로드 코드가 이 단어를 감지하면 "이번 턴은 더 깊이 사고해라"는 모델 내부 지시를 추가합니다. API로 보내는 effort 레벨 자체를 바꾸는 건 아니고, 모델에게 "좀 더 생각해"라고 추가 요청하는 방식입니다.
2026년 4월 기준 주의사항: ultrathink 다운그레이드 버그 현재 알려진 버그가 있습니다. 세션을
/effort xhigh나/effort max로 설정해둔 상태에서ultrathink키워드를 사용하면, 해당 턴의 effort가 오히려high로 내려가는 현상이 보고되고 있습니다.왜 이런 일이 생기는지 이해하려면 시대 변화를 떠올리면 됩니다.
ultrathink는 기본값이medium이던 2~3월에 만들어진 기능입니다. 그때는 이 키워드가 effort를high수준으로 올려주는 역할이었습니다. medium → high이니 상향이죠. 그런데 4월에 Opus 4.7이 나오면서 기본값이xhigh로 올라갔습니다. ultrathink의 내부 매핑은 여전히high를 가리키고 있는데, 이제high는 기본값보다 낮은 등급이 되어버린 겁니다. 결과적으로 ultrathink가 사고를 올려주는 게 아니라 오히려 내려버리는 역전 현상이 발생합니다.비유하면 에어컨의 "시원하게" 버튼과 같습니다. 기본이 28도일 때 "시원하게"를 누르면 24도로 내려가니 시원해집니다. 그런데 기본이 22도로 바뀌었는데 "시원하게" 버튼이 여전히 24도로 보내면? 오히려 더워지는 겁니다.
이 버그에 걸렸는지 확인하는 방법도 있습니다. 답변이 진행되는 동안 화면 위쪽 로고 옆의 상태 텍스트를 보세요.
/effort xhigh로 세션을 설정해뒀는데 ultrathink를 쓴 턴에서 "with high effort"라고 표시되면 다운그레이드가 발생한 겁니다.이 버그가 수정될 때까지는
xhigh이상의 설정을 쓰고 있다면 ultrathink 대신 프롬프트에 "깊이 생각해서 답해줘" 같은 자연어 지시를 쓰는 것이 더 안전합니다. 자연어 지시는 effort 레벨을 건드리지 않고, 현재 설정된 effort 안에서 모델에게 "더 신중하게"라고 요청하는 것이라 다운그레이드가 발생하지 않습니다.
비용에 대한 솔직한 경고
ultrathink는 공짜가 아닙니다. 사고 토큰도 결국 구독 한도를 깎아 먹습니다. 일상 작업마다 붙이면 한 주치 예산이 반나절에 바닥날 수 있습니다. "이건 진짜 어려운 문제다" 싶을 때만, 프리미엄 아이템처럼 아껴서 쓰는 게 맞습니다.
Reticulating 줄의 "thought for Xs"
"ultrathink 같은 설정이 정말로 뭔가 하고 있는 건지, 아니면 그냥 플라시보인지" 의심이 드실 수 있습니다. 다행히 클로드 코드는 이걸 실시간으로 눈에 보이는 숫자로 보여줍니다. 질문을 던지면 화면 아래쪽에 이런 줄이 뜹니다.
Reticulating... (52s · 5.1k tokens · thought for 12s)
세 숫자의 의미는 각각 이렇습니다.
| 표시 | 의미 |
|---|---|
52s | 질문을 보낸 뒤 지금까지 경과한 시간 |
5.1k tokens | 지금까지 쓰인 토큰(질문 + 답변 + 사고 전부 합산) |
thought for 12s | 클로드가 순수 사고에 쓴 누적 시간 |
셋 중 핵심은 세 번째입니다. 이 숫자가 실시간으로 올라가면 확장 사고가 지금 돌아가고 있다는 뜻이고, 0초 또는 1초에서 멈춘 채 움직이지 않으면 사고를 건너뛴 상태라는 뜻입니다. 제가 앞에서 /effort low로 속 생각이 0회 찍혔다고 말씀드렸던 바로 그 상황입니다.

한 가지 주의할 점이 있습니다. 클로드가 파일을 읽거나 명령어를 돌리는 "도구 호출" 구간은 thought for에 포함되지 않습니다. 그래서 파일을 여러 개 읽으며 일하는 중간에 이 줄을 보면 thought for 1s처럼 낮아 보일 수 있는데, 그건 사고가 부족해서가 아니라 "지금은 사고 대신 파일을 읽는 중"이기 때문입니다. 순수하게 머리로만 풀어야 하는 질문(예: 퍼즐, 계획 수립, 요약)에서 이 숫자를 보시면 더 명확하게 쌓이는 걸 관찰하실 수 있습니다.
이 숫자를 이용하면 팩트체크가 됩니다. 예를 들어 제가 직접 퍼즐 하나(농부·늑대·양·양배추 강 건너기)로 /effort max 조건에서 ultrathink 유무만 바꿔 재측정해봤습니다.
| 조건 | 누적 사고 글자수 | 답변 토큰 | 소요 시간 |
|---|---|---|---|
/effort max (ultrathink 없음) | 283자 | 1,286 | 28.3초 |
/effort max + ultrathink | 1,789자 (6.3배) | 3,126 (2.4배) | 58.3초 (2.1배) |
같은 질문, 같은 effort, 같은 세션 구성인데 ultrathink 한 단어만 추가한 쪽이 속 생각을 6.3배 더 썼습니다. 답변도 훨씬 풍부해졌고, 시간도 두 배 이상 걸렸습니다. 이게 "정말 작동하는 설정"의 모양새입니다. 의심이 드실 때마다 이 숫자를 직접 보시면 플라시보냐 아니냐가 바로 판가름납니다.
진짜 어려운 과제를 주면 차이가 벌어진다
앞의 중간 난이도 질문에서는 low와 max의 출력 차이가 30~70% 정도였습니다. 그렇다면 진짜로 복잡한 과제를 주면 어떻게 될까요? 같은 실측을 "여러 조건을 고려해서 처음부터 끝까지 기획해달라"는 수준의 질문으로 다시 돌려봤습니다. 길고 복잡한 계획 수립 과제를 하나 만들어서, 제약 조건을 여럿 걸고 단계별로 설명하라고 요청하는 형태입니다.

| effort 등급 | 속 생각 분량 | 출력 토큰 | 응답 시간 |
|---|---|---|---|
low | 164자 | 1,728 | 29.4초 |
max | 536자 | 3,219 | 42.3초 |
숫자가 한 번에 벌어집니다. 속 생각은 3.3배(+227%), 출력은 +86%, 응답 시간은 +44% 늘어났습니다. 단순히 양만 늘어난 게 아닙니다. max 응답은 단계별 일정, 예상 리스크, 담당자 역할 분담, 중간 점검 포인트, 실패 시 대비책까지 실제로 바로 회의에 들고 갈 수 있는 수준으로 구체적으로 내려왔습니다. low 응답은 같은 주제를 다루긴 했지만 "큰 목차 세 줄" 수준의 개괄 요약에 그쳤습니다.
요약하면 이렇습니다.
effort는 "모든 질문을 무겁게 만드는 슬라이더"가 아니라, "필요한 순간에만 바닥을 깊게 파주는 설정"에 가깝습니다.
Opus 4.7 시대에 맞는 실전 가이드 (2026년 4월 업데이트)
여기까지 왔으면 이제 선택지는 명확합니다. 2026년 4월, Opus 4.7이 출시되면서 상황이 크게 달라졌습니다. 기본 effort가 xhigh로 올라갔고, 대부분의 작업에서 이전보다 훨씬 깊이 생각합니다. 하지만 여전히 상황에 따라 조절하는 습관이 필요합니다.

Opus 4.7의 기본값은 xhigh입니다. 과거 medium이 기본이던 시절과 비교하면 체감 품질이 상당히 올라갔습니다. 대부분의 코딩 작업, 코드 리뷰, 리팩토링, 일반적인 질문은 이 기본값으로 충분합니다. 굳이 건드리지 않아도 됩니다.
다만 xhigh는 과거 기본값보다 토큰을 2~2.7배 더 소모합니다. 구독 한도가 빠르게 줄어드는 게 체감된다면 /effort high로 한 단계 낮추는 것도 방법입니다.
아키텍처 설계, 복잡한 디버깅, 다단계 기획처럼 정말로 깊은 사고가 필요한 경우에만 max로 올립니다. max는 현재 세션 한정이라 터미널을 닫으면 자동으로 원래 기본값으로 돌아갑니다.
/effort max
한 가지 주의할 점: 공식 문서에 따르면 max는 "지나친 사고(overthinking)가 발생할 수 있고 수확 체감이 올 수 있다"고 되어 있습니다. 무조건 좋은 건 아니니, 일상적으로 쓰기보다 난제에만 켜는 게 맞습니다.
max로도 모자란 극한 상황에서는, 질문 안에 "깊이 생각해서 답해줘" 같은 자연어 지시를 직접 넣습니다.
/effort max
그리고 실제 질문은 이렇게 칩니다.
깊이 생각해서 답해줘. 우리 팀 업무 프로세스를 처음부터 다시 설계해줘.
현재 3명이 각자 다른 방식으로 일하고 있고, 커뮤니케이션 비용이 크고,
신규 입사자가 적응하는 데 한 달 이상 걸리는 상황이야.
역할 분담, 회의 구조, 문서 흐름, 인수인계 방식까지 단계별로 짚어줘.
왜 ultrathink 대신 자연어인가요? 공식 문서에도 "adaptive thinking의 트리거 동작은 프롬프트로 조절 가능(promptable)"하다고 명시되어 있습니다.
ultrathink키워드도 본질적으로 프롬프트 안의 인컨텍스트 지시일 뿐입니다. 그런데 현재(2026년 4월)ultrathink에 다운그레이드 버그가 있어서xhigh/max설정이 오히려high로 내려가는 현상이 보고되고 있습니다. 이 버그가 수정될 때까지는 "깊이 생각해"라는 자연어 지시가 더 안전합니다.
⚠️ Opus 4.7 사용자는 이 카드를 쓸 수 없습니다 Opus 4.7에서는 어댑티브 싱킹이 유일한 사고 방식입니다. 고정 사고 예산 모드와
CLAUDE_CODE_DISABLE_ADAPTIVE_THINKING환경변수는 Opus 4.7에 적용되지 않습니다. Opus 4.7을 쓰고 계시다면 위 3단계까지로 조절하시고, 이 섹션은 Opus 4.6이나 Sonnet 4.6을 쓰는 분만 참고해주세요.
위 세 단계로도 여전히 답변이 들쭉날쭉하고, Opus 4.6 또는 Sonnet 4.6을 쓰고 계신다면, 마지막 카드가 한 장 남아 있습니다. 어댑티브 싱킹 자체를 꺼버리는 설정입니다.
이 마지막 카드는 슬래시 명령어로는 바꿀 수 없고, 터미널의 "환경변수"라는 설정을 한 줄 추가해야 합니다. 환경변수는 "이 컴퓨터의 터미널을 열 때마다 기본으로 켜두고 싶은 값"을 적어두는 곳이라고 생각하시면 됩니다. Mac을 쓰시면 아래 순서를 그대로 따라하시면 됩니다.

1단계. 터미널을 열고 다음 한 줄을 칩니다.
nano ~/.zshrc
여기서 ~/.zshrc는 "내 홈 폴더 안에 숨겨져 있는, 터미널을 열 때마다 자동으로 읽히는 설정 파일"의 이름입니다. nano는 터미널 안에서 파일을 편집할 수 있게 해주는 아주 단순한 편집기입니다. 이 한 줄을 치면 그 설정 파일이 터미널 안에서 열립니다.
2단계. 열린 파일의 맨 아래에 다음 한 줄을 추가한 뒤, Ctrl+O(저장)와 Ctrl+X(나가기)를 차례로 누릅니다.
export CLAUDE_CODE_DISABLE_ADAPTIVE_THINKING=1
3단계. 설정 파일에 적어둔 값을 지금 이 터미널에 바로 반영하려면 아래 한 줄을 더 칩니다. 새 터미널을 열면 자동으로 적용되므로, 이 단계는 건너뛰셔도 무방합니다.
source ~/.zshrc
이 한 줄짜리 환경변수가 하는 일은 한 문장으로 요약됩니다. 앞으로 클로드 코드가 "이 질문은 사고가 필요 없어 보인다"라고 판단해서 사고를 건너뛰는 일을 완전히 막습니다. 대신 /effort 설정에 해당하는 고정 사고 예산을 매번 그대로 사용합니다. Boris Cherny가 해커뉴스에서 직접 "헛소리를 가장 빠르게 줄이는 한 줄짜리 조치"라고 언급한 바로 그 설정입니다.
단, 이 설정은 매 호출의 비용을 늘립니다. 쉬운 질문에도 고정 예산이 들어가기 때문에 구독 한도가 조금 더 빨리 소진됩니다. 그래서 "헛소리 때문에 너무 자주 당해서 토큰보다 신뢰가 더 소중해진 단계"에 도달했을 때 켜시는 걸 추천드립니다. 그 전까지는 /effort만 올리고 써보시는 게 먼저입니다.
Opus 4.7 시대의 대안 Opus 4.7에서는 이 환경변수가 작동하지 않지만, 대신 기본값 자체가
xhigh로 올라갔기 때문에 과거만큼 헛소리가 심하지 않습니다. 그래도 일관성이 아쉽다면,CLAUDE.md나 시스템 프롬프트에 "항상 깊이 생각하고 답하세요"라는 자연어 지시를 넣어두는 것이 Opus 4.7에서 사실상의 "최후의 카드"입니다. 공식 문서에도 "adaptive thinking의 트리거 동작은 프롬프트로 조절 가능하다"고 명시되어 있습니다.
매번
/effort high를 치는 게 귀찮다면 프로젝트 폴더의CLAUDE.md나 전역 설정에 기본 effort를 명시해두면, 새 세션을 열 때마다 자동으로 적용됩니다. 프로젝트별로 다른 기본값을 쓰는 방법도 여기서 같이 다뤘습니다. 👉 클로드 코드에게 매번 설명하기 귀찮다면 — CLAUDE.md 설정법

이 글에서 다룬 내용을 세 줄로 압축하면 이렇습니다.
첫째, 2~3월에 클로드가 허술해진 건 사용자 탓이 아니었습니다. 기본 effort가 medium으로 낮아졌고 어댑티브 싱킹이 사고를 건너뛰면서 "정확한 형태의 헛소리"가 늘었습니다. 4월 Opus 4.7 출시와 함께 기본값이 xhigh로 올라가면서 상황이 상당히 개선됐지만, 어댑티브 싱킹은 여전히 작동하고 있으므로 설정을 이해하는 게 중요합니다.
둘째, /effort는 어댑티브 싱킹에 주는 "사고 깊이 가이드"입니다. 같은 질문에서 effort low와 max는 속 생각을 0자에서 181자까지, 출력을 +71%까지 벌릴 수 있었습니다. Opus 4.7의 xhigh 기본값이 대부분의 작업에 충분하지만, 난제에는 max를, 비용이 부담되면 high로 한 단계 낮추는 식으로 조절하면 됩니다. ultrathink 키워드는 현재 다운그레이드 버그가 있으니 자연어 지시("깊이 생각해")를 쓰는 게 더 안전합니다.
셋째, Opus 4.6을 쓴다면 환경변수 한 줄이 최후의 카드입니다. CLAUDE_CODE_DISABLE_ADAPTIVE_THINKING=1은 Opus 4.6/Sonnet 4.6에서만 작동합니다. Opus 4.7에서는 어댑티브 싱킹이 유일한 사고 방식이라 끌 수 없지만, 대신 CLAUDE.md에 자연어 지시를 넣어두면 비슷한 효과를 얻을 수 있습니다.
클로드 코드는 Opus 4.7과 함께 확실히 한 단계 진화했습니다. 기본값이 올라간 만큼 과거의 "조용한 품질 저하" 문제는 상당 부분 해소됐지만, 어댑티브 싱킹이라는 엔진은 계속 돌아가고 있습니다. 이 글의 설정을 손에 익혀두시면, 그 엔진을 원하는 방향으로 조종하실 수 있습니다.
토큰 한도가 너무 빨리 차는 게 걱정이시라면, 이 글에서 다룬 "사고 토큰"은 사실 전체 토큰 소모의 한 조각일 뿐입니다. 스크린샷·MCP·대화 누적까지 포함한 전체 그림은 아래 글에서 다뤘습니다.