Anthropic이 2026년 4월 9일에 베타로 푼 Claude Advisor 도구를 한 번에 정리했어요. Executor(Sonnet·Haiku)가 일하다 막힐 때만 Advisor(Opus 4.6)에게 잠깐 물어보는 패턴인데, 한 번의 API 호출 안에서 작동하고 코드는 사실상 한 줄 변경입니다. Anthropic 공식 시뮬레이션 기준 25턴 코딩 에이전트에서 Opus 단독 대비 Sonnet+Advisor는 73%, Haiku+Advisor는 87% 비용이 줄어요. 한국 정리글이 거의 없는 시점이라 본인 청구서를 줄이는 5가지 사용법과 베타 함정을 같이 정리했어요.
📌 어제 정리한 바이브코딩 보안 대참사 3건이 “사고 시각”이었다면, 오늘은 “비용 시각” 차례예요. → Lovable·Moltbook 사고 5분 정리
📑 목차
💡 왜 지금 — Advisor 베타가 의미하는 것
4월 9일에 베타 공개 — 5월 6일 Code w/ Claude 2026에서 재강조
Anthropic은 2026년 4월 9일 Advisor 도구를 공개 베타로 공개했어요. 추가 신청이나 대기 명단이 없는 즉시 사용 가능한 베타입니다. 5월 6일에 열린 Code w/ Claude 2026 컨퍼런스에서 Anthropic은 이 도구를 다시 한 번 강조했고, 새 모델 발표 대신 “기존 모델을 더 똑똑하게 쓰는 패턴”으로 자리매김했어요.
이 시점이 중요해요. Anthropic은 4~5월에 새 Opus를 발표하는 대신 Advisor 패턴을 강조했습니다. 즉 “더 비싼 모델”이 아니라 “있는 모델을 어떻게 조합하느냐”가 다음 6~12개월의 핵심 변수라는 신호예요.
비개발자에게 의미 — 청구서가 73% 줄어드는 한 줄 변경
Claude API를 직접 쓰시는 분은 청구서가 곧 절감 효과로 돌아옵니다. 25턴 코딩 에이전트를 Opus 단독으로 돌리면 작업당 $100이 나오는 시나리오에서, Sonnet+Advisor로 바꾸면 $27이 됩니다. 한 줄만 추가하면 같은 작업이 73% 싸지는 거예요.
Claude Code 사용자에게도 의미가 있어요. Pro·Max 5시간 한도 안에서 같은 작업을 더 길게 할 수 있게 됩니다. Sonnet 본진이 토큰을 빠르게 쓰고 Opus는 막힌 결정만 처리하니까 같은 한도 안에서 작업 시간이 사실상 2배로 늘어나요.
이 글이 한 번에 답하는 것
이 글은 네 가지를 다룹니다. 첫째는 Advisor 도구가 어떻게 작동하는지 한 요청 안의 흐름이에요. 둘째는 73%·87% 숫자가 어디서 나왔는지 출처 데이터입니다. 셋째는 5가지 실전 사용법(기본 페어링·max_uses 캡·Claude Code 적용·비용 측정·한계 인식)이에요. 넷째는 베타 단계라서 알아둬야 할 함정 5가지입니다.
그 다음 단계로 Claude Code 깊이 사용법이 궁금하시면 별도 정리한 Claude Code Routines 가이드가 짝꿍 글이에요.
⚙️ 작동 원리 — 한 요청 안에서 두 모델이 협업

핵심 — 단일 API 호출 안에서 끝난다
가장 큰 차이가 여기예요. 두 모델을 직접 오케스트레이션하지 않습니다. Executor에게 advisor라는 도구를 하나 더 주면, Executor가 알아서 필요할 때 호출하고 답을 받아서 다시 일을 이어갑니다. 클라이언트 쪽 코드 변경이 한 줄에 가까운 이유예요.
이전 방식과 비교하면 차이가 명확합니다. 예전엔 “Sonnet으로 코드 짜다가 어려운 부분 나오면 Opus에게 다시 요청 → 응답 받아서 Sonnet에게 컨텍스트 옮기기”를 클라이언트가 직접 처리해야 했어요. 두 번의 API 호출과 컨텍스트 동기화 코드가 필요했죠. Advisor는 이걸 서버 쪽으로 옮긴 거예요.
Advisor 응답은 짧다 — 평균 400~700 토큰
Advisor가 한 번에 반환하는 응답은 평균 400~700 토큰이에요. 코드를 다시 쓰는 게 아니라 “이 방향으로 가세요”라는 전략·설계·디버깅 가이드만 줍니다. Executor가 그 가이드를 받아서 실제 코드 생성·도구 호출·파일 조작을 처리해요.
이 분업이 비용 절감의 핵심입니다. 비싼 Opus가 출력하는 토큰이 적고, 싼 Executor가 출력하는 토큰이 많은 구조예요. 토큰당 단가가 5배 차이나는 모델끼리 분업하니까 청구액이 떨어집니다.
Executor가 자율 판단으로 호출 — 사람 개입 불필요
Advisor 호출은 클라이언트가 명시적으로 지시하는 게 아니라 Executor가 스스로 판단합니다. “이 결정은 내가 확신이 없네, Advisor에게 물어보자” 같은 흐름이 모델 안에서 일어나요. 그래서 클라이언트 코드는 도구를 등록만 해두면 됩니다.
이 자율 판단은 max_uses 파라미터로 한도를 두는 게 안전해요. 모델이 너무 자주 Advisor를 부르면 비용 절감 효과가 줄어들기 때문입니다. max_uses 3~5 정도가 일반적인 코딩 작업의 권장 범위예요.
📊 비용 절감 데이터 — 73% / 87% 숫자의 출처

73% 절감의 계산 방식
Anthropic의 시뮬레이션 조건은 명확해요. 25턴짜리 코딩 작업, Advisor는 그 중 3턴에서 호출됩니다. 각 모델의 단가는 2026년 5월 기준으로 Opus 4.6 입력 $5·출력 $25, Sonnet 4.6 입력 $3·출력 $15, Haiku 4.5 입력 $1·출력 $5(백만 토큰당)예요.
전체 토큰의 약 88%가 Executor에서, 12%가 Advisor에서 생성된다고 가정해요. 그러면 Sonnet 본진이 작업의 88%를 Sonnet 단가로 처리하고, Opus는 12%만 출력합니다. 같은 작업을 Opus 단독으로 돌리면 100% Opus 단가니까 차이가 크게 나는 거예요.
87% 절감의 의미 — Haiku도 Opus 수준에 근접
Haiku+Advisor의 87% 절감은 단순 가격 차이를 넘어선 효과를 보여줘요. Haiku는 가장 저렴한 모델이라 단독으로 어려운 작업을 시키면 실패율이 높습니다. Advisor를 붙이면 결정의 질이 Opus 수준으로 올라가니까 같은 작업을 더 낮은 단가로 끝낼 수 있어요.
BrowseComp 벤치마크 결과가 이 효과를 가장 잘 보여줍니다. Haiku 단독은 19.7%였는데 Advisor를 붙이니 41.2%까지 올라갔어요. 두 배 이상 점수가 뛴 거예요. “Haiku+Advisor가 Sonnet 단독보다 싸면서 어떤 작업에서는 더 나은 결과를 내는 시나리오”가 만들어진 셈입니다.
한계 — 11.9% 라는 공식 수치도 있다
73%·87%는 25턴 시뮬레이션 기준이고, Anthropic이 SWE-bench Multilingual에서 측정한 실제 평균은 비용 11.9% 절감이에요. 짧은 작업이나 Advisor 호출이 거의 없는 작업에서는 절감폭이 작아집니다. “어려운 결정이 자주 나오는 작업”일수록 절감 효과가 커지는 구조예요.
본인 작업 패턴에 따라 절감폭이 다르게 나오기 때문에, 5가지 사용법 중 4번 “비용 분리 측정”이 가장 중요합니다. 실제 청구서로 본인의 절감폭을 확인한 다음 max_uses를 튜닝하시는 게 데이터 기반 접근이에요. Anthropic 공식 단가 표는 별도 정리한 바이브코딩 2026 시장 통계 13개에서 비교 데이터를 확인할 수 있어요.
| 조합 | SWE-bench Multilingual | BrowseComp | 비용 절감 (vs Opus 단독) |
|---|---|---|---|
| Opus 4.6 단독 | 기준선 ~75% | 기준선 | 0% (기준) |
| Sonnet 4.6 단독 | 72.1% | — | 약 −80% (단순 모델 단가차) |
| Sonnet + Advisor | 74.8% (+2.7%p) | — | −73% (25턴 시뮬레이션) |
| Haiku 4.5 단독 | — | 19.7% | 약 −95% (단순 단가차) |
| Haiku + Advisor | — | 41.2% (+21.5%p) | −87% (25턴 시뮬레이션) |
🔧 5가지 사용법 — 한 줄 변경부터 청구서 측정까지
Advisor 도구를 실전에서 어떻게 적용하는지 5단계로 정리했어요. 1·2번을 먼저 적용해서 비용을 잡고, 3·4번으로 청구서 분석, 5번으로 함정 회피 순으로 따라가시면 됩니다.

① 기본 페어링 — 한 줄 API 변경
가장 단순한 적용 방식이에요. 기존 Messages API 호출에 베타 헤더와 advisor 도구를 추가하면 끝납니다. 모델은 그대로 Sonnet이나 Haiku를 쓰고, 도구 목록에 advisor 항목 하나가 더해지는 구조예요.
# Python SDK 예시 (개념적 형태)
client.beta.messages.create(
model="claude-sonnet-4-6",
extra_headers={"anthropic-beta": "advisor-tool-2026-03-01"},
tools=[{
"type": "advisor_20260301",
"name": "consult_opus",
"model": "claude-opus-4-6",
"max_uses": 3,
}],
messages=[...]
)
이 한 번의 변경으로 SWE-bench Multilingual 점수가 2.7%p 올라가고 비용이 11.9%~73% 줄어요. 도구 이름은 본인이 정하기 나름이고 max_uses 값은 작업 길이에 맞춰 조정합니다.
② max_uses 캡 — Opus 호출 횟수 제한
max_uses 파라미터가 비용 통제의 핵심이에요. Executor가 너무 자주 Advisor를 호출하면 비용 절감 효과가 줄어들고, 너무 적게 호출하면 결정 품질이 떨어집니다. 일반적인 코딩 작업에서 3~5 정도가 권장 범위예요.
처음엔 3으로 시작해서 한 작업을 끝낸 뒤 청구서에서 Advisor 토큰 사용량을 확인하시는 게 좋아요. 그 뒤에 작업 난이도에 맞춰 늘리거나 줄이시면 됩니다. 본인의 작업 패턴이 정해지면 max_uses 값도 자연스럽게 안정됩니다.
③ Claude Code 적용 — Pro·Max 한도 늘리기
Claude Code 사용자도 이 패턴의 혜택을 받을 수 있어요. Anthropic은 2026년 5월에 Pro·Max 사용자의 5시간 한도를 두 배로 늘렸는데, Advisor 패턴을 함께 쓰면 같은 한도 안에서 더 오래 작업할 수 있습니다. Sonnet 본진이 토큰을 빠르게 소비하고 Opus는 어려운 결정만 처리하니까요.
Claude Code 안에서 직접 advisor 도구를 호출하는 방식은 아직 명시적인 API 슬래시 명령으로 제공되지는 않지만, 자동화 에이전트(Routines·hooks 등)에서 활용하는 사례가 늘고 있어요. 다음 단계의 사용법은 별도 정리한 Claude Code Routines 가이드에서 확인할 수 있습니다.
④ 비용 분리 측정 — 청구서에서 비율 본다
Anthropic 콘솔의 사용량 페이지에서 Executor 모델과 Advisor 모델의 토큰을 따로 볼 수 있어요. 이 비율이 본인 작업 패턴의 핵심 지표입니다. Advisor 토큰이 전체의 10~15% 정도면 균형이 잘 맞은 거예요.
20%를 넘으면 max_uses를 줄이거나 Executor 모델을 한 단계 위로 올리는 걸 검토하시면 됩니다. 5%를 넘지 않으면 Advisor를 거의 호출하지 않고 있다는 뜻이라 max_uses를 늘려도 비용 부담이 없어요. 본인의 청구서 데이터가 모이면 최적 값을 찾을 수 있습니다.
⑤ 한계 인식 — 베타 제약 사전 체크
Advisor 도구는 베타라 제약이 있어요. Advisor 자리에는 현재 Opus 4.6만 사용할 수 있습니다. Opus 4.7이 5월에 GA로 출시됐지만 Advisor 슬롯에는 아직 들어가지 못해요. Sonnet을 Haiku의 Advisor로 쓰는 것도 안 됩니다.
또 한 가지 함정은 Executor 모델 선택이에요. 너무 어려운 작업을 Haiku에게 시키면 Advisor 호출이 자주 발생해서 비용이 다시 올라갑니다. 작업 난이도에 맞는 Executor를 고르는 게 절감 효과의 전제 조건이에요.
⚠️ 한계와 함정 — 베타 사용 전 알아둘 5가지
Advisor 도구는 베타라서 본격적인 운영 전에 알아둘 함정이 몇 개 있어요. 본인 프로젝트에 적용하기 전에 한 번 훑어보시면 시행착오를 줄일 수 있습니다.
함정 ① — Advisor 모델은 Opus 4.6 하나만
현재 베타에서는 Advisor 슬롯에 Opus 4.6만 들어갈 수 있어요. Opus 4.7이 5월에 GA로 출시됐지만 Advisor 도구에는 아직 4.7이 지원되지 않습니다. Sonnet을 Advisor로 써서 Haiku를 도와주는 조합도 막혀 있어요.
이 제약은 베타가 끝나면 풀릴 가능성이 높아요. 다만 지금 시점에서는 Executor 자리에 Sonnet 4.6이나 Haiku 4.5만 들어가고, Advisor 자리에는 Opus 4.6만 들어가는 단일 페어링으로만 작동합니다.
함정 ② — 베타 헤더 누락 시 그냥 작동 안 함
anthropic-beta 헤더가 빠지면 advisor 도구가 그냥 인식되지 않아요. 에러 메시지가 명확하지 않을 수 있어서 “왜 절감이 안 되지” 하면서 한참 헤매는 경우가 자주 나옵니다. 처음 적용하실 때 헤더 값을 정확히 advisor-tool-2026-03-01로 쓰셨는지 확인하시는 게 좋아요.
함정 ③ — Executor가 Advisor를 안 부를 수도 있다
max_uses는 호출 한도이지 호출 강제 횟수가 아니에요. Executor 모델이 “이 작업은 내가 혼자 풀 수 있어”라고 판단하면 Advisor를 한 번도 안 부를 수 있습니다. 이런 경우 절감 효과가 거의 0이고 SWE-bench 점수 향상도 없어요.
해결책은 system 프롬프트에 “어려운 결정이 나오면 advisor를 적극적으로 사용하라”는 가이드를 한 줄 넣으시는 거예요. 이러면 Executor가 호출 빈도를 조금 더 올립니다. Anthropic 공식 문서에도 권장 시스템 프롬프트 예시가 나와요.
함정 ④ — Advisor 응답이 그대로 사용자에게 노출되지 않는다
Advisor가 반환한 400~700 토큰은 Executor의 내부 컨텍스트로 들어가요. 사용자에게 노출되는 건 Executor의 최종 응답입니다. 그래서 “Opus에게 직접 물어봤다면 이렇게 답했을 텐데” 하는 응답이 그대로 나오지는 않아요.
이 점이 디버깅을 어렵게 만들 수 있어요. Advisor가 어떤 조언을 했는지 보고 싶으면 별도로 로깅을 켜야 합니다. Anthropic은 Advisor 호출 횟수와 토큰 수는 콘솔에서 제공하지만, 내용까지 보려면 추가 설정이 필요해요.
함정 ⑤ — 작업이 짧으면 절감 효과가 거의 없다
73%·87% 같은 절감폭은 25턴짜리 긴 작업 기준이에요. 5턴짜리 짧은 작업에서는 절감폭이 11.9% 수준에 머무릅니다. 더 짧은 작업이면 Advisor 호출 자체가 거의 없어서 절감 효과가 사라져요.
그래서 Advisor 패턴은 짧은 단발 질의보다 긴 에이전트 작업·자동화 워크플로에서 효과가 더 큽니다. 5분 안에 끝나는 채팅에는 굳이 쓸 필요가 없고, 30분 이상 돌아가는 코딩 에이전트에 적용하시는 게 가장 ROI가 높아요. AI 에이전트 보안 점검의 큰 그림은 별도 정리한 AI 에이전트 OWASP Top 10 가이드에서 확인하실 수 있어요.
🚀 다음 단계 — Claude Code·자동화 에이전트로 확장
Advisor 패턴을 5가지 사용법으로 적용한 다음, 어디로 확장할 수 있는지 정리했어요. 본인의 작업 패턴에 따라 다음 두 갈래 중 하나로 가시면 됩니다.
방향 ① — Claude Code 자동화로 확장
Claude Code Routines는 영어로 쓴 자연어 cron 작업이에요. “매일 아침 9시에 새 PR 리뷰” 같은 자동화 흐름을 만들 수 있습니다. 여기에 Advisor 패턴을 결합하면 Routines 안의 Sonnet 호출이 자동으로 Advisor의 도움을 받게 돼요. 자동화 시간은 늘리고 청구액은 줄이는 효과가 동시에 나옵니다.
Routines 시작 방법과 첫 자동화 흐름은 별도 정리한 Claude Code Routines 가이드에서 단계별로 안내했어요. Advisor와 함께 쓰는 패턴은 그 글의 “고급 활용” 섹션을 참고하시면 됩니다.
방향 ② — MCP 서버와 결합한 에이전트 구축
Model Context Protocol(MCP)은 Claude나 다른 AI 도구에 외부 도구를 한 줄로 붙이는 표준이에요. MCP 서버를 본인 에이전트에 연결하면 파일 시스템·DB·외부 API 같은 도구를 모델이 직접 호출할 수 있게 됩니다. 여기에 Advisor 패턴을 더하면 “비싼 결정만 Opus가 처리하고 도구 호출과 코드 작성은 Sonnet이 처리하는” 풀스택 에이전트가 만들어져요.
MCP의 기본 개념과 첫 설치는 별도 정리한 MCP 비개발자 입문 가이드에서 확인할 수 있어요. 한 번 설치하면 본인 도구가 곧 사용할 수 있는 서비스가 됩니다.
방향 ③ — 본인의 부업·SaaS에 적용
월 1500달러를 목표로 하는 AI 부업·마이크로 SaaS에서도 Advisor 패턴은 직접 효과가 나와요. 사용자가 늘수록 API 비용이 매출의 압박 요인이 되는데, Advisor를 적용하면 같은 트래픽에서 비용이 73% 줄어듭니다. 마진이 거의 그대로 절감폭만큼 늘어나는 셈이에요.
본인 도구에서 한 단계 더 나아간 흐름이 궁금하시면 별도 정리한 AI 부업 월 1500달러 가능한가 글의 90일 MRR 로드맵 부분을 참고하세요. 비용 구조가 1500달러 매출의 핵심 변수예요.
실제 SDK 코드로 직접 적용하려는 개발자라면, 같은 주제를 코드 시각으로 푼 Claude Advisor API 실전 — Executor/Advisor 패턴 코드 가이드에서 Python·TypeScript 페어링 코드, prompt caching 결합, 청구서 비율 측정 스크립트까지 단계별로 확인할 수 있어요.
본격적으로 본인의 첫 도구를 만들고 싶으시면, VibeStart에서 OS와 목적을 선택하시면 단계별 셸 스크립트로 개발환경 세팅이 자동으로 끝납니다. Git·Node·VS Code·Next.js 설치까지 30분 안에 끝나는 흐름이에요.
Advisor 도구는 한 줄 API 변경으로 청구액 73%~87%가 줄어드는 베타 패턴이에요. Executor(Sonnet·Haiku) + Advisor(Opus 4.6)를 단일 호출 안에서 묶으면, SWE-bench 점수도 함께 올라갑니다. 본인 청구서를 줄이는 다음 단계는 max_uses를 3으로 두고 한 작업을 돌려본 뒤 비율을 확인하는 거예요.
❓ FAQ
질문을 누르면 답변이 펼쳐집니다.
🔰 큰 그림에 대한 질문
Q. Advisor 도구는 어떻게 활성화하나요?
Q. 비용 절감 73%는 모든 작업에서 똑같이 나오나요?
Q. Anthropic 외에 비슷한 패턴이 있나요?
⚙ 베타 제약·실전 사용 질문
Q. Claude Code Pro 사용자도 쓸 수 있나요?
Q. Advisor에 Opus 4.7을 쓸 수 있나요?
Q. max_uses를 0으로 두면 어떻게 되나요?
Q. Advisor 응답 내용을 직접 보고 싶어요
🚀 다음 단계·확장 질문
Q. Sonnet 대신 다른 회사 모델을 Advisor로 쓸 수 있나요?
Q. 한국에서 결제하면 환율 영향이 큰가요?
Q. 본인의 첫 프로젝트에 적용해도 되나요?
이 글의 비용 절감 수치(73%·87%·11.9%)는 Anthropic 공식 발표와 시뮬레이션 자료를 기준으로 작성됐어요. 실제 본인의 청구액 변화는 작업 패턴·Advisor 호출 빈도·Executor 모델 선택에 따라 달라질 수 있습니다. Advisor 도구는 2026년 5월 13일 기준 베타 상태이고, 향후 GA 전환 시 파라미터 이름이나 호환 모델이 변경될 수 있어요. 본인 프로젝트에 적용하기 전에 Anthropic 공식 문서로 최신 사양을 확인하시는 걸 권장드립니다.
VibeStart에서 OS와 목적을 선택하시면 단계별 셸 스크립트로 Git·Node·VS Code·Claude Code 설치까지 자동으로 안내해드려요.
Advisor 패턴을 첫 작업부터 적용하고 싶으신 분들에게 추천드립니다.
📚 Claude·Anthropic 시리즈 4편
- 트렌드 — Cursor 3 : Cursor 3 출시 — 비개발자가 알아야 할 5가지 변화 (2026)
- 트렌드 — GPT-5.5 : GPT-5.5 출시 — 비개발자가 알아야 할 5가지 변화 (2026)
- 자동화 — Routines : Claude Code Routines 입문 — 영어로 쓰는 cron job 자동화 가이드 (2026)
- 표준 — MCP 입문 : MCP(Model Context Protocol) 비개발자 입문 가이드 (2026)
🔗 추가 관련 글
- AI 코딩 75% 자동화 시대 — 살아남는 5개 직군과 진입 루트 (2026)
- AI 부업 월 1500달러 가능? — 바이브코딩 수익 5가지 데이터 (2026)
- 바이브코딩 보안 대참사 — Lovable·Moltbook 사고 5분 정리 (2026)
- 바이브코딩 2026 시장 통계 13개 — 비개발자가 알아야 할 진입 신호 (2026)
- Claude Code 설치부터 첫 코딩까지 — 완벽 가이드 (2026)
📚 참고 자료
- The advisor strategy: Give Sonnet an intelligence boost with Opus — Anthropic 공식 블로그
- Code w/ Claude 2026 라이브 블로그 — Simon Willison
- Claude Advisor API: Use Opus for 80% Less Money — Builder.io
- Anthropic’s Advisor Strategy: Cut Claude API Costs by Up to 85% — MindwiredAI
- Claude Advisor Strategy: Full 2026 Guide — Efficient Coder
- Claude Opus 4.7 Pricing 2026 — Finout
- Claude Models Overview — Anthropic 공식 문서
- Claude Updates by Anthropic — May 2026 — Releasebot
IT 기획 10년차 / 비전공자를 위한 바이브코딩 블로그 운영 / vibe-start.com 제작
Building VibeStart — the fastest path for non-devs into AI coding. Launching on Product Hunt 2026-05-26.

