에디블로그
Engineer's Field Notes

AI 자동화로 매일
한 편씩 쓰는
엔지니어 운영 노트

Claude Code · 자동화 파이프라인 · 사고 회고까지. 잘 굴러간 기록 + 깨진 흔적도 같이 남깁니다.

사람이 할 수 있는 일은,
AI도 할 수 있어야 합니다.
매일 한 편 쓰면서 검증 중.
— 이번 주 가장 많이 읽힌 글 TOP 3
AI/정보

[Claude] Sonnet 5 공개 — Opus에 가까워졌는데 더 싸졌어요

반응형
[Claude] Sonnet 5 공개 — Opus에 가까워졌는데 더 싸졌어요

[Claude] Sonnet 5 공개 — Opus에 가까워졌는데 더 싸졌어요

Anthropic이 현지시간 6월 30일 Claude Sonnet 5를 공개했어요. Sonnet 4.6의 다음 버전인데, 성능은 상위 등급인 Opus 4.8에 더 가까워지고 가격은 그대로거나 더 낮아진 게 핵심이에요. 무료·Pro 사용자라면 따로 설정할 것도 없이 이미 기본 모델로 바뀌었어요.

01. 무료·Pro의 기본 모델이 Sonnet 5로 바뀌었어요

Free와 Pro 요금제는 이제 Sonnet 5가 기본 모델이에요. Max·Team·Enterprise 사용자도 모두 선택할 수 있고, Claude Code와 API(Claude Platform)에도 같이 올라왔어요.

한국 사용자 입장에서는 별도 신청이나 지역 제한 없이 평소 쓰던 화면에서 바로 적용된다는 점이 실용적으로 중요한 부분이에요. Claude Code에서도 /model 선택지에 model ID claude-sonnet-5로 잡혀 있어요.

02. 8월 31일까지는 도입가로 더 싸게 써요

API 가격은 도입가 기준 입력 100만 토큰당 $2, 출력 $10이에요. 이 가격은 8월 31일까지 적용되고, 그 뒤에는 입력 $3, 출력 $15로 올라가요.

정가로 보더라도 Opus 4.8보다 한참 낮은 구간이라, Anthropic은 Sonnet 5를 "에이전트를 더 싸게 돌리는 선택지"로 설명하고 있어요. 비용에 민감한 자동화나 대량 호출 작업이라면 8월 말까지 도입가 구간에 비교해보는 게 좋아요.

공식 문서 기준으로 context window는 100만 토큰, 한 번에 내보내는 출력은 최대 128K 토큰이에요.

03. 벤치마크는 Opus 4.8에 근접한다고 해요

Anthropic 발표 기준으로 Sonnet 5는 추론·도구 사용·코딩에서 Sonnet 4.6보다 확실히 올라갔다고 해요. 코딩 벤치마크인 SWE-bench Pro에서 63.2%로, Sonnet 4.6의 58.1%보다 높고 Opus 4.8(69.2%)에는 아직 못 미치는 수치예요.

터미널 작업을 보는 Terminal-Bench 2.1에서는 80.4%로 Sonnet 4.6(67.0%)보다 크게 올랐고, 종합 추론을 보는 Humanity's Last Exam은 도구를 쓸 때 57.4%로 Opus 4.8(57.9%)에 거의 붙었다고 해요.

다만 이 수치는 모두 발표 자료 기준이라, 실제 체감은 직접 써보고 판단할 부분이에요.

04. 포지션은 "가장 에이전트다운 Sonnet"이에요

Anthropic은 Sonnet 5를 "지금까지 가장 에이전트다운 Sonnet"이라고 소개했어요. 계획을 세우고 브라우저·터미널 같은 도구를 쓰면서 길게 자율적으로 작업하는 쪽에 초점이 맞춰져 있다는 설명이에요.

정리하면 정확도 최상단은 여전히 Opus 4.8이고, Sonnet 5는 그 성능에 가깝게 가면서 값은 낮춘 위치예요. 도구를 많이 부르는 에이전트성 작업을 비용 부담 없이 돌려보려는 경우에 실용적으로 의미가 큰 출시로 보여요.

출처: Anthropic — Introducing Claude Sonnet 5, Claude Platform Docs — Pricing

이 글은 공식 발표 내용을 정리한 것이고, Anthropic으로부터 어떤 형식의 협찬도 받지 않았습니다.

반응형

📚 같이 보면 좋은

"이 포스팅은 쿠팡 파트너스 활동의 일환으로, 일정액의 수수료를 제공받습니다."