핵심 요약
Anthropic이 샌프란시스코·런던·도쿄에서 개최한 "Code w/ Claude" 컨퍼런스의 19개 세션 내용. API 사용량 전년 대비 17배 성장, Claude Code 주당 평균 20시간 사용이라는 수치와 함께 전략 방향·신기능·기업 사례가 한자리에 공개됐다. 컨퍼런스 전체를 관통하는 메시지는 "모델 호출 방식"에서 "어떤 도구·데이터·권한·문맥을 에이전트에게 열어주느냐"로 경쟁의 기준이 이동하고 있다는 것이다.
핵심 수치
- API 사용량: 전년 대비 17배 증가
- Claude Code 평균 사용: 주당 20시간
- SWE-bench Verified: Opus 4.7 = 87%, Sonnet 3.7 = 62%
- Datadog 엔지니어 AI 도구 사용률: 약 90%, 그중 Claude Code 비중 최소 2/3
- 프롬프트 캐시 목표 적중률 (GitHub): 94~96%
- Harvey 법률 시나리오 완료율: Dreaming 기능으로 6배 향상
전략 방향 3축
- 기능 확대 — 더 긴 작업, 장기 메모리, 더 많은 도구, 더 나은 검증
- 개발자 부담 감소 — 반복 실행·도구 선택·검증·메모리·문맥 관리가 Claude 플랫폼으로 이동
- 차별화 포인트 이동 — "모델 호출 방식" → "어떤 도구·데이터·권한·문맥을 열어주느냐"
Claude Code 신기능
- Auto Mode: 도구 호출 안전성 자동 판단, 권한 확인 없이 실행
- Worktree: 격리된 브랜치에서 여러 Claude 세션 병렬 작업
- 자동 메모리: 프로젝트별
memory.md로 컨텍스트 자동 관리 - Remote Control: 터미널 세션을 웹/모바일에서 이어받기
- Full screen terminal UI: 클릭 가능한 도구 호출 화면
- 세션 관리: 핀 고정, 필터링, 분할 화면
Dreaming 기능
최근 에이전트 세션을 비동기 분석해 반복 실수, 성공 전략을 자동으로 찾아 정리한다.
프롬프트 캐싱 실전 (GitHub 사례)
94~96% 적중률을 달성한 방법:
- UUID·시점 정보를 앞부분에서 제거
- 동적 도구 로딩을 뒤쪽으로 배치
- 도구 검색 도구로 필요한 정의만 때맞춰 로드
기업 사례
- Asana: 21개 AI Teammate (PMO, HR, IT 등) 운영
- Replit: VibeBench 공개 벤치마크 출시
- Cursor: AnyDev CLI Cloud Agents 공개
조직 변화 시사점
"누가 썼나"보다 "회귀 원인이 무엇인가, 전문가가 필요한가"가 중요해진다.
6개월 로드맵 대신 빠른 시제품 비교가 기준이 되고, 인력 기준은 처리량보다 제품 감각 + 깊은 시스템 전문성으로 이동한다.