B-1 · PM/PL 역할 전환

AI PM이 AI PL/에이전트 11명에게 70분짜리 스프린트를 통째로 맡겼을 때, 속도가 아니라 ‘태스크 분해 능력’이 결과를 갈랐습니다. Agentic Coding 시대의 진짜 PM 역량은 코드를 잘 치는 것이 아니라, 코드를 잘 나누는 것 — 11명 실험이 숫자로 증명한 팀 모드의 본질.

바쁜 분을 위한 3줄 요약

① AI 에이전트 11명에게 아이템 9개·스프린트 4개를 병렬로 맡기니, 혼자 68분짜리 작업이 46분에 끝났습니다(시간 32% 단축, 토큰 15% 증가 — 본 실험 실측).
② 11명 중 3명은 순환 참조·입력기 버그·중간 멈춤으로 사람이 개입해야 했습니다 — 멀티 에이전트는 85% 자동화 + 15% 감독입니다.
③ 병렬화의 성패는 “이 두 아이템이 같은 파일을 건드리는가?” 하나로 갈렸습니다. AI 시대 PM의 핵심 역량은 코드를 잘 치는 것이 아니라 잘 나누는 것입니다.

이 편이 답하는 질문

AI 에이전트 11명과 PM이 함께 70분 스프린트를 수행했을 때, PM의 역할이 “코드 작성”에서 “태스크 분해·파일 독립성 판단·에이전트 할당”으로 전환되었는데, 기존 PM 조직이 이 새로운 역할군에 재배치되기 위한 재교육 기간·내용은?
“이 두 아이템이 같은 파일을 건드리는가?”라는 단 하나의 질문이 병렬화 성패를 갈랐다는 점에서, PM의 코드베이스 이해도가 기술 스택 수준에서 얼마나 깊어야 하며, 그 기준을 명시적으로 어떻게 평가할 것인가?
Task Subagent 방식이 tmux Team 방식보다 오류가 적었다는 발견에서, Sprint 4가 1~3보다 안정적이었던 이유가 “학습 효과”인지 “기술 선택”인지 “문제 특성”인지 구분하고 재현 가능하게 설계하는 방법은?
최종 30개 파일·+4,339 LOC·126 테스트라는 결과에서 PM이 “코드 한 줄 치지 않았다”는 것의 의미는 무엇이며, 이를 조직 성과 평가 체계에 어떻게 반영할 것인가?

이 시리즈를 읽는 세 개의 눈

PO: AI 멀티 에이전트 시대, PM의 가치가 “산출물 생성”에서 “태스크 분해·의존성 관리”로 근본 변화하므로, 채용·평가·커리어 경로를 이에 맞춰 재정의해야 한다.
PM: 파일 겹침 판단·아이템 크기 기준(50 LOC)·에이전트 할당 기준이 병렬화의 32% 속도 향상을 결정하므로, 이 세 가지를 팀 가이드로 명문화해야 한다.
PL: 신규 파일 생성은 우수하고 크로스 모듈 리팩토링은 약한 특성을 인식한 후, 복잡도 높은 작업부터 감독 강도를 높이는 적응형 분배 전략이 필요하다.

PART 1 · EXPERIMENT

혼자 할 일을 병렬로 쪼개, AI 11명에게 동시에 시켰습니다

AI 소프트웨어 개발 수명주기(AI-SDLC)·Agentic Coding 주제로 또 하나의 실험을 했습니다. 혼자 순차적으로 할 일을 병렬로 쪼갰습니다. 그리고 각각의 AI에게 동시에 시켰습니다. 결과는 흥미로웠습니다.

대상은 프로젝트 파이프라인이었습니다. 모듈 54개, 테스트 1,426개 규모입니다. 여기에 9가지 개선을 한꺼번에 적용하고 싶었습니다.

한꺼번에 적용한 9가지 개선 아이템

지속적 통합(CI) 커버리지 · 보안 스캐닝 · 야간 엔드투엔드(E2E) 테스트
영문 가독성 지표 · 챕터 간 일관성 검증 · 대형 모듈 분할
멀티에이전트 테스트 보강 · HTML5 출력 · 에디터 피드백 루프

PART 2 · RESULT

시간은 32% 줄었고, 시간당 처리량은 70% 늘었습니다

9개 아이템을 4개 스프린트로 나눠 병렬 실행했습니다. 혼자 하면 68분 걸릴 일이, 팀 모드로 돌리니 46분에 끝났습니다. 토큰은 15% 더 썼지만, 시간은 32% 줄었습니다.

지표	단독 모드	팀 모드 (11명 병렬)	변화
소요 시간	68분	46분	−32%
토큰 사용량	1,225K	1,409K	+15%
시간당 처리량	18K tokens/분	30.6K tokens/분	+70%

출처: 본 실험 실측치 (스프린트 4개 합산).

산출물은 파일 30개, 코드 줄 수(LOC) 기준 +4,339/−1,704, 추가 테스트 126개였습니다. 그리고 저는 코드를 한 줄도 치지 않았습니다.

PART 3 · FAILURE

11명 중 3명은 문제를 일으켰습니다 — 자동화 85%, 감독 15%

에이전트가 반드시 성공하는 것은 아닙니다. 11명 중 3명이 문제를 일으켰습니다.

문제 상황	원인	수습
2,768줄 모듈 분할 중 순환 참조 발생	의존성 그래프를 분석하지 못함	리더가 5분간 직접 수정
tmux 명령 실행 자체가 깨짐	한국어 입력기(IME) 버그로 명령에 “한글” 프리픽스 부착	claude 공식 버그 리포트 제출
작업 중간에 멈춤	—	Task 에이전트로 전환해 재실행

흥미로운 패턴이 보였습니다. 신규 파일 생성(CI 설정, 테스트)은 품질이 높았습니다. 크로스-모듈 리팩토링은 품질이 낮았습니다. 에이전트는 “함수를 옮겨라”는 잘하지만, “옮기면 뭐가 깨지는가”는 모릅니다.

최종 결과는 1,552개 테스트 전체 통과, 롤백 0건이었습니다. 하지만 멀티 에이전트는 100% 자동화가 아닙니다. 85% 자동화 + 15% 감독입니다. 시스템 사고는 여전히 사람 몫입니다.

PART 4 · DECISION

“같은 파일을 건드리는가?” — 질문 하나가 병렬화의 성패를 갈랐습니다

이번 실험에서 가장 크게 느낀 것이 있습니다. 팀 모드에서 프로젝트 매니저(PM)의 역할이 완전히 달라진다는 점입니다. “이 두 아이템이 같은 파일을 건드리는가?” — 이 질문 하나가 병렬화의 성패를 갈랐습니다.

독립 파일인 CI 설정 3종은 에이전트 3명이 완벽하게 동시 처리했습니다. 반면 의존성 높은 모듈 리팩토링은, 에이전트가 만든 버그를 제가 직접 고쳐야 했습니다.

실측으로 정리한 판단 기준

독립 아이템 3개 이상이면 팀 모드, 파일이 겹치면 단독 모드.
아이템당 50 LOC 미만이면 단독 모드 — 오케스트레이션 오버헤드가 이득을 잡아먹습니다.
팀 모드에서는 tmux team 방식보다 Task subagent 방식이 오류가 적었습니다. Sprint 4가 Sprint 1-3보다 안정적이었습니다.

PART 5 · LESSON

코드를 잘 치는 것보다, 코드를 잘 나누는 것이 핵심 역량입니다

Agentic Coding에서 멀티 에이전트의 본질은 속도가 아닙니다. 태스크 분해 능력입니다. 즉 Architect/Domain/Spec 전문가가 일을 잘 쪼개면 32% 빨라집니다. 잘못 쪼개면 순환 참조를 디버깅하는 데 시간을 씁니다.

코드를 잘 치는 것보다, 코드를 잘 나누는 것. 그게 AI 시대 PM의 핵심 역량이라는 걸, 이번 실험이 숫자로 증명했습니다.

#AgenticCoding #ClaudeCode #멀티에이전트 #AISDLC #TeamMode #AIPM

함께 읽기 · Related Posts

시리즈 네트워크에서 이 편과 연결된 글

B-2 · PM/PL 역할 전환
AI 시대, PO·PM·PL과 사무직의 역할이 근본부터 바뀐다
B-3 · PM/PL 역할 전환
AI 시대, PM/PL의 역량이 근본부터 바뀌어야 하는 이유
B-5 · PM/PL 역할 전환
Agentic 시대, PM/PL과 엔지니어는 무엇을 준비해야 하는가
S-2 · 현장 검증
삼성전자 PMC: AI와 함께하는 PM 교육 혁신
P-11 · AI 인물 탐구
Agentic 시대 PO·PM·PL 5-Domain 역량 통합편
K-4 · 사고 체계
Karpathy: AI의 사고 체계를 PM에 어떻게 적용할까?

AGENTIC PM 시리즈 — 전체 80편 · Lv1 활용→Lv2 워크플로→Lv3 빌드→Lv4 거버넌스 · 10분야 보기 →

🧭 길잡이·수렴 (전체 진입)

🧱 개념·프레임워크 (Lv2–3)

🔄 역할·역량 전환 (Lv1–2)

🧠 사고 체계 (Lv2–3)

👤 AI 인물·리더 (Lv1)

📈 AX 전략·조직 전환 (Lv4)

🏢 현장 검증·사례 (Lv1–4)

🔧 하네스·에이전트·RAG 구축 (Lv3)

🧪 AI 개발·SDLC 실험 (Lv3)

⚖️ 모델·도구·맥 환경 실측 (Lv3)

🏛️ 공공·SI 사업관리 (Lv2–4)

검색

RSS 구독

AI 시대 PM의 역할 변화: 팀 모드의 중요성

혼자 할 일을 병렬로 쪼개, AI 11명에게 동시에 시켰습니다

시간은 32% 줄었고, 시간당 처리량은 70% 늘었습니다

11명 중 3명은 문제를 일으켰습니다 — 자동화 85%, 감독 15%

“같은 파일을 건드리는가?” — 질문 하나가 병렬화의 성패를 갈랐습니다

코드를 잘 치는 것보다, 코드를 잘 나누는 것이 핵심 역량입니다

시리즈 네트워크에서 이 편과 연결된 글

이 글 공유하기:

이것이 좋아요:

Project Research에서 더 알아보기