
AI PM이 AI PL/에이전트 11명에게 70분짜리 스프린트를 통째로 맡겼을 때, 속도가 아니라 ‘태스크 분해 능력’이 결과를 갈랐습니다. Agentic Coding 시대의 진짜 PM 역량은 코드를 잘 치는 것이 아니라, 코드를 잘 나누는 것 — 11명 실험이 숫자로 증명한 팀 모드의 본질.
① AI 에이전트 11명에게 아이템 9개·스프린트 4개를 병렬로 맡기니, 혼자 68분짜리 작업이 46분에 끝났습니다(시간 32% 단축, 토큰 15% 증가 — 본 실험 실측).
② 11명 중 3명은 순환 참조·입력기 버그·중간 멈춤으로 사람이 개입해야 했습니다 — 멀티 에이전트는 85% 자동화 + 15% 감독입니다.
③ 병렬화의 성패는 “이 두 아이템이 같은 파일을 건드리는가?” 하나로 갈렸습니다. AI 시대 PM의 핵심 역량은 코드를 잘 치는 것이 아니라 잘 나누는 것입니다.
- AI 에이전트 11명과 PM이 함께 70분 스프린트를 수행했을 때, PM의 역할이 “코드 작성”에서 “태스크 분해·파일 독립성 판단·에이전트 할당”으로 전환되었는데, 기존 PM 조직이 이 새로운 역할군에 재배치되기 위한 재교육 기간·내용은?
- “이 두 아이템이 같은 파일을 건드리는가?”라는 단 하나의 질문이 병렬화 성패를 갈랐다는 점에서, PM의 코드베이스 이해도가 기술 스택 수준에서 얼마나 깊어야 하며, 그 기준을 명시적으로 어떻게 평가할 것인가?
- Task Subagent 방식이 tmux Team 방식보다 오류가 적었다는 발견에서, Sprint 4가 1~3보다 안정적이었던 이유가 “학습 효과”인지 “기술 선택”인지 “문제 특성”인지 구분하고 재현 가능하게 설계하는 방법은?
- 최종 30개 파일·+4,339 LOC·126 테스트라는 결과에서 PM이 “코드 한 줄 치지 않았다”는 것의 의미는 무엇이며, 이를 조직 성과 평가 체계에 어떻게 반영할 것인가?
- PO: AI 멀티 에이전트 시대, PM의 가치가 “산출물 생성”에서 “태스크 분해·의존성 관리”로 근본 변화하므로, 채용·평가·커리어 경로를 이에 맞춰 재정의해야 한다.
- PM: 파일 겹침 판단·아이템 크기 기준(50 LOC)·에이전트 할당 기준이 병렬화의 32% 속도 향상을 결정하므로, 이 세 가지를 팀 가이드로 명문화해야 한다.
- PL: 신규 파일 생성은 우수하고 크로스 모듈 리팩토링은 약한 특성을 인식한 후, 복잡도 높은 작업부터 감독 강도를 높이는 적응형 분배 전략이 필요하다.
혼자 할 일을 병렬로 쪼개, AI 11명에게 동시에 시켰습니다
AI 소프트웨어 개발 수명주기(AI-SDLC)·Agentic Coding 주제로 또 하나의 실험을 했습니다. 혼자 순차적으로 할 일을 병렬로 쪼갰습니다. 그리고 각각의 AI에게 동시에 시켰습니다. 결과는 흥미로웠습니다.
대상은 프로젝트 파이프라인이었습니다. 모듈 54개, 테스트 1,426개 규모입니다. 여기에 9가지 개선을 한꺼번에 적용하고 싶었습니다.
- 지속적 통합(CI) 커버리지 · 보안 스캐닝 · 야간 엔드투엔드(E2E) 테스트
- 영문 가독성 지표 · 챕터 간 일관성 검증 · 대형 모듈 분할
- 멀티에이전트 테스트 보강 · HTML5 출력 · 에디터 피드백 루프





시간은 32% 줄었고, 시간당 처리량은 70% 늘었습니다
9개 아이템을 4개 스프린트로 나눠 병렬 실행했습니다. 혼자 하면 68분 걸릴 일이, 팀 모드로 돌리니 46분에 끝났습니다. 토큰은 15% 더 썼지만, 시간은 32% 줄었습니다.
출처: 본 실험 실측치 (스프린트 4개 합산).
산출물은 파일 30개, 코드 줄 수(LOC) 기준 +4,339/−1,704, 추가 테스트 126개였습니다. 그리고 저는 코드를 한 줄도 치지 않았습니다.
11명 중 3명은 문제를 일으켰습니다 — 자동화 85%, 감독 15%
에이전트가 반드시 성공하는 것은 아닙니다. 11명 중 3명이 문제를 일으켰습니다.
흥미로운 패턴이 보였습니다. 신규 파일 생성(CI 설정, 테스트)은 품질이 높았습니다. 크로스-모듈 리팩토링은 품질이 낮았습니다. 에이전트는 “함수를 옮겨라”는 잘하지만, “옮기면 뭐가 깨지는가”는 모릅니다.
최종 결과는 1,552개 테스트 전체 통과, 롤백 0건이었습니다. 하지만 멀티 에이전트는 100% 자동화가 아닙니다. 85% 자동화 + 15% 감독입니다. 시스템 사고는 여전히 사람 몫입니다.
“같은 파일을 건드리는가?” — 질문 하나가 병렬화의 성패를 갈랐습니다
이번 실험에서 가장 크게 느낀 것이 있습니다. 팀 모드에서 프로젝트 매니저(PM)의 역할이 완전히 달라진다는 점입니다. “이 두 아이템이 같은 파일을 건드리는가?” — 이 질문 하나가 병렬화의 성패를 갈랐습니다.
독립 파일인 CI 설정 3종은 에이전트 3명이 완벽하게 동시 처리했습니다. 반면 의존성 높은 모듈 리팩토링은, 에이전트가 만든 버그를 제가 직접 고쳐야 했습니다.
- 독립 아이템 3개 이상이면 팀 모드, 파일이 겹치면 단독 모드.
- 아이템당 50 LOC 미만이면 단독 모드 — 오케스트레이션 오버헤드가 이득을 잡아먹습니다.
- 팀 모드에서는 tmux team 방식보다 Task subagent 방식이 오류가 적었습니다. Sprint 4가 Sprint 1-3보다 안정적이었습니다.
코드를 잘 치는 것보다, 코드를 잘 나누는 것이 핵심 역량입니다
Agentic Coding에서 멀티 에이전트의 본질은 속도가 아닙니다. 태스크 분해 능력입니다. 즉 Architect/Domain/Spec 전문가가 일을 잘 쪼개면 32% 빨라집니다. 잘못 쪼개면 순환 참조를 디버깅하는 데 시간을 씁니다.
코드를 잘 치는 것보다, 코드를 잘 나누는 것. 그게 AI 시대 PM의 핵심 역량이라는 걸, 이번 실험이 숫자로 증명했습니다.
#AgenticCoding #ClaudeCode #멀티에이전트 #AISDLC #TeamMode #AIPM
시리즈 네트워크에서 이 편과 연결된 글
- B-2 · PM/PL 역할 전환
AI 시대, PO·PM·PL과 사무직의 역할이 근본부터 바뀐다 - B-3 · PM/PL 역할 전환
AI 시대, PM/PL의 역량이 근본부터 바뀌어야 하는 이유 - B-5 · PM/PL 역할 전환
Agentic 시대, PM/PL과 엔지니어는 무엇을 준비해야 하는가 - S-2 · 현장 검증
삼성전자 PMC: AI와 함께하는 PM 교육 혁신 - P-11 · AI 인물 탐구
Agentic 시대 PO·PM·PL 5-Domain 역량 통합편 - K-4 · 사고 체계
Karpathy: AI의 사고 체계를 PM에 어떻게 적용할까?
- K-1 Agentic 시대, PM의 온톨로지맵 — Obsidian을 통해 나만의 RAG를 만드는 법
- K-2 Karpathy의 LLM과 Obsidian 지식 결합
- K-3 Karpathy의 autoresearch: PM에서의 적용 사례
- K-4 Karpathy: AI의 사고 체계를 PM에 어떻게 적용할까?
- K-5 Karpathy LLM OS 시각으로 본 AX PM/PL 역량 — Claude Code 소스 교차 분석
- K-6 30시간 RAG 실측 — Karpathy llm-wiki vs obsidian-vault 양강 비교
- K-7 구글 OKF·Obsidian Vault·llm-wiki — 무엇을 어떻게 시작할까
- P-0 7인의 사고 체계 종합 프레임워크
- P-1 Karpathy: 제약 설계 + 닫힌 루프
- P-2 Sutskever: 압축이 곧 지능이다
- P-3 Hassabis: 제1원리 분해
- P-4 LeCun: 세계 모델 + 예측
- P-5 Hinton: 거버넌스 + 자기부정
- P-6 Ng: AI 전환 플레이북
- P-7 Fei-Fei Li: 인간중심 설계
- P-8 Builders 종합: Boris·Cat·Truell·Masad·Murati·Brockman
- P-9 Operators 종합: Altman·Amodei·Nadella·Pichai·Zuckerberg·Suleyman
- P-10 Hardware 양강: Jensen Huang · Lisa Su
- S-1 Agentic PM의 시대가 열리다 — LG전자 SW PM 워크숍을 마치며
- S-2 삼성전자 PMC: AI와 함께하는 PM 교육 혁신
- S-3 SKT Agent 도출을 위한 AI 퍼실리테이션 기법
- S-4 리스크는 그릇이었다 — LG전자 SW공학연구소 GenAI RISK 워크숍 NEW
- S-5 코드 한 줄 없이 손익관리팀이 만든 에이전트 — 신한EZ손해보험 NEW
- S-6 “어디까지 입력해도 되나요?” — 삼성 구매 현장의 Agentic 각성 NEW
- S-7 지금 Agentic으로 전환해야 하는 이유 — 삼성·LG·KT·Clean&Science 300여 분의 증명 NEW
- G-1 삼성전자 GAUSS PM Agent: 효과적 설계로 주니어 PM 지원하기
- G-2 주니어 PM 위한 AI 하네스 구축 가이드
- G-3 대기업 직장인을 위한 AI Agent & Skill 추천 가이드 2026
- G-4 삼성 DX 엔지니어를 위한 Codex 온보딩 — 하네스 & 개인 RAG
- A-1 AI 코딩 에이전트 시대, 거버넌스 없이 괜찮을까?
- A-2 AI가 코딩하고, AI가 관리한 1주일의 기록
- A-3 AI-SDLC 도입, 그 첫 실험의 소회
- A-4 AI 멀티 에이전트 개발 효과성 분석
- A-5 Fable 5와 보낸 첫 하루 — 모델 × 하네스 × RAG 실측 회고
- A-6 맥은 이미 AI 워크스테이션 — 사진·노트·인박스 0원 정리
- A-7 Mac@Work 2026 — 맥 20년차의 도구 모음과 Agentic 카테고리
- CC-3 Opus xhigh 솔로 vs ultracode 멀티에이전트 — 작업유형별 A/B 실측
- CC-4 내 노트 4만 개 검색 — LLM 직접 읽기 vs 전용 CLI, 하이브리드 5.5배
- CC-5 Obsidian 노트를 앱 없이 검색 — 오픈소스 byeori(벼리)
- CC-6 사내 지식을 RAG로 — 망분리·토큰0 6단계