
2026년 상반기, AI 에이전트의 세계에서는 두 개의 곡선이 벌어졌습니다. 능력은 가파르게 치솟았고, 조직이 이를 받아내는 속도는 완만했습니다. 이 글은 그 격차의 정체를 애널리스트 4사의 실측과 국내 11개 기업 현장 데이터로 풀고, 하반기에 리더가 무엇을 해야 하는지까지 도식으로 안내합니다.
① 능력은 앞서고, 조직은 못 따라갑니다. 새 모델이 78일에 7종 쏟아지고 에이전트가 하루치 일을 혼자 처리하기 시작했지만, 기업에서 ‘진짜 에이전트’로 일하는 곳은 여섯 곳 중 한 곳(16%)뿐입니다.
② 이긴 자산은 모델이 아니라 그 주변입니다. 모델은 갈아 끼우는 부품이 됐고, 진짜 경쟁력은 일하는 규칙(하네스)과 우리 회사 지식(검색 증강 생성, RAG), 그리고 검증하는 습관에 쌓입니다.
③ 하반기 승부처는 ‘검증하며 쓰는 조직’입니다. 유럽 규제 시계가 돌기 시작하고 가트너는 에이전트 프로젝트 열 중 넷의 취소를 예고했습니다 — 빨리 쓰는 조직이 아니라, 검증하며 쓰는 조직이 살아남습니다.
상반기를 한 장으로 — 벌어진 두 곡선
올해 상반기를 딱 한 문장으로 줄이면 이렇습니다. “능력의 문제는 끝나가고, 흡수의 문제가 시작됐다.” AI가 무엇을 할 수 있느냐보다, 조직이 그걸 어떻게 소화하느냐가 진짜 병목이 됐다는 뜻입니다.
왼쪽(파란색)은 기술이 얼마나 멀리 갔는지, 오른쪽(회색)은 조직이 실제로 얼마나 따라왔는지입니다. 이 두 막대의 길이 차이 — 그것이 2026년 상반기의 진짜 그림입니다. 아래에서 이 격차가 왜 생겼고, 그래서 무엇을 해야 하는지 하나씩 풀겠습니다.
지금 무슨 일이 벌어지고 있나
먼저 큰 그림을 숫자로 잡아 보겠습니다. 어려운 용어는 잠시 접어 두고, 여섯 개의 숫자만 기억하면 충분합니다.
참고로 ‘진짜 에이전트’와 ‘자동화’의 차이는 이렇습니다. 정해진 버튼을 순서대로 누르는 건 자동화이고, 목표만 주면 스스로 계획을 세우고 도구를 골라 쓰고 막히면 방법을 바꾸는 것이 에이전트입니다.
시장에 ‘AI 에이전트’라는 이름을 붙인 제품은 수천 개지만, 가트너는 그중 실제로 그렇게 작동하는 건 약 130곳뿐이라고 지적했습니다. 이름만 에이전트인 ‘에이전트 워싱(agent washing)’이 그만큼 많다는 뜻입니다.
기술은 앞서고, 조직은 왜 못 따라가나
기술(Technical) 쪽부터 보겠습니다. 상반기에 스택(기술 층위)의 무게중심이 통째로 이동했습니다. 예전에는 “어떤 모델을 쓰느냐”가 승부였다면, 이제는 “모델 주변을 어떻게 설계하느냐”가 승부입니다.
핵심은 이겁니다. 모델(①)은 부품이 됐고, 진짜 자산은 아래 세 층(②③④)에 쌓입니다. 이건 이론이 아니라 현장에서 확인된 사실입니다. 새 모델로 교체한 당일 실측에서도 결론은 같았습니다 — “모델은 바뀌어도, 하네스와 지식(RAG)은 남는다.”
비즈니스 쪽에서 격차가 보이는 이유
돈(Business)은 분명히 몰리고 있습니다. 기업 AI 지출은 1년 새 3.2배로 늘었습니다. 그런데 왜 ‘진짜 에이전트’는 16%뿐일까요? 세 가지 벽 때문입니다.
| 벽 | 무슨 문제인가 | 근거 |
|---|---|---|
| ① 파일럿의 벽 | 시범 사업은 많은데 실제 손익(P&L)으로 이어지는 비율이 낮음. “해 봤다”에서 멈춤 | MIT 계열 보고 논쟁 · 가트너·포레스터 |
| ② 검증의 벽 | AI가 “다 했습니다”라고 해도 그 결과를 믿고 쓸 검증 체계가 없음. 그래서 못 맡김 | Forrester(실작동 15% 미만) |
| ③ 거버넌스의 벽 | 보안·책임·규제를 감당할 관리 체계 미비 — 성숙한 곳이 21%뿐 | Deloitte State of AI 2026 |
기획·프로젝트·운영은 어떻게 바뀌나
가장 궁금한 대목일 겁니다. “그래서 내 일은 어떻게 바뀌나?” 좋은 소식부터. 상반기 실측에서 대량 실업 신호는 나오지 않았습니다. 데이터가 가리키는 건 ‘대체’가 아니라 ‘증강’입니다 — 사람이 AI와 더 많이 주고받으며 산출을 늘리는 그림입니다. 다만 한 곳, 사회초년생(22~25세)의 신규 채용은 실제로 둔화됐습니다. 대체는 평균이 아니라 ‘입구’라는 가장자리에서 먼저 시작됐습니다.
직무별로 무엇이 바뀌는지 세 장면으로 나눠 보겠습니다.
- 요구사항을 며칠에 걸쳐 손으로 정리
- 자료 취합·구조화에 시간 소진
- 문서 완성 = 성과
- AI가 취합·구조화·초안, 사람은 우선순위·이해관계자 조율
- 병목이 ‘작성 시간’→’요구의 검증 가능성’으로 이동
- 측정 가능한 수용 기준 = 성과
- 일정·산출물·추적표를 직접 작성
- 산출물 제작자로서의 PM
- 골격은 AI에 위임, 통합·리스크 판단은 사람
- “다 했습니다”에 실물을 되묻는 검증이 핵심 업무로
- 위임·검증·통합의 오케스트레이터로서의 PM
- 브리핑·리마인드·데이터 정합성 점검을 수작업
- 사람이 모든 승인 단계를 직접
- 반복 업무는 에이전트가 처리(ROI 최속 구역)
- 중요 결정은 사람이 승인(HITL), 일상은 사람이 감독(HOTL)
- 승인이 ‘고무도장’이 되지 않게 불시 재점검
하반기와 1~2년, 무엇이 올까
예측은 조심스럽게 하겠습니다. 지난 몇 년간 ‘AI 능력’ 예측은 대체로 맞았지만, ‘언제 얼마나 도입되느냐’ 예측은 번번이 과장됐기 때문입니다. 그래서 확정된 일정(사실)과 전망을 나눠서 보겠습니다.
먼저, 이미 정해진 일정
규제 관점에서 오해하기 쉬운 부분을 짚겠습니다. 유럽의 ‘고위험’ 의무는 2027년 12월로 미뤄졌지만, ‘AI가 만든 것임을 표시하라’는 투명성 의무는 예정대로 8월 2일 발효됩니다. 유럽에 서비스하는 기업이라면 하반기가 대응 시작점입니다.
다음, 1~2년 시나리오
단정하지 않고 세 갈래로 나눕니다. 각 시나리오에는 ‘이게 현실이 되는지 지켜볼 신호’를 함께 답니다.
신호: 작업 시간지평 배증 주기 유지 여부
신호: ‘진짜 에이전트’ 비율·거버넌스 성숙도 추이
신호: 대형 IT기업 투자 가이던스·AI 매출 성장률
그래서 이번 분기, 리더는 무엇을 해야 하나
가장 중요한 부분입니다. 위의 진단을 ‘이번 90일에 할 일’ 여섯 가지로 옮겼습니다. 큰 예산이나 조직 개편 없이 시작할 수 있는 것부터 담았습니다.
반대로, 하지 말아야 할 것도 분명합니다. 상반기 실패 사례에서 뽑은 반면교사입니다.
- 파일럿마다 손익 연결 가설을 먼저 세운다
- 자사 업무 기반 평가셋으로 도구를 고른다
- 반복 업무부터 에이전트화(효과 최속)
- 검증 통과율을 팀 성과 지표에 넣는다
- 파일럿만 무한정 늘리기(95% 실패 논쟁의 실체)
- ‘AI 도입률’을 성과로 착각하기(680배 격차의 함정)
- 사람 승인을 면책용 도장으로 쓰기
- 벤치마크 점수만 보고 도구 선정하기(실무 격차 큼)
- 모델 교체를 전략으로 착각하기
올해, 우리는 Agentic 급변을 현장에서 봤다
지금까지는 세계의 그림이었습니다. 이번엔 저희가 직접 현장에서 목격한 변화입니다. 2026년 상반기, 국내 대기업·기관 11곳에서 누적 341명과 Agentic 워크숍을 진행하며 이 변화를 눈으로 확인했습니다.
도메인은 제조에서 금융, 공공, 자동차, 보안까지 넓어졌습니다. 그런데 같은 엔진이 반복 확인됐습니다 — ‘일머리 × Agentic × 하네스·RAG’. 도메인이 바뀌면 규율의 무게중심만 이동했습니다(자동차는 안전, 금융은 정확성, 공공은 근거). 상반기 현장에서 뽑은 세 가지 반복 관측을 요약합니다.
| 관측 | 무엇을 봤나 |
|---|---|
| 자료가 곧 품질 | 같은 도구인데 결과가 갈렸습니다. 차이는 각자 쌓은 하네스와 지식(RAG)의 두께였습니다. 한 제조사 회고에는 “결과가 부실했던 건 AI가 약해서가 아니라 내 자료를 아직 붙이지 못해서”가 네 번 반복됐습니다. |
| 비서는 조립된다 | 실무자들이 만든 AI 비서를 기능 단위로 쪼개니 재사용 블록 12종으로 정리됐고, 상위 6개가 쓰임의 77%였습니다. 통신·금융·제조 현장에서 같은 블록이 재현됐습니다 — 비서는 짓는 게 아니라 조립하는 것. |
| 검증이 새 일이 됐다 | 한 보안 기업 실습에서 AI가 “다 했습니다”라고 요약했지만 실물이 없었습니다. 되물어 실물(추적표 240행)을 받아내는 장면이 그날 최고의 교보재였습니다 — 검증이 PM의 새 핵심 업무가 됐습니다. |
세계의 데이터(Part 1~5)와 우리 현장(Part 6)이 같은 곳을 가리킵니다. 모델이 아니라 하네스×지식×규율이 자산이고, 검증하며 쓰는 조직이 이긴다는 것. 상반기 내내, 애널리스트 리포트와 워크숍 회고가 같은 문장에서 만났습니다.
속도가 아니라, 방향이다
2026년 상반기가 우리에게 남긴 교훈은 역설적입니다. AI가 이렇게 빨라진 반기에, 승부를 가른 건 속도가 아니라 방향이었습니다. 더 빨리 도입한 조직이 아니라, 우리 지식을 정리하고 검증하며 사람이 쥐는 지점을 명시한 조직이 앞서 나갔습니다. 하반기에도 새 모델은 계속 나올 겁니다. 하지만 부품이 좋아진다고 자동차가 완성되지는 않습니다. 남는 것을 쌓으세요 — 지식, 검증, 그리고 사람. 그것이 어느 미래가 오든 후회 없는 투자입니다.
- K-1 Agentic 시대, PM의 온톨로지맵 — Obsidian을 통해 나만의 RAG를 만드는 법
- K-2 Karpathy의 LLM과 Obsidian 지식 결합
- K-3 Karpathy의 autoresearch: PM에서의 적용 사례
- K-4 Karpathy: AI의 사고 체계를 PM에 어떻게 적용할까?
- K-5 Karpathy LLM OS 시각으로 본 AX PM/PL 역량 — Claude Code 소스 교차 분석
- K-6 30시간 RAG 실측 — Karpathy llm-wiki vs obsidian-vault 양강 비교
- K-7 구글 OKF·Obsidian Vault·llm-wiki — 무엇을 어떻게 시작할까
- K-8 Obsidian × LLM 4만 노트 — 개인 RAG 최종 아키텍처 5층 NEW
- K-9 PM 온톨로지맵 템플릿 배포판 — 30분에 채우는 5칸 NEW
- P-0 7인의 사고 체계 종합 프레임워크
- P-1 Karpathy: 제약 설계 + 닫힌 루프
- P-2 Sutskever: 압축이 곧 지능이다
- P-3 Hassabis: 제1원리 분해
- P-4 LeCun: 세계 모델 + 예측
- P-5 Hinton: 거버넌스 + 자기부정
- P-6 Ng: AI 전환 플레이북
- P-7 Fei-Fei Li: 인간중심 설계
- P-8 Builders 종합: Boris·Cat·Truell·Masad·Murati·Brockman
- P-9 Operators 종합: Altman·Amodei·Nadella·Pichai·Zuckerberg·Suleyman
- P-10 Hardware 양강: Jensen Huang · Lisa Su
- X-1 AI/AX 2030 전략: McKinsey, BCG, Accenture, Deloitte, Gartner 교차 분석
- X-2 빅테크 리더십 격변과 AX 전략
- X-3 2026년 GitHub에서 주목할 프로젝트와 AI 전환 신호
- X-4 AI 에이전트 2026 상반기 대해부 — 지금 무슨 일이, 리더는 무엇을 NEW
- W-1 Agentic 월간 관전포인트 2026-05 — 가우스+빅테크 듀얼 모델 시대 NEW
- W-2 Agentic 2026 상반기 총결산 — 다섯 축 6개월 NEW
- E-1 AI 네이티브 기업 전환 — CHO·PMO 재정의
- E-2 한국 기업 AX 2030 (Capstone)
- S-1 Agentic PM의 시대가 열리다 — LG전자 SW PM 워크숍을 마치며
- S-2 삼성전자 PMC: AI와 함께하는 PM 교육 혁신
- S-3 SKT Agent 도출을 위한 AI 퍼실리테이션 기법
- S-4 리스크는 그릇이었다 — LG전자 SW공학연구소 GenAI RISK 워크숍 NEW
- S-5 코드 한 줄 없이 손익관리팀이 만든 에이전트 — 신한EZ손해보험 NEW
- S-6 “어디까지 입력해도 되나요?” — 삼성 구매 현장의 Agentic 각성 NEW
- S-7 지금 Agentic으로 전환해야 하는 이유 — 삼성·LG·KT·Clean&Science 300여 분의 증명 NEW
- S-8 공공 PM이 ‘AI 이용자’에서 ‘AI 활용자’로 — 아이티센 편 NEW
- S-9 ‘바이브 프로젝트 매니징’을 스스로 이름 붙였습니다 — 현대모비스 편 NEW
- S-10 “대충 시키면 다 해줄 줄 알았는데” — SK쉴더스 보안 PM들의 이틀 NEW
- G-1 삼성전자 GAUSS PM Agent: 효과적 설계로 주니어 PM 지원하기
- G-2 주니어 PM 위한 AI 하네스 구축 가이드
- G-3 대기업 직장인을 위한 AI Agent & Skill 추천 가이드 2026
- G-4 삼성 DX 엔지니어를 위한 Codex 온보딩 — 하네스 & 개인 RAG
- G-5 나의 Agent 비서, 블록 12개로 조립한다 — 재사용 블록과 77%의 법칙 NEW
- A-1 AI 코딩 에이전트 시대, 거버넌스 없이 괜찮을까?
- A-2 AI가 코딩하고, AI가 관리한 1주일의 기록
- A-3 AI-SDLC 도입, 그 첫 실험의 소회
- A-4 AI 멀티 에이전트 개발 효과성 분석
- A-5 Fable 5와 보낸 첫 하루 — 모델 × 하네스 × RAG 실측 회고
- A-6 맥은 이미 AI 워크스테이션 — 사진·노트·인박스 0원 정리
- A-7 Mac@Work 2026 — 맥 20년차의 도구 모음과 Agentic 카테고리
- CC-3 Opus xhigh 솔로 vs ultracode 멀티에이전트 — 작업유형별 A/B 실측
- CC-4 내 노트 4만 개 검색 — LLM 직접 읽기 vs 전용 CLI, 하이브리드 5.5배
- CC-5 Obsidian 노트를 앱 없이 검색 — 오픈소스 byeori(벼리)
- CC-6 사내 지식을 RAG로 — 망분리·토큰0 6단계