2026년 3월 OpenAI는 Instant Checkout을 앞세우기보다 ChatGPT를 상품 발견과 추천 레이어로 재정의했습니다. 같은 시기 Shopify는 Agentic Plan과 Agentic Storefronts를 발표했고, Google은 UCP를 공개했습니다. 세 회사가 동시에 같은 방향을 본 것은 AI가 결제 기능이 아니라 상거래 체인 전체를 바꾸고 있다는 신호입니다.
하지만 단기 전장은 결제 버튼이 아닙니다. 소비자는 아직 AI에게 돈을 완전히 맡길 준비가 되어 있지 않고, 잘못된 구매의 책임도 모호합니다. 판매자는 자사 사이트를 우회하고 싶지 않습니다. 사이트는 브랜드 경험, cross-sell, 고객 데이터의 중심입니다.
상거래 여정을 발견, 추천, 의도, 위임, 정책 확인, 장바구니, 결제, fulfillment로 나누면 AI 침투가 가장 빠른 곳은 앞의 네 단계입니다. Shopify는 AI 검색 주문이 전년 대비 약 13배 증가했고 AI 카탈로그 검색 전환율이 일반 AI 검색의 약 2배라고 밝혔습니다.
따라서 첫 경쟁은 누가 AI 결제를 처리하느냐가 아니라 어떤 상품이 AI에게 정확히 이해되고 추천되는가입니다. Schema.org, llms.txt, Product Feed, UCP Manifest 같은 기계 소비형 데이터가 새로운 SEO의 기반이 됩니다.
UCP는 발견, ACP는 checkout 실행, AP2는 대리 결제 승인과 감사를 담당합니다. 그러나 AI가 무엇을 추천했고 사용자가 어떻게 반응했으며 사이트에서 무엇이 일어났는지는 별도 증거 레이어가 필요합니다.
시장은 L1에서 L2로 이동 중입니다. AI가 추천하고 사람이 구매하는 L1은 이미 주류입니다. AI가 장바구니를 만들고 사람이 확인하는 L2가 시작되고 있습니다. 브랜드는 L5를 상상하기 전에 L1에서 발견되고 신뢰받아야 합니다.
실무 관점에서 Agentic Commerce 성숙도와 구매 전 경쟁는 단발성 콘텐츠 과제가 아닙니다. 상품 데이터, AI 답변에서의 표현, Agent 요청, 유입 이후 행동, 주문 연결을 하나의 증거선으로 봐야 합니다. 그렇지 않으면 팀은 “AI 쪽에서 뭔가 늘고 있다”는 말 이상으로 예산과 우선순위를 결정할 수 없습니다.
또 하나 중요한 점은 과도한 단정을 피하는 것입니다. AI 검색과 Agentic Commerce 측정은 아직 성숙 중입니다. prompt sampling, referrer, server log, Shopify order는 각각 장단점이 있습니다. 여러 약한 신호를 단순히 합산하기보다 계층별 신뢰도를 명확히 두고 개선 순서를 정해야 합니다.
보강: 구매 전 체인을 운영표로 보아야 한다
실무에서 중요한 질문은 AI가 결제를 대신하느냐가 아니라 구매 전 각 단계에서 어떤 증거를 읽고 추천을 만드는가입니다. 한국 시장에서는 Naver 검색, 쇼핑 탭, 리뷰, 자사몰, 카카오 채널, 마켓플레이스가 함께 작동합니다. Agentic Commerce를 checkout 기능으로만 보면, 추천 이전에 이미 발생하는 발견과 비교의 기회를 놓칩니다.
단계 | 의미 | AI가 개입하는 방식 |
|---|---|---|
1. 발견 | 사용자가 후보 상품을 알게 됨 | AI 검색, AI 답변, 비교 질문 |
2. 추천 | AI가 특정 브랜드와 상품을 제시 | ChatGPT Shopping, Perplexity, Gemini 계열 추천 |
3. 의도 형성 | 사용자가 조건을 좁힘 | 가격, 용도, 리뷰, 배송 조건을 함께 비교 |
4. 위임 | 제한된 조건 안에서 작업을 맡김 | 예산, 사이즈, 납기 같은 boundary task |
5. 정책 확인 | 반품, 배송, 재고, 가격 확인 | Schema, Feed, FAQ, 정책 페이지를 읽음 |
6. 장바구니 | 상품과 수량을 구성 | Agent가 안을 만들고 사람이 승인 |
7. 결제 | 결제를 완료 | 현재는 대부분 사람이 직접 수행 |
8. 이행 | 배송, 교환, 고객지원 | 추적과 문의 보조 중심 |
이 구조를 보면 단기 전장은 L1과 L2입니다. 브랜드는 완전 자동 구매를 기다릴 것이 아니라, AI가 추천 근거로 사용할 수 있는 상품 사실을 먼저 정리해야 합니다. 가격이 오래됐거나, 재고가 맞지 않거나, 반품 정책이 이미지 안에만 있거나, 리뷰가 구조화되지 않으면 AI는 강한 추천을 하기 어렵습니다.
성숙도 | 현재 의미 | 브랜드 우선순위 |
|---|---|---|
L1 | AI가 추천하고 사람이 구매 | AI 답변 표현, Schema, Product Feed, 리뷰 증거 정비 |
L2 | AI가 장바구니안을 만들고 사람이 승인 | 옵션, 재고, 배송, 반품 조건을 기계가 읽게 정리 |
L3 | 조건이 있는 작업을 Agent에 위임 | 가격대, 용도, 호환성, 제외 조건 명시 |
L4 | 보충 구매와 구독을 Agent가 관리 | 권한, 주기, 취소, 예외 처리 설계 |
L5 | 수요 예측부터 이행까지 자율화 | 단기 KPI가 아니라 장기 설계로 관리 |
그래서 측정도 AI 주문 수만 보아서는 안 됩니다. Answer에서 추천됐는지, Request에서 Agent가 읽었는지, Visit으로 도착했는지, Commerce 행동이 있었는지, Attribution에서 주문과 연결됐는지를 나눠야 합니다. 그렇지 않으면 AI가 발견과 비교를 만들었는데도 마지막 클릭만 Organic이나 Direct로 보입니다.
한국 B2B 구매 의사결정에서도 같은 원리가 적용됩니다. 구매자는 처음부터 영업 문의를 남기지 않습니다. 먼저 검색하고, 비교 글을 읽고, 커뮤니티와 리뷰를 확인하고, 내부 공유용 근거를 모읍니다. AI가 이 과정의 앞단에서 후보군을 줄여 버리면, 브랜드는 세일즈 팀이 알기도 전에 shortlist에서 빠질 수 있습니다. 그래서 Agentic Commerce는 소비재 결제 기능에 국한되지 않습니다. AI가 구매 후보를 형성하는 모든 업종의 visibility 문제입니다.
운영적으로는 세 가지 질문을 매주 확인해야 합니다. 첫째, AI가 우리 상품을 설명할 때 실제 포지셔닝과 다른 표현을 쓰고 있지 않은가. 둘째, AI가 추천 근거로 사용할 수 있는 가격, 재고, 리뷰, 배송, 반품 데이터가 최신인가. 셋째, AI가 만든 방문과 보조 전환이 Direct나 Organic으로 흡수되고 있지 않은가. 이 세 질문을 분리하면 콘텐츠 팀, 데이터 팀, 퍼포먼스 팀이 같은 문제를 두고 다른 언어로 싸우는 일을 줄일 수 있습니다.
또한 커머스 팀은 Agentic Commerce를 별도 혁신 프로젝트로 떼어놓지 말아야 합니다. 상품 등록, 가격 변경, 품절 처리, 리뷰 수집, FAQ 업데이트, 배송 정책 변경이 모두 AI 추천 품질에 영향을 줍니다. 사람이 보는 상세 페이지는 그럴듯해도 feed가 오래됐거나 Schema가 얕으면 AI는 보수적으로 행동합니다. 반대로 데이터가 단단하면 브랜드 인지도가 상대적으로 낮아도 특정 조건의 추천 후보에 들어갈 가능성이 생깁니다.
그래서 첫 90일의 목표는 “AI 자동 구매 대응”이 아니라 “AI가 우리를 틀리게 읽지 못하게 하는 것”이어야 합니다. 핵심 상품 20개, 핵심 카테고리 5개, 핵심 정책 5개부터 검증하고, AI 답변에서 반복되는 오해를 수정하며, 방문과 주문 연결을 작게라도 시작하는 편이 현실적입니다.
이 접근은 단기 성과와 장기 준비를 동시에 만듭니다. 단기적으로는 AI 추천에서 빠지는 이유를 줄이고, 장기적으로는 Agent가 더 많은 실행 권한을 갖게 될 때 필요한 데이터 기반을 남깁니다. 결국 Agentic Commerce의 본질은 결제 버튼이 아니라 신뢰 가능한 상거래 증거를 누가 더 잘 제공하느냐입니다.
마지막으로, 이 작업은 마케팅만의 일이 아닙니다. 상품 운영은 feed를 책임지고, 개발은 Schema와 로그를 책임지며, 데이터 팀은 방문과 주문 연결을 책임지고, 브랜드 팀은 AI가 참고할 설명과 근거를 책임져야 합니다. 한 팀만 움직이면 체인의 한쪽만 좋아집니다. Agentic Commerce는 여러 기능을 한 줄의 증거로 묶을 때 비로소 성과가 납니다.
이 증거선이 있어야 다음 분기의 실험도 반복 가능한 학습으로 남습니다.
반대로 이 체인이 없으면 AI 추천이 좋아졌는지, feed 품질이 좋아졌는지, 사이트 전환이 좋아졌는지 구분할 수 없습니다. Agentic Commerce를 운영 과제로 보는 이유가 여기에 있습니다.
그래서 이 글의 결론은 단순합니다. 결제보다 먼저 증거를 정비해야 합니다.
이 순서가 실제 실행 순서입니다.
보강: Agentic Commerce 성숙도를 실무에서 판단하는 법
이 주제를 현장에서 다룰 때는 Agentic Commerce 성숙도를 유행어가 아니라 운영 의사결정으로 보아야 합니다. 특히 결제 전 발견, 추천, 의도 형성, 위임가 어느 팀의 책임인지, 어떤 데이터로 뒷받침되는지, 얼마나 자주 갱신되는지를 먼저 정해야 합니다. 이 부분이 모호하면 글과 FAQ를 늘려도 AI가 참고할 증거는 안정되지 않습니다.
첫 단계는 “AI가 읽을 수 있는 것”과 “사람이 화면에서 이해하는 것”을 분리하는 일입니다. 상세 페이지가 좋아 보여도 구조화 데이터, feed, 정책, 리뷰, 내부 링크가 약하면 Agent는 강하게 추천하기 어렵습니다. 반대로 대형 캠페인이 없어도 상품 데이터, 답변 증거, 유입 이후 행동가 잘 정리되어 있으면 비교형 질문에서 후보로 남을 가능성이 생깁니다.
측정도 같은 방식으로 쪼개야 합니다. 주간 리포트에서는 노출, Agent request, AI 유입 visit, 사이트 행동, 주문 연결을 따로 봅니다. 월간 리포트에서는 같은 정의로 비교 가능한 숫자만 성장으로 봅니다. 새 태그나 Edge 측정을 넣은 직후의 증가는 실제 수요 증가가 아니라 관측 범위 확장일 수 있습니다.
개선 순서도 고정해야 합니다. 먼저 AI의 오해를 줄이고, 다음으로 읽을 수 있는 데이터를 늘리고, 그다음 도착 이후 경험을 정리하며, 마지막에 매출 연결을 강화합니다. 이 순서를 지키면 단기 숫자가 흔들려도 팀은 어떤 계층을 개선하고 있는지 잃지 않습니다.
한국어 버전에서도 단순 번역은 충분하지 않습니다. Naver, Google, 커뮤니티, 리뷰, 마켓플레이스, 자사몰이 함께 작동하기 때문에 각 접점의 증거가 맞아야 합니다. AI가 한국어 질문에서 브랜드를 설명할 때 실제 포지셔닝과 가격, 배송, 반품 조건을 틀리지 않는 것이 기본입니다.
FAQ
Q1: 기존 전자상거래와 무엇이 다른가요?
A: B2C 위에 B2A 계층이 추가됩니다. 브랜드는 사람뿐 아니라 AI Agent가 읽는 데이터를 제공해야 합니다.
Q2: 왜 Instant Checkout이 중심이 아닌가요?
A: 신뢰, 책임, 판매자 인센티브가 아직 맞지 않습니다.
Q3: 브랜드는 무엇부터 해야 하나요?
A: Schema, Product Feed, llms.txt를 정비하고 AIAA 계층으로 AI 기여를 측정해야 합니다.
Q4: 현재 단계는 어디인가요?
A: L1에서 L2로 넘어가는 단계입니다.