많은 기업은 AI 유입 측정을 브라우저 JavaScript에서 시작합니다. 올바른 출발점입니다. AI referrer에서 온 사람 방문을 식별하고, 체류와 전환을 볼 수 있습니다. 하지만 거기서 멈추면 AI 활동의 상당 부분을 놓칩니다.
AI crawler는 JavaScript를 실행하지 않는 경우가 많습니다. 서버 측 agent fetch는 브라우저 세션을 만들지 않습니다. MCP나 API를 통한 데이터 접근은 일반 웹 분석에 나타나지 않습니다. JS는 중요하지만 AI 가시성의 끝은 아닙니다.
L0: 플랫폼 기준선
GA4, GSC, 광고 플랫폼만 보는 단계입니다. 사람 방문과 검색 수요 일부는 보이지만 AI 에이전트가 어떤 페이지를 읽었는지는 거의 보이지 않습니다. 출발점으로는 충분하지만 전체 그림은 아닙니다.
L1: 퍼스트파티 JS
자사 도메인에서 동작하는 JS를 배포하면 AI referrer, 방문자 행동, 페이지뷰, 폼 제출, 구매 전 행동을 더 정확히 볼 수 있습니다. CitationGraph 같은 1st-party 데이터가 여기서 의미를 갖습니다. 다만 JavaScript를 실행하지 않는 AI는 여전히 보이지 않습니다.
L1.5: Edge Lite Bridge
CDN이나 Edge에서 요청을 가볍게 관측하면 GPTBot, ClaudeBot, PerplexityBot, ChatGPT-User 같은 접근을 브라우저 이전 단계에서 잡을 수 있습니다. 이 단계는 투자 대비 효과가 큽니다. JS로 보이지 않던 Request 계층이 보이기 때문에 AIAA가 갑자기 늘 수 있습니다. 하지만 그것은 AI가 갑자기 늘어난 것이 아니라 측정 범위가 넓어진 것일 수 있습니다.
L2: 관리형 로그 연결
Cloudflare, Vercel, Shopify, 서버 access logs를 지속적으로 수집하는 단계입니다. 어떤 에이전트가 어떤 path를 얼마나 자주 읽었고 어떤 status code를 받았는지 볼 수 있습니다. GEO, SEO, 보안, 인프라가 같은 데이터를 놓고 대화할 수 있게 됩니다.
L3: 엔터프라이즈 텔레메트리
OpenTelemetry GenAI span, MCP tool call, API audit, checkout이나 payment authorization까지 연결하는 단계입니다. 모든 기업이 처음부터 필요로 하지는 않습니다. 그러나 AI agent가 실제 업무 API와 거래 흐름에 관여하면 감사 가능한 실행 체인이 필요해집니다.
Evidence Ladder의 핵심은 각 단계가 서로 다른 질문에 답한다는 점입니다. JS는 사람 방문을 봅니다. Edge는 에이전트 요청을 봅니다. 로그는 전체 요청 지도를 만듭니다. 텔레메트리는 실행 체인을 보여줍니다. 이를 하나의 “AI 트래픽”으로 합치지 말고 증거 수준으로 관리해야 합니다.
레벨 | 보이는 AI 활동 | 새로 보이는 AIAA 계층 | 첫 도입 시 증가 |
|---|---|---|---|
L0 | 5-10% | Visit 일부, Commerce 일부 | 기준선 |
L1 | 8-15% | Visit 강화 | Visit가 30-80% 늘 수 있음 |
L1.5 | 25-45% | Request | 총 활동이 200-500% 뛸 수 있음 |
L2 | 40-65% | Request 강화 | Request가 20-40% 늘 수 있음 |
L3 | 75-95% | Answer, Attribution | 처음으로 전체 그림에 가까워짐 |
이 표에서 중요한 점은 증가를 곧바로 성장으로 해석하지 않는 것입니다. L1.5를 붙이면 AI 활동이 몇 배로 보일 수 있습니다. 하지만 그것은 AI가 갑자기 몇 배 늘었다기보다, 브라우저 JS가 보지 못하던 Request 계층이 보이기 시작했다는 뜻일 수 있습니다. 경영 보고에서는 이 증가를 Coverage Expansion으로 분리해야 합니다.
실무에서는 L0에서 L3까지 한 번에 갈 필요가 없습니다. 먼저 GA4/GSC와 기존 로그로 기준선을 만들고, first-party JS로 사람 방문을 안정적으로 봅니다. 그다음 Edge Lite로 AI 에이전트 요청을 잡고, 마지막으로 필요한 기업만 OpenTelemetry, MCP tool call, API audit까지 갑니다. 각 단계에서 새로 보이기 시작한 증거가 무엇인지 기록하는 것이 핵심입니다.
이 순서를 지키면 AI visibility 개선을 오해하지 않습니다. Request가 늘었다면 기술적 관측 범위가 넓어진 것일 수 있습니다. Visit가 늘었다면 사람의 반응이 늘어난 것입니다. Commerce가 늘었다면 구매 의도에 가까워진 것입니다. Attribution이 늘었다면 매출 설명에 가까워진 것입니다. Evidence Ladder는 AI 증가를 한 숫자로 포장하지 않고 어떤 증거가 늘었는지 읽게 해 줍니다.
한국 기업에서 이 프레임이 중요한 이유는 AI 측정이 마케팅 팀만의 일이 아니기 때문입니다. GA4를 보는 analytics 팀, GSC와 콘텐츠를 보는 SEO 팀, CDN과 WAF를 관리하는 인프라 팀, Shopify나 커머스 플랫폼을 운영하는 팀, CRM과 영업 데이터를 보는 팀이 각각 다른 화면을 봅니다. AI 에이전트 활동은 이 경계를 넘나듭니다. 그래서 모든 것을 하나의 도구 숫자로 합치는 것보다, 증거의 계단을 만들고 현재 어느 단계까지 보이는지 공유하는 편이 현실적입니다.
예를 들어 어떤 달에 Edge Lite를 도입해 GPTBot과 ClaudeBot 요청이 대량으로 보이기 시작했다고 합시다. 이는 중요한 진전입니다. 하지만 그 숫자를 그대로 “AI 수요가 500% 성장했다”고 말하면 오해입니다. 더 정확한 표현은 “Request 계층의 관측 범위가 넓어져 이전에는 보이지 않던 AI agent activity를 볼 수 있게 됐다”입니다. 그다음 달부터 같은 관측 조건으로 comparable growth를 추적해야 합니다.
L3를 서둘러야 하는 기업과 그렇지 않은 기업도 구분해야 합니다. AI가 아직 페이지를 읽고 사용자를 보내는 단계라면 L1과 L1.5만으로도 충분할 수 있습니다. 하지만 AI agent가 재고 확인, 가격 조회, 견적, checkout, API 작업에 관여하기 시작하면 OpenTelemetry와 MCP tool call 감사가 필요해집니다. Evidence Ladder는 기능 목록이 아니라 AI가 비즈니스 프로세스 어디까지 들어왔는지에 따른 투자 순서입니다.
Gravity가 이 계단을 강조하는 이유는 AI visibility를 단순한 “보인다/안 보인다”로 끝내지 않기 위해서입니다. 보이는 것이 Answer인지, Request인지, Visit인지, Commerce인지에 따라 다음 액션이 달라집니다. 콘텐츠를 고칠지, 로그를 연결할지, 상품 정보를 정리할지, 주문 연결을 만들지 결정해야 합니다. Evidence Ladder는 그 판단을 감이 아니라 증거 수준으로 하게 만듭니다.
도입 순서를 정할 때는 먼저 지금 의사결정에 필요한 최소 증거가 무엇인지 봐야 합니다. 경영진에게 AI 매출을 보고하려면 Attribution에 가까운 데이터가 필요합니다. GEO 실행의 초기 효과를 보고 싶다면 Answer와 Request만으로도 의미가 있을 수 있습니다. 사이트 개선을 하려면 Visit와 Commerce를 봐야 합니다. 목적이 다르면 필요한 레벨도 다릅니다.
많은 한국 기업은 처음부터 L3를 만들기보다 L1과 L1.5를 안정화하는 것이 현실적입니다. AI referrer에서 온 사람을 식별하고, AI Agent가 읽는 페이지를 파악하고, 상품, FAQ, 가격, 사례, 비교 페이지 중 어디에 관심이 몰리는지 봅니다. 이것만으로도 콘텐츠 개선과 GEO 우선순위는 크게 달라집니다. 여기에 상업 이벤트와 주문 연결을 더하면 AI가 단순 visibility를 넘어 사업 기회에 가까워지는지 알 수 있습니다.
또 하나의 실무 포인트는 보안과 인프라 팀과의 합의입니다. 모든 AI bot을 막으면 데이터 보호 측면에서는 편하지만 AI readability와 GEO 기회를 잃을 수 있습니다. 반대로 모두 허용하면 불필요한 부하와 scraping 리스크가 커집니다. Evidence Ladder는 어떤 agent를 관측하고, 어떤 agent를 허용하고, 어떤 접근을 제한할지 마케팅과 인프라가 같은 데이터로 논의하게 해 줍니다.
첫 90일 기준으로 보면 1단계는 L0와 L1 점검입니다. GA4, GSC, 광고 관리자, 기존 이벤트, 폼, 주문 데이터의 정의를 맞춥니다. 2단계는 L1.5로, Edge에서 bot 판정, user-agent, IP, path, status code를 저장합니다. 3단계는 L2로, Cloudflare, Vercel, Shopify, 서버 로그를 지속적으로 통합합니다. 이 순서라면 과도한 시스템 투자 없이 AI 시대에 필요한 증거를 늘릴 수 있습니다.
각 단계의 도입 월에는 반드시 주석을 남겨야 합니다. “이번 달 Edge 관측을 추가했기 때문에 Request가 증가했다”, “이번 달 Shopify 이벤트를 추가했기 때문에 Commerce가 증가했다”처럼 기록합니다. 그래야 나중에 숫자를 보는 사람이 시장 성장과 측정 개선을 혼동하지 않습니다. Evidence Ladder는 측정 투명성을 지키는 운영 규칙이기도 합니다.
FAQ
Q1: 왜 JS만으로는 부족한가요?
A: 많은 AI crawler와 server-side fetch는 JavaScript를 실행하지 않기 때문입니다.
Q2: 무엇부터 도입해야 하나요?
A: 대부분의 팀은 퍼스트파티 JS와 Edge 관측부터 시작하는 것이 현실적입니다.
Q3: Edge 도입 후 지표가 급증하면 성장인가요?
A: 아닐 수 있습니다. 측정 범위가 넓어진 Coverage Expansion Lift일 수 있습니다.
Q4: L3는 언제 필요한가요?
A: AI agent가 tool call, checkout, payment, 업무 API에 관여할 때 필요합니다.
Q5: Gravity의 관점은 무엇인가요?
A: 각 단계의 증거를 분리하고 AIAA로 연결해야 한다는 것입니다.