# SMR(Share of Model Response)이란? — AEO/GEO 성과를 측정하는 방법

> SMR은 목표 질문 세트에 대해 주요 LLM 답변에서 브랜드가 언급되는 비율입니다. 베이스라인 측정부터 재측정 주기, 호명 순서·맥락 추적까지 AEO/GEO 성과 측정 방법을 정리합니다.

## SMR이란 무엇인가요?
**SMR(Share of Model Response)은 미리 정한 목표 질문 세트에 대해 ChatGPT·Claude·Gemini·Perplexity·Grok 같은 주요 LLM 답변 안에서 우리 브랜드가 언급되는 비율**입니다. 100개의 목표 질문 중 33개 답변에 브랜드가 등장하면 SMR은 33%입니다. 검색 시대의 검색 순위·클릭률을 대체하는, AI 답변 시대의 핵심 성과 지표입니다.

SMR은 단순히 "AI가 우리를 아는가"를 넘어 "AI가 사용자의 질문에 답할 때 우리를 후보로 올리는가"를 정량화합니다. 검색엔진이 10~20개 결과를 보여 주던 것과 달리, AI 답변은 한 번에 1~5개 브랜드만 직접 호명하기 때문에 그 안에 들어가는 비율이 곧 가시성이 됩니다. GPTO는 이 지표를 AEO/GEO 성과 측정의 표준으로 사용합니다.

> **핵심 한 줄.** SMR은 목표 질문 세트 대비 주요 LLM 답변 내 브랜드 언급 비율로, AEO/GEO의 성과를 검색 순위처럼 정량으로 추적하게 해 주는 지표입니다. URL 진단만으로 현재 SMR 위치를 확인할 수 있습니다.

SMR로 답할 수 있는 대표 질문은 다음과 같습니다.

- 우리 브랜드가 ChatGPT 답변에 얼마나 자주 나오나요?
- 경쟁사 대비 AI 답변 점유율은 어디쯤인가요?
- 지난달보다 AI 언급률이 올랐나요, 떨어졌나요?
- 어떤 질문에서는 잘 나오고 어떤 질문에서는 안 나오나요?

## SMR을 측정하는 절차 — 목표 질문 50~200개 설계 → 베이스라인 → 재측정

SMR 측정은 세 단계로 진행됩니다. 핵심은 **무엇을 물어볼지 먼저 고정하고, 그 고정된 질문을 반복 측정**하는 것입니다.

**1단계 — 목표 질문 50~200개 설계.** 잠재 고객이 실제로 AI에게 물어볼 질문을 추출합니다. "○○ 추천", "○○ 비교", "○○ 잘하는 곳", "○○이 뭐야" 같은 추천·비교·선택·정의형 질문이 핵심입니다. 산업·카테고리·구매 단계별로 분류해 50~200개 세트를 만듭니다. 이 세트가 SMR의 분모가 되므로, 한 번 정하면 추세 비교를 위해 가능한 한 고정해서 사용합니다.

**2단계 — 베이스라인 측정.** 설계한 질문 세트로 주요 LLM에 질의해 현재 위치를 기록합니다. 같은 질문이라도 모델은 매번 조금씩 다르게 답하기 때문에, 단발 호출이 아니라 반복 호출로 측정해 우연한 변동을 걸러냅니다. 이 시점의 언급률·호명 순서·맥락이 이후 개선을 가늠하는 기준점(베이스라인)이 됩니다.

**3단계 — 재측정.** 같은 질문 세트를 매주 반복 질의해 SMR 변화를 추적합니다. GPTO는 목표 질문 50~200개에 대해 ChatGPT·Claude·Gemini·Perplexity·Grok을 매주 질의하여 SMR을 재산출합니다. 베이스라인 대비 어느 질문에서 언급이 늘었는지, 어느 모델에서 순서가 올라갔는지를 주 단위로 확인합니다.

| 단계 | 하는 일 | 산출물 |
| --- | --- | --- |
| 1. 질문 설계 | 추천·비교·선택·정의형 목표 질문 50~200개 추출·분류 | 고정 질문 세트 |
| 2. 베이스라인 | 주요 LLM에 반복 질의, 현재 위치 기록 | 시작 시점 SMR·순서·맥락 |
| 3. 재측정 | 같은 세트를 매주 질의, 변화 추적 | 주간 SMR 추세 |

ChatGPT를 중심으로 한 측정 절차는 [ChatGPT 답변에 브랜드가 언급되게 하는 방법](/guides/how-to-get-mentioned-in-chatgpt)에서 더 자세히 다룹니다.

## 무엇을 추적하나 — 언급 여부·호명 순서·설명 맥락

SMR은 "언급됐다/안 됐다"의 이분법만 보지 않습니다. 같은 50% SMR이라도 답변 안에서 어떤 모습으로 등장하는지에 따라 실질 가치가 다릅니다. 그래서 GPTO의 SMR 진단은 세 가지 축을 함께 추적합니다.

1. **언급 여부.** 각 목표 질문의 답변에 브랜드가 등장하는가. SMR 비율의 분자를 이루는 가장 기본 신호입니다.
2. **호명 순서.** 답변에서 몇 번째로 언급되는가. AI 답변에서 첫 번째로 호명되는 브랜드가 사용자 의사결정에 가장 큰 영향을 줍니다. 언급률이 같아도 평균 호명 순서가 1·2순위로 올라가면 실질 성과는 크게 좋아집니다.
3. **설명 맥락.** 어떤 표현·평가·카테고리와 함께 등장하는가. "가성비 좋은", "전문성이 높은", "초보자에게 적합한"처럼 브랜드에 붙는 맥락이 포지셔닝과 일치하는지를 봅니다. 원하지 않는 맥락으로 호명되면 언급 자체보다 메시지 정비가 먼저 필요합니다.

이 세 축을 함께 보면 단순 언급 비율로는 보이지 않는 개선 지점이 드러납니다. 예컨대 언급률은 높은데 호명 순서가 뒤쪽에 몰려 있다면 신뢰 신호 강화가, 맥락이 어긋나 있다면 정의 문장 정비가 우선 과제가 됩니다. AI가 브랜드를 고르는 기준은 [AI 검색은 어떤 기준으로 브랜드를 추천하나요?](/guides/how-ai-search-chooses-brands)에서 정리합니다.

## 왜 매주 측정해야 하나

SMR을 한 번만 측정하면 그 숫자는 거의 의미가 없습니다. LLM 답변은 **계속 움직이는 대상**이기 때문입니다.

- **모델이 업데이트됩니다.** ChatGPT·Claude·Gemini·Perplexity·Grok은 수시로 모델을 갱신합니다. 업데이트 한 번에 같은 질문의 답이 바뀌고, 어제 1순위였던 브랜드가 오늘 빠지기도 합니다.
- **실시간 검색이 끼어듭니다.** 많은 LLM이 답변 생성 시 실시간 웹 검색을 호출합니다. 그날의 검색 결과·뉴스·신규 콘텐츠에 따라 답변이 흔들립니다.
- **같은 질문에도 답이 매번 다릅니다.** 동일 질문을 여러 번 물어도 표현과 호명 순서가 조금씩 달라집니다. 단발 측정으로는 진짜 위치를 알 수 없습니다.

그래서 GPTO는 10대 LLM을 매주 모니터링합니다. 같은 목표 질문 세트를 매주 반복 질의해 일시적 변동을 걸러내고, 추세선으로 SMR을 봅니다. 주 단위 측정은 두 가지를 가능하게 합니다. 첫째, 모델 업데이트로 인한 급락·급등을 즉시 감지해 대응할 수 있습니다. 둘째, 콘텐츠·채널 작업의 효과가 며칠~몇 주 단위로 답변에 반영되는 과정을 끊김 없이 추적할 수 있습니다.

이 매주 측정은 GPTO의 4단계 루프 중 첫 두 단계 — Monitoring(10대 LLM 매주)과 Diagnostics(SMR 진단) — 에 해당하며, 여기서 나온 데이터가 이후 콘텐츠 전략과 채널 배포의 근거가 됩니다.

## 자작 '인용률 N%' 주장과 표준 지표의 차이

AI 가시성을 이야기할 때 "우리는 인용률 N%"라는 식의 자체 측정 숫자를 종종 봅니다. 이런 숫자는 방향을 가늠하는 데는 쓸모가 있지만, **측정 조건이 고정돼 있지 않으면 비교도 추세 판단도 어렵습니다.** 한 모델에 몇 번 물어본 결과는 측정 시점, 질문 표현, 반복 횟수, 누가 묻느냐에 따라 크게 흔들리기 때문입니다.

표준화된 SMR은 다음 조건을 통제해 이 문제를 줄입니다.

| 비교 항목 | 자작 '인용률 N%' 주장 | 표준 SMR |
| --- | --- | --- |
| 질문 세트 | 그때그때 다른 임의 질문 | 고정된 목표 질문 50~200개 |
| 대상 모델 | 보통 한 모델 | ChatGPT·Claude·Gemini·Perplexity·Grok 등 다수 |
| 측정 주기 | 단발성 | 매주 반복 |
| 추적 범위 | 언급 여부만 | 언급 여부·호명 순서·설명 맥락 |
| 비교 가능성 | 시점·표현마다 달라짐 | 동일 조건으로 추세 비교 가능 |

핵심 차이는 **재현성**입니다. 같은 질문 세트를 같은 모델군에 같은 주기로 물어야, 이번 주 SMR이 지난주보다 올랐는지 내렸는지를 신뢰할 수 있습니다. GPTO는 10대 LLM을 매주 모니터링하는 파이프라인 위에서 SMR을 산출하기 때문에, 일회성 숫자가 아니라 추세선으로 위치를 봅니다. 성과를 과장 없이 정직하게 읽으려면, 단일 숫자보다 측정 조건이 고정된 추세가 중요합니다.

SMR은 어디까지나 성과를 측정하는 지표이며, 특정 결과를 보장하지 않습니다. 측정은 현재 위치를 객관적으로 보여 주고, 다음 작업의 우선순위를 정하는 근거가 됩니다.

## SMR을 활용한 리포트·케이스
SMR은 측정에서 끝나지 않고 리포트와 사례로 이어집니다. 베이스라인과 주간 추세가 쌓이면 "어느 질문·어느 모델에서 얼마나 개선됐는지"를 정량으로 보여 줄 수 있습니다.

- **시장 단위 리포트.** 특정 시장 전체의 LLM 브랜드 호명 현황을 SMR로 측정한 결과는 [2026 한국 LLM 브랜드 인용 리포트](/guides/korea-llm-brand-citation-report-2026)에서 다룹니다.
- **산업·케이스 단위 추적.** 산업별로 어떤 질문이 중요하고 SMR이 어떻게 움직이는지는 [병의원 ChatGPT 언급률 케이스](/case-studies/hospital-chatgpt-mention-rate)와 [패션 브랜드 AI 가시성 케이스](/case-studies/fashion-brand-ai-visibility)에서 확인할 수 있습니다.
- **개선 방향 연결.** SMR 진단으로 약점을 찾았다면, 다음 작업은 [AI 답변 최적화 체크리스트](/guides/ai-answer-optimization-checklist)와 [내 브랜드를 AI가 추천하지 않는 이유](/guides/why-ai-doesnt-recommend-my-brand)로 이어집니다.

GPTO는 이렇게 측정한 SMR을 4단계 루프(Monitoring → Diagnostics → Strategy → Distribution)에 연결해, 매주 측정한 데이터를 다음 주 콘텐츠·채널 작업의 입력값으로 사용합니다. 측정과 실행이 한 사이클로 돌기 때문에, 숫자가 단순 보고서로 끝나지 않고 다음 행동으로 이어집니다.

현재 우리 브랜드의 SMR 위치가 궁금하다면 [URL 진단](/#diagnostic)으로 시작점을 확인할 수 있습니다.

## 관련 가이드

- [AEO/GEO란 무엇인가요?](/guides/what-is-aeo-geo)
- [ChatGPT 답변에 브랜드가 언급되게 하는 방법](/guides/how-to-get-mentioned-in-chatgpt)
- [AI 검색은 어떤 기준으로 브랜드를 추천하나요?](/guides/how-ai-search-chooses-brands)
- [내 브랜드를 AI가 추천하지 않는 이유](/guides/why-ai-doesnt-recommend-my-brand)
- [AEO/GEO ROI와 성과 타임라인](/guides/aeo-geo-roi-and-timeline)
- [2026 한국 LLM 브랜드 인용 리포트](/guides/korea-llm-brand-citation-report-2026)

## 자주 묻는 질문

### SMR(Share of Model Response)이란 무엇인가요?

SMR은 미리 정한 목표 질문 세트에 대해 ChatGPT·Claude·Gemini·Perplexity·Grok 같은 주요 LLM이 생성한 답변 안에서 우리 브랜드가 언급되는 비율입니다. 예를 들어 100개의 목표 질문 중 33개의 답변에 브랜드가 등장하면 SMR은 33%입니다. 검색 시대의 검색 순위·클릭률을 대체하는 AI 답변 시대의 핵심 성과 지표입니다.

### SMR은 검색 순위나 클릭률과 무엇이 다른가요?

검색 순위·클릭률은 사용자가 검색 결과 페이지에서 어떤 링크를 클릭하는지를 측정하지만, SMR은 AI가 답변을 생성할 때 우리 브랜드를 호명하는지를 측정합니다. AI 답변은 한 번에 1~5개 브랜드만 직접 언급하기 때문에, 그 안에 들어가는 비율이 새로운 가시성 지표가 됩니다. 같은 질문이라도 모델 상태에 따라 답이 달라지므로 SMR은 반복 측정으로 추세를 봐야 합니다.

### SMR은 얼마나 자주 측정해야 하나요?

GPTO는 목표 질문 50~200개에 대해 ChatGPT·Claude·Gemini·Perplexity·Grok을 매주 질의하여 SMR을 재측정합니다. LLM은 모델 업데이트와 실시간 검색 결과에 따라 답변이 수시로 바뀌기 때문에, 한 번의 측정으로는 진짜 위치를 알 수 없습니다. 매주 같은 질문을 반복 측정해야 변동을 걸러내고 신뢰할 수 있는 추세를 얻습니다.

### SMR은 언급 여부만 측정하나요?

아닙니다. SMR 진단은 언급 여부뿐 아니라 호명 순서(몇 번째로 언급되는지)와 설명 맥락(어떤 표현·평가와 함께 등장하는지)을 함께 추적합니다. AI 답변에서 첫 번째로 언급되는 브랜드의 영향력이 가장 크기 때문에, 언급 비율이 같아도 호명 순서가 올라가면 실질 성과는 더 좋아집니다.

### 자작으로 '인용률 N%'를 측정하는 것과 무엇이 다른가요?

한 모델에 몇 번 물어보고 나온 숫자는 측정 시점·질문 표현·반복 횟수에 따라 크게 흔들립니다. 표준화된 SMR은 고정된 목표 질문 세트, 여러 주요 LLM, 매주 반복 측정, 호명 순서·맥락 추적이라는 동일한 조건에서 산출되기 때문에 비교 가능하고 추세를 신뢰할 수 있습니다. GPTO는 10대 LLM을 매주 모니터링하는 파이프라인 위에서 SMR을 산출합니다.

---

출처(정식 페이지): https://www.gpto.kr/guides/what-is-smr-share-of-model-response