GEO란 무엇인가: 생성형 AI가 출처를 선택하는 방식
생성형 AI가 답변을 만들 때 어떤 콘텐츠가 선택되는지의 원리를 GEO 관점에서 설명하고, AI 요약 출처로 선택되기 위한 콘텐츠 설계 방법을 정리한 글입니다.
목차
생성형 AI 시대, 왜 GEO가 필요해졌을까?
웹에 존재하는 정보의 양은 이미 사람이 모두 읽을 수 있는 수준을 넘어섰습니다.
이제 문제는 정보를 얼마나 많이 만들어내느냐가 아니라, 그중 어떤 정보가 선택되는가입니다.
생성형 AI는 이 변화를 가장 극단적으로 보여줍니다.
수많은 웹페이지를 참고할 수 있지만, 사용자에게는 단 하나의 답변만 제공해야 하기 때문입니다.
그래서 생성형 AI 환경에서의 핵심 질문은 달라졌습니다. “어떤 페이지가 검색 결과에 노출되는가”가 아니라, “어떤 정보만이 최종 답변에 남는가”가 중요해졌습니다.
이 선택 과정에서 대부분의 콘텐츠는 품질이나 신뢰도와 관계없이 걸러집니다.
AI가 한 번에 처리할 수 있는 정보에는 한계가 있고, 이미 비슷한 내용은 굳이 다시 포함할 이유가 없기 때문입니다.
이처럼 선택을 전제로 한 환경에서 등장한 개념이 GEO(Generative Engine Optimization)입니다.
GEO는 무엇을 최적화하는 개념일까?
GEO는 단순히 “AI 검색에 맞게 글을 쓰는 방법”을 말하는 것이 아니라, AI의 선택 과정 안에서 이 콘텐츠가 어떤 역할을 하는지를 설계하는 개념에 가깝습니다.
기존 SEO가 “검색 결과에서 어디에 노출될 것인가”를 다뤘다면,
GEO는 “AI가 답변을 만들 때 이 콘텐츠를 선택해야 할 이유가 있는가”를 다룹니다.
여기서 중요한 점은, AI는 상위에 노출된 모든 문서를 참고하지 않는다는 것입니다.
제한된 분량 안에서 중복되지 않고, 이미 선택된 정보와 겹치지 않으면서 새로 더해지는 내용이 있는 일부 출처만을 골라 답변을 구성합니다.
이제 콘텐츠의 기준은 “얼마나 더 잘 설명했는가”가 아니라 “이미 있는 설명과 무엇이 다른가”로 이동했습니다.
AI는 어떤 기준으로 출처를 고를까?
AI에게 가장 큰 제약은 정보의 품질이 아니라 한 번에 처리할 수 있는 정보의 분량입니다.
Google Research가 제안한 GIST(Greedy Independent Set Thresholding)는 AI가 참고할 문서를 고를 때, 왜 중복 제거와 다양성 확보가 중요한지를 설명하는 데 도움이 되는 원리입니다. 이 원리는 크게 두 가지 기준을 동시에 고려합니다.
이 기준은 다음과 같습니다.
- 이미 선택된 문서에 비해 새로운 정보가 실제로 늘어나는가
- 기존 문서들과 의미적으로 충분한 거리를 유지하는가
여기서 말하는 “정보 증가”는 문서 자체의 품질이나 분량이 아니라, 이미 구성된 답변에 이 출처가 추가되었을 때 새롭게 늘어나는 내용이 있는지를 의미합니다.
이 기준에 따라, 먼저 정보 증가가 가장 큰 문서가 선택되고, 그 문서와 의미적으로 너무 비슷한 문서들은 추가 기여가 없다고 판단되어 제외됩니다.
그래서 AI의 선택은 “가장 유명한 출처를 고르는 과정”이 아니라 “가장 덜 겹치는 출처를 남기는 과정”에 가깝습니다.
No-Go Zone은 어떻게 만들어질까?
이 과정에서 자연스럽게 발생하는 것이 흔히 말하는 No-Go Zone입니다.
이미 선택된 출처와 거의 같은 내용을 담고 있는 콘텐츠는 품질이나 신뢰도와 관계없이
AI의 선택 대상에서 제외됩니다.
AI 입장에서 해당 콘텐츠는 “이미 처리한 정보와 동일한 내용”이기 때문입니다.
중요한 점은, 이 배제가 의도적인 패널티나 정책이 아니라 선택 구조 자체에서 자연스럽게 발생하는 결과라는 점입니다.
즉, No-Go Zone은 “패널티”가 아니라 정보 증가가 발생하지 않는다는 판단의 결과입니다.
GEO 환경에서 AI가 제외하는 콘텐츠 유형
AI의 선택 구조를 기준으로 보면, 다음과 같은 콘텐츠는 AI 요약 출처로 선택되기 어렵습니다.
- 상위 문서의 흐름과 결론을 그대로 반복한 글
- 정의·배경·개념 설명에 대부분의 분량을 사용한 콘텐츠
- 결론이 기존 출처와 실질적으로 동일한 글
이 콘텐츠들은 검색 결과에서는 문제없이 노출될 수 있지만, AI 선택 과정에서는
추가적인 기여가 없는 중복 데이터로 분류됩니다.
따라서 GEO에서의 실패는 순위가 낮아서가 아니라, 선택 과정에서 기여도가 거의 발생하지 않기 때문입니다.
GEO는 무엇을 설계하는 작업일까?
GEO의 핵심은 글을 다시 쓰는 것이 아니라, 콘텐츠의 역할을 재정의하는 데 있습니다. 키워드를 바꾸거나 문장을 다듬는 작업이 아니라, 이 콘텐츠가 선택 집합 안에서 어떤 역할을 맡을지를 설계하는 작업입니다.
이를 위해 다음 질문에 답해야 합니다.
- 이 주제에서 이미 AI가 참고하고 있는 핵심 정보는 무엇인가?
- 그 정보와 겹치지 않는 새로운 정보 축은 무엇인가?
- 이 문서가 추가되었을 때, AI 입장에서 정보 증가가 실제로 발생하는가?
이 질문에 답하지 못하는 콘텐츠는 아무리 잘 작성되어 있어도 선택 단계에서 자연스럽게 제외됩니다.
AI 요약 출처로 선택되는 콘텐츠
GIST 관점에서 보면, AI 요약 출처로 선택되는 콘텐츠에는 공통적인 특징이 있습니다.
- 기존 상위 문서와 의미적으로 충분히 다르다.
- 실행 가능한 기준·조건·절차를 제시한다.
- 표, 체크리스트, 프레임워크처럼 구조화되어 있다.
- 설명이 아니라 참고 기준(reference)으로 사용될 수 있다.
한마디로, “읽히기 위한 글”이 아니라 “선택에 사용되는 글”이어야 합니다.
GEO 관점에서 콘텐츠를 설계하는 방법
실무에서 GEO 관점의 콘텐츠를 설계할 때는 다음과 같은 흐름으로 접근하는 것이 효과적입니다.
- 상위 3~5개 문서에서 반복되는 정의·설명 구간 제거
- 해당 콘텐츠에서 반드시 추가할 정보 증가 포인트 설정
- 기준·조건·절차 중심으로 콘텐츠 재구성
- AI가 요약하기 쉬운 “~해야 한다 / ~일 때는 ~다” 형태의 단정형 문장 배치
- 요약·인용이 쉬운 구조(표, 리스트)로 정리(Schema 설계)
위 흐름은 기존 SEO 리라이트 방식과는 방향이 완전히 다릅니다.
노출이 아니라 ‘선택’을 최적화한다
정리하면 다음과 같습니다.
- SEO는 검색 결과에서의 노출 위치를 최적화한다.
- GEO는 AI 답변 안에서의 출처 선택을 최적화한다.
- AI는 중복된 정보를 반복해서 사용하지 않는다.
- 이미 선택된 출처와 의미적으로 겹치는 정보는 자연스럽게 제외된다.
- GEO의 핵심은 “더 잘 쓰는 것”이 아니라 “새롭게 기여하는 것”이다.
이 관점으로 콘텐츠를 설계하면, 생성형 AI 환경에서도 AI 요약의 출처로 선택될 수 있는 위치를 확보할 수 있습니다.
By 박혜정