작동 방식
Gemini의 메모리 시스템은 압축된 장기 기억과 원시 작업 기억을 결합하는 일반적인 아키텍처를 따릅니다. 핵심적으로 Gemini는 ‘user_context’라는 대화 요약을 유지하는데, 이는 과거 대화에서 추출되어 주기적으로 업데이트되는 LLM 생성 프로필입니다. 여기에 마지막 요약 이후의 ‘최근 대화 턴’ 블록이 추가되어 실시간으로 새로운 정보를 반영하거나 압축된 프로필을 정제합니다.
구조
Gemini는 사용자 정보를 ‘user_context’라는 단일 문서에 저장하며, 이는 짧고 사실적인 글머리 기호로 구성된 유형화된 개요입니다. 이 문서는 다음과 같은 고정된 스키마 섹션으로 나뉩니다:
-
인구 통계 정보: 이름, 나이, 거주지, 학력, 직장 등
-
관심사 및 선호도: 사용하는 기술, 반복되는 주제, 장기 목표 등
-
관계: 중요한 인물
-
날짜가 있는 이벤트, 프로젝트 및 계획: 과거 역할, 여행, 진행 중인 프로젝트, 현재 집중하는 영역 등으로, 대략적인 시간과 함께 태그됩니다.
이러한 구조는 각 섹션의 ‘반감기’를 다르게 관리하여 업데이트 효율성을 높이고, 미래에 다양한 데이터 소스(계정 프로필, 캘린더, 문서 등)와 업데이트 경로를 통합할 수 있는 기반을 제공합니다.
메타데이터: 시간 및 근거
Gemini의 user_context는 각 메모리 항목에 원본 상호작용과 날짜를 가리키는 ‘근거(rationale)’를 명시적으로 포함합니다. 이는 기억이 언제, 왜 학습되었는지 추적 가능하게 하여 다음과 같은 이점을 제공합니다:
-
시간적 유효성: 과거의 의도를 현재의 상태와 구별하여 메모리의 유효성을 정확하게 해석합니다.
-
충돌 해결: 시간 스탬프를 통해 정보 업데이트 시 충돌을 합리적으로 해결합니다.
-
투명성 및 신뢰: 사용자가 ‘어떻게 아는지’ 물었을 때 정확한 출처를 제시하여 신뢰를 구축합니다.
-
간편한 삭제: 특정 대화에 연결된 메모리는 해당 대화 삭제 시 함께 제거됩니다.
단, 이러한 명시적인 메타데이터는 메모리 블록의 크기를 늘려 토큰 비용과 컨텍스트 창 사용량을 증가시키는 단점이 있습니다.
제어
Gemini는 메모리 사용 시 매우 제한적인 접근 방식을 취합니다. 기본적으로 user_context 블록은 접근 금지이며, 사용자가 “나에 대해 아는 바를 바탕으로”와 같은 명시적인 트리거 문구를 포함할 때만 개인화를 시도합니다. 이는 불필요하거나 부적절한 개인화를 방지하지만, 시스템이 예상치 못한 관련성을 찾아내는 ‘세렌디피티’의 기회를 줄입니다. 또한, 이 기능은 처리 속도가 느린 ‘Pro’ 모델에만 적용됩니다.
간결하고 확장 가능
ChatGPT나 Claude가 여러 모듈과 복잡한 규칙으로 메모리를 관리하는 것과 달리, Gemini는 모든 장기 지식을 구조화된 user_context 문서와 최소한의 최근 메시지라는 단일 아티팩트로 통합합니다. 이러한 ‘단일 진실의 원천’ 아키텍처는 시스템을 단순하고 우아하며 고도로 확장 가능하게 만듭니다.
큰 기회 손실
구글은 Gmail, Drive, Calendar, Maps, Chrome 등 광범위한 사용자 데이터를 보유하고 있어 AI 컨텍스트 측면에서 독보적인 위치에 있습니다. 기술적으로 Google Workspace 커넥터가 존재하지만, Gemini는 이러한 통합 기능을 제품의 핵심이 아닌 선택적 강화 기능으로 취급하며 소극적으로 활용합니다. 이는 개인 정보 보호 문제, 규제 압력, 또는 내부적인 신중함 때문일 수 있지만, 구글이 업계에서 가장 강력한 컨텍스트 이점을 충분히 활용하지 못하게 하는 ‘큰 기회 손실’로 평가됩니다.