1. 2단계 메모리 아키텍처 (Two-Tier Memory Architecture)
HTM은 인간의 뇌가 정보를 처리하는 방식과 유사하게 설계되었습니다. 시스템은 크게 두 가지 계층으로 나뉩니다. 첫째, ‘워킹 메모리’는 LLM이 즉시 접근할 수 있는 토큰 제한적인 활성 컨텍스트 영역으로, 실시간 대화나 작업의 흐름을 유지하는 데 최적화되어 있습니다. 둘째, ‘장기 메모리’는 PostgreSQL 데이터베이스를 기반으로 하여 대규모 정보를 영구적으로 저장합니다. 이 두 계층은 상호 보완적으로 작동합니다. 워킹 메모리 내의 공간이 부족해지면, 시스템은 자동으로 중요도가 낮은 기억을 장기 메모리로 옮기는 ‘축출(Eviction)’ 프로세스를 수행하여 메모리 효율성을 극대화합니다.
2. 절대 잊지 않는 철학 (Never-Forget Philosophy)
이 시스템의 핵심 원칙 중 하나는 사용자가 명시적으로 삭제를 요청하지 않는 한 어떠한 정보도 유실되지 않는다는 것입니다. 모든 기억 데이터는 기본적으로 장기 저장소에 무기한 보관됩니다. 워킹 메모리에서 데이터가 빠져나가더라도 이는 삭제가 아닌 이동으로 처리됩니다. 실제 데이터 삭제를 위해서는 forget() 메서드를 호출해야 하며, 이마저도 기본적으로는 복구가 가능한 ‘소프트 삭제(Soft Delete)’ 방식을 채택하고 있습니다. 완전한 영구 삭제를 위해서는 별도의 확인 매개변수가 필요하며, 모든 메모리 조작 과정은 감사 추적이 가능하도록 기록됩니다.
3. 고급 RAG 및 하이브리드 검색 기술
HTM은 효율적인 정보 검색을 위해 다각적인 접근 방식을 취합니다. pgvector를 활용한 벡터 유사도 검색은 문장의 의미적 맥락을 파악하여 가장 관련성 높은 기억을 추출합니다. 이와 동시에 PostgreSQL의 전체 텍스트 검색 기능을 결합한 ‘하이브리드 검색’ 전략을 사용하여 키워드 기반의 정확도까지 확보합니다. 또한 ‘지난주’, ‘어제’와 같은 자연어 표현을 이용한 시간적 필터링을 지원하여, 특정 시점의 정보를 손쉽게 찾아낼 수 있습니다. 중요도 점수(Importance Scoring) 시스템은 수많은 기억 중에서도 가장 핵심적인 정보를 우선적으로 선별할 수 있게 해줍니다.
4. 집단 지성 및 의사 지식 그래프 (Multi-Robot & Knowledge Graph)
HTM은 단일 AI 에이전트를 넘어 다수의 로봇이 정보를 공유하는 ‘하이브 마인드’ 기능을 지원합니다. 모든 로봇은 전역 장기 메모리에 접근할 수 있으며, 어떤 로봇이 언제 어떤 발언을 했는지에 대한 메타데이터가 함께 관리됩니다. 이를 통해 여러 에이전트 간의 대화 연속성을 보장합니다. 또한, 계층적 분류 체계를 통해 기억 간의 복잡한 관계 네트워크를 구축하는 ‘의사 지식 그래프’ 기능을 제공합니다. 최대 4단계의 추상화 수준을 지원하는 태그 시스템을 통해 기억을 체계적으로 범주화하고 탐색할 수 있습니다.
5. 아키텍처 구성 요소 및 개발자 편의성
HTM은 Ruby 생태계와의 완벽한 조화를 목표로 합니다. RubyLLM 라이브러리를 통해 Ollama, OpenAI, Anthropic, Gemini, Azure, Bedrock, DeepSeek 등 현존하는 대부분의 LLM 제공업체와 연동될 수 있습니다. 개발자는 간단한 설정만으로 임베딩 모델과 태그 생성 모델을 지정할 수 있으며, remember, recall, assemble_context와 같은 직관적인 API를 통해 복잡한 메모리 관리 로직을 구현할 수 있습니다. 또한 사실, 문맥, 코드, 선호도, 결정사항 등 다양한 메모리 유형을 지원하여 데이터의 성격에 맞는 최적화된 처리가 가능합니다.