SendCheckIt은 이메일 마케터들을 위한 도구로, 가장 인기 있는 기능은 이메일 제목 라인 테스터입니다. 이 도구는 가독성, 스팸 트리거, 길이, 감정 등 여러 요소를 기반으로 제목을 평가하지만, 새로운 제목을 제안하는 기능은 없었습니다. 비용 문제로 AI 기능 도입을 주저하던 중, Chrome에 Gemini Nano 모델이 내장되면서 브라우저 내 AI 솔루션에 주목하게 되었습니다.
Gemini Nano 구현 시 고려사항
-
다양한 모델, 제어 불가: 개발자가 특정 Nano 모델을 선택할 수 없으며, 내부 벤치마크에 따라 결정됩니다.
-
대용량 다운로드 (프로필별): 모델 파일은 약 1.5~2GB이며, 사용자 프로필 디렉토리에 저장됩니다.
-
주문형 다운로드: 모델은 웹사이트에서 처음 요청할 때 한 번만 다운로드됩니다.
-
비동기 백그라운드 다운로드: 다운로드는 페이지 로드와 독립적으로 백그라운드에서 진행됩니다.
-
빠른 변화: 관련 문서가 불완전하며 빠르게 변경됩니다.
대체(Fallback) 전략
Gemini Nano를 사용할 수 없는 경우, OpenRouter를 통해 제공되는 Google Gemma 3N 모델을 대체로 사용합니다. Gemma 3N은 Nano보다 더 큰 파라미터 수(6B vs 1.8B)와 긴 컨텍스트 윈도우(32K vs 6K)를 가지며, 비용이 들지 않습니다. 이는 최신 프론티어 모델이 아닌 경우 서버 기반 AI 추론이 매우 저렴하거나 무료일 수 있음을 시사합니다.
실제 적격성 및 성능
2026년 1월 기준, 836명의 사용자로부터 12,524건의 AI 생성을 분석한 결과는 다음과 같습니다.
-
적격성: 전체 사용자 중 Gemini Nano 사용 가능한 비율은 41%에 불과합니다. 이는 Chrome 버전 및 언어 외에 CPU, GPU, OS 요구사항 때문입니다.
-
모델 준비 상태: 적격 사용자 중 약 25%만이 모델을 미리 다운로드하여 준비된 상태였습니다.
-
모델 다운로드 시간: 1.5GB 모델 파일의 중앙값 다운로드 시간은 1.9분이었습니다.
-
추론 성능:
- Gemini Nano (온디바이스): 평균 7.7초 (4,774회 생성)
- Gemma 3N (서버 API): 평균 1.3초 (7,750회 생성)
- Gemini Nano는 서버 API 호출보다 약 6배 느렸습니다. 이는 네트워크 지연이 없어도 노트북 GPU와 데이터센터 간의 컴퓨팅 성능 차이가 훨씬 크기 때문입니다.
예상치 못한 점
-
다운로드 프롬프트 부재: 모델 다운로드는 사용자에게 완전히 보이지 않게 백그라운드에서 진행됩니다.
-
중단된 다운로드 처리: Chrome은 다운로드를 백그라운드에서 계속하며, 브라우저가 닫혀도 다음 실행 시 재개됩니다.
-
로컬 추론 속도: 로컬 추론이 서버 왕복보다 빠를 것이라는 예상과 달리, Gemini Nano는 훨씬 느렸습니다.
-
비용 효율성: 무료로 제공되는 외부 API 모델과 비교할 때 비용 절감 효과는 미미합니다.
사이드 퀘스트 실수: 터보 트랩 (Turbo Trap)
Rails의 Turbo 기능(링크 호버 시 미리 가져오기)으로 인해 초기 데이터가 왜곡되었습니다. 사용자가 AI 생성된 제목 위로 마우스를 움직이면 Turbo가 여러 AI 생성 호출을 동시에 트리거하여, Gemini Nano의 타이밍이 심하게 부풀려지고 사용량 분석이 과소평가되었습니다. data-turbo="false" 속성을 추가하여 이 문제를 해결했습니다. 이 경험은 Nano 추론이 클라이언트 측 성능에 사용자에게 영향을 미치는 부작용을 일으킬 수 있음을 보여줍니다.