Gemini 3.0 Pro Image 모델의 강점
기존 NotebookLM 팟캐스트 기능은 에이전트가 논문에 없는 내용을 논의하는 환각 현상이 잦았고, 생성 및 청취, 사실 확인 과정에 많은 시간이 소요되었습니다. 반면, Nano Banana Pro는 이미지 기반으로 이러한 문제를 해결하며, 시각적 자료는 텍스트 기반 정보보다 오류 검증이 용이하고 정보 전달 효율성이 뛰어납니다.
그래픽 노블 생성 워크플로우
저자는 두 단계로 나뉜 워크플로우를 제안합니다:
-
텍스트 스크립트 생성: Gemini 3.0 Pro를 사용하여 PDF 논문을 읽고, 논문의 핵심 내러티브(문제, 방법, 발견)를 담은 그래픽 노블 스크립트를 생성합니다. 현재 Nano Banana Pro는 URL 컨텍스트나 PDF 직접 업로드를 지원하지 않으므로, 이 단계에서 텍스트 스크립트를 먼저 추출하는 것이 중요합니다.
-
이미지 생성: 생성된 스크립트를 Nano Banana Pro의 프롬프트로 사용하여 이미지를 생성합니다.
프롬프트 전략 및 최적화
최적의 결과물을 얻기 위해 저자는 다음과 같은 프롬프트 전략을 사용합니다:
-
시스템 프롬프트: “전문가 그래픽 노블 작가이자 과학 커뮤니케이터” 역할을 부여하고, 4페이지 분량의 스크립트 생성을 지시합니다.
-
내러티브 장치: 학술 논문에 캐릭터가 없으므로, ‘결단력 있는 연구원(Character A)’과 ‘회의적인 로봇 조수(Character B)’와 같은 두 주인공을 설정하여 복잡한 개념을 대화로 설명하게 합니다.
-
출력 형식: 각 패널마다 표준 코믹 스크립트 형식(대화, 캡션, 효과음)과 AI 이미지 생성에 최적화된 시각적 설명(장면, 조명, 카메라 앵글, 스타일)을 명확히 구분하여 제공합니다.
-
시각적 스타일 지정: “Dark Sci-Fi”, “Moebius-style Retro Futurism”, “Buddhist Thangka”, “Bosch” 등 다양한 예술적 스타일을 지정하여 독특하고 인상적인 결과물을 얻을 수 있습니다.
결과물 개선 팁
-
스크립트가 길 경우, 페이지별로 이미지를 분할하여 생성하면 작은 텍스트의 가독성 문제를 해결하고 더 선명한 이미지를 얻을 수 있습니다.
-
모델이 페이지 간 일관성을 잃을 수 있으므로, 이전 페이지의 스타일과 캐릭터를 유지하도록 프롬프트를 조정하고 재시도하는 반복 작업이 중요합니다. AI Studio의 채팅 모드에서 쉽게 반복할 수 있습니다.
-
간혹 생성된 이미지가 ‘Thoughts’ 블록에 숨겨져 있을 수 있으니, 최종 답변에 이미지가 보이지 않으면 ‘Thoughts’ 블록을 확인해야 합니다.