Mozilla의 SUMO를 운영하는 소프트웨어인 Kitsune은 문서상으로 Gemini 2.5 Pro를 기반으로 번역 봇을 구축했다고 명시하고 있습니다. 이는 Mozilla가 강조하는 오픈 소스 비전과 달리, Gemini 2.5 Pro가 비공개 소스 모델이며 ‘공개적으로 사용 가능한 소스’에서 데이터를 가져온다는 점에서 문제가 제기됩니다. 이는 Google이 저작권이 있는 자료를 무단으로 사용했을 가능성을 시사하며, 영국 작가 협회(Society of Authors)는 Gemini 출시 당시 Google의 데이터 수집 방식에 대한 투명성 부족을 강력히 비판한 바 있습니다.
오픈 소스 정신에 대한 모순
Mozilla는 Common Voice와 같은 프로젝트를 통해 130개 이상의 언어에 걸쳐 커뮤니티가 기여한 방대한 음성 데이터 세트를 성공적으로 구축한 경험이 있습니다. 이는 기업들이 훈련 데이터를 얻기 위해 타인의 저작권을 침해할 필요 없이, 커뮤니티의 자발적인 참여를 통해 오픈 데이터 세트를 구축할 수 있음을 증명합니다. 그러나 Mozilla는 이러한 경험을 뒤로하고, 비공개 소스이자 저작권 침해 가능성이 있는 모델을 선택하여 커뮤니티의 기여를 훼손하고 있습니다.
학습하지 않는 AI와 커뮤니티의 좌절
Google Gemini 서비스 약관에 따르면, 유료 Gemini 쿼리에 제출된 프롬프트는 모델 개선에 사용되지 않습니다. 이는 번역 봇이 학습하지 않음을 의미하며, 자원봉사자들이 SUMO 지식 기반에 수정한 내용이 언제든 다시 덮어쓰여질 수 있음을 뜻합니다. 커뮤니티 구성원들은 봇이 덮어쓴 문서를 쉽게 찾을 수 있는 기능(기존의 미검토 문서 목록과 유사하게)을 요청하는 등, 이러한 환경에서 작업하는 데 어려움을 겪고 있습니다. Mozilla는 비공개 AI로 나아가면서, 피드백 수렴 과정마저도 구글 폼을 통한 비공개 방식으로 진행하여 부정적인 피드백을 억압하려는 시도로 비판받고 있습니다.