Anna's Archive의 Spotify 데이터 대규모 스크래핑 및 토렌트 배포 사건

Pirate group scrapes Spotify's 300TB library, posts torrents for 86M tracks

작성자
HackerNews
발행일
2025년 12월 23일

핵심 요약

  • 1 Anna's Archive가 Spotify에서 약 300TB 규모의 음악 파일 8,600만 개와 2억 5,600만 행의 메타데이터를 추출하여 공개했습니다.
  • 2 Spotify는 불법 스크래핑에 사용된 계정을 차단하고 DRM 우회 및 무단 접근에 대한 조사를 진행하며 보안 조치를 강화했습니다.
  • 3 이번 유출 데이터는 전체 라이브러리의 37%이자 청취 횟수 기준 99.9%를 차지하며, 보존을 목적으로 배포되고 있습니다.

도입

세계 최대의 음악 스트리밍 플랫폼인 Spotify가 'Anna's Archive'로 알려진 그림자 도서관 그룹에 의해 전례 없는 대규모 데이터 스크래핑 공격을 받았습니다. 이번 사건을 통해 약 300TB에 달하는 방대한 양의 음악 파일과 상세한 메타데이터가 외부로 유출되었으며, 현재 토렌트 사이트를 통해 불법적으로 유통되고 있습니다. Spotify 측은 즉각적인 조사를 통해 관련 계정을 차단하고 보안 시스템을 강화하는 등 대응에 나섰습니다.

1. 유출 데이터의 규모 및 구성

  • 음악 파일: 약 8,600만 개의 파일이 유출되었으며, 이는 Spotify 전체 라이브러리의 약 37%에 해당하지만 실제 청취 횟수 기준으로는 99.9%를 차지하는 핵심 데이터입니다.

  • 메타데이터: 2억 5,600만 행의 SQL 데이터베이스가 구축되었으며, 1억 8,600만 개의 고유 ISRC(국제 표준 녹음 코드) 및 상세 아티스트 정보가 포함되었습니다.

  • 파일 형식: 대부분 원본 OGG Vorbis 160kbps 형식을 유지하고 있으며, 인기가 낮은 곡은 용량 절약을 위해 75kbps로 재인코딩되었습니다.

2. 공격 방식 및 Spotify의 대응

  • 공격 기술: Anna’s Archive는 공용 메타데이터를 스크래핑하고 DRM(디지털 저작권 관리)을 우회하는 기술적 수단을 동원하여 오디오 파일에 접근했습니다.

  • 보안 조치: Spotify는 불법 스크래핑에 가담한 계정들을 식별하여 차단했으며, 저작권 침해 공격에 대비한 새로운 방어 체계를 구축하고 의심스러운 활동에 대한 모니터링을 강화했습니다.

3. 유출 목적 및 향후 배포 계획

  • 명분: Anna’s Archive는 이번 행위가 상업적 이익이 아닌 ‘음악 보존’을 위한 것이라고 주장하며, 모든 음악을 대표하는 권위 있는 토렌트 목록을 지향한다고 밝혔습니다.

  • 배포 방식: 메타데이터는 이미 공개되었으며, 오디오 데이터는 인기도에 따라 분류되어 순차적으로 배포될 예정입니다.

결론

이번 유출 사건은 디지털 스트리밍 시대에 콘텐츠 보호와 저작권 관리에 심각한 시사점을 던집니다. Anna's Archive는 음악의 영구적 보존이라는 명분을 내세우고 있으나, 이는 아티스트와 권리자의 이익을 침해하는 명백한 불법 행위입니다. Spotify의 향후 대응과 보안 기술의 발전은 향후 스트리밍 산업 전반의 저작권 보호 표준에 중요한 영향을 미칠 것으로 전망됩니다.

댓글 0

로그인이 필요합니다

댓글을 작성하거나 대화에 참여하려면 로그인이 필요합니다.

로그인 하러 가기

아직 댓글이 없습니다

첫 번째 댓글을 작성해보세요!