그래프로 데이터를 오도하는 5가지 방법

Josua Schmid - Bullshit Graphs

작성자
Helvetic Ruby
발행일
2025년 06월 27일

핵심 요약

  • 1 이 발표는 그래프를 통해 데이터를 오도할 수 있는 다섯 가지 일반적인 방법에 대해 설명합니다.
  • 2 사과와 오렌지를 비교하거나, 상관관계를 인과관계로 오해하고, 축을 조작하며, 시각적 비율을 왜곡하는 등의 사례를 다룹니다.
  • 3 데이터 시각화의 함정을 이해하고 비판적으로 해석하는 것의 중요성을 강조합니다.

도입

본 발표는 소프트웨어 엔지니어인 조슈아가 '그래프로 속이는 방법'이라는 주제로, 데이터 시각화에서 흔히 발생하는 오류와 오용 사례를 다섯 가지 핵심 개념을 통해 설명합니다. 워싱턴 대학교의 관련 강좌에서 영감을 받아, 청중에게 그래프를 비판적으로 해석하는 시각을 제공하고자 합니다. 이는 데이터가 어떻게 의도적으로 또는 비의도적으로 왜곡될 수 있는지를 이해하는 데 중점을 둡니다.

발표자는 첫째, ‘사과와 오렌지를 비교하지 말라’는 원칙을 강조합니다. 이는 유사해 보이는 두 대상을 비교하여 실제로는 관련 없는 결과를 도출하는 오류로, 예를 들어 신선한 사과 주스와 오렌지 농축액을 비교하는 상황을 통해 설명됩니다. 둘째, ‘상관관계가 인과관계를 의미하지 않는다’는 점을 짚으며, 겉으로 드러나는 상관관계 뒤에 숨겨진 공통 원인(예: 국가 크기와 황새가 아기를 배달한다는 주장)이 있음을 설명합니다. 이는 통계적 착각을 유발하는 흔한 방법입니다. 셋째, 기업들이 자주 사용하는 ‘데이터를 부풀려 보이게 하는’ 방법으로, 축의 스케일을 불일치하게 조작하여 특정 효과를 과장하거나 축소하는 기법을 소개합니다. 이는 시각적으로 큰 차이가 있는 것처럼 보이게 하지만 실제로는 그렇지 않을 수 있습니다. 넷째, ‘비례 잉크의 효과(proportional ink)’를 통해 시각적 요소의 크기가 실제 데이터 비율과 일치하지 않아 특정 부분이 과장되어 보이는 현상을 설명합니다. 안드로이드 시장 점유율이 실제보다 훨씬 커 보이게 하는 예시가 이에 해당합니다. 마지막으로, ‘우측 절단(right censoring)’ 또는 코호트 효과를 언급하며, 최신 데이터가 아직 충분히 발전하지 않아 잘못된 결론을 내릴 수 있음을 지적합니다. 예를 들어, 특정 장르의 신인 음악가들이 오래 살 것처럼 보이는 것은 단순히 그들이 아직 죽을 만큼 나이가 들지 않았기 때문일 수 있습니다. 이 모든 사례는 그래프가 어떻게 정보를 왜곡하고 오해를 불러일으킬 수 있는지를 명확히 보여줍니다.

결론

조슈아는 이러한 다섯 가지 개념을 통해 그래프가 데이터를 얼마나 쉽게 조작하거나 오해하게 만들 수 있는지를 보여주며, 청중에게 데이터 시각화를 접할 때 항상 비판적인 시각을 가질 것을 당부합니다. 이 발표는 단순히 그래프를 읽는 것을 넘어, 그 이면에 숨겨진 의도와 잠재적 오류를 파악하는 능력의 중요성을 강조합니다. 이는 정보 과잉 시대에 필수적인 데이터 리터러시 능력을 함양하는 데 기여하며, 우리가 일상에서 접하는 수많은 시각적 정보를 더욱 현명하게 해석할 수 있도록 돕습니다.

댓글 0

댓글 작성

0/1000
정중하고 건설적인 댓글을 작성해 주세요.

아직 댓글이 없습니다

첫 번째 댓글을 작성해보세요!