AI 시대의 창의적 즐거움

[EN] The joy of creativity in the age of AI - Paweł Strzałkowski

작성자
Visuality.pl
발행일
2025년 03월 17일

핵심 요약

  • 1 AI 시대에 웹 개발의 창의성을 탐구하며, 웹의 발전과 사용자 상호작용의 변화를 조명합니다.
  • 2 Ruby on Rails를 활용한 실제 프로젝트(음성 제어, 이미지 인식, 임베딩 기반 검색)를 통해 LLM의 강력한 활용 사례를 시연합니다.
  • 3 웹 기술과 AI의 융합이 사용자 접근성을 높이고 새로운 비즈니스 기회를 창출할 수 있음을 강조합니다.

도입

Paweł Szotkowski의 'AI 시대의 창의성에서 오는 즐거움' 강연은 Ruby Community Conference에서 진행되었습니다. 강연은 웹의 초기 모습부터 현재까지의 발전 과정을 되짚으며, 사용자 상호작용 방식이 30년 동안 본질적으로 변화하지 않았다는 통찰로 시작합니다. 새로운 미디어가 등장했을 때 기존 미디어의 방식을 답습하다가 진정한 잠재력을 깨닫게 되는 스티브 잡스의 라디오-TV 비유를 통해 웹이 나아가야 할 방향을 제시합니다. 웹이 단순한 미디어를 넘어 소프트웨어 플랫폼으로 진화했음을 강조하며, 이제는 AI와 같은 신기술을 통해 기존의 상호작용 방식을 혁신할 때임을 역설합니다.

발표자는 Ruby on Rails 개발자로서 자신의 창의적인 시도들을 소개합니다. 도메인 주도 설계(DDD)를 Rails에 적용한 시도, 멀티플레이어 실시간 Ruby on Rails 게임(Tetris, Frogger) 개발, 그리고 발표 자체에 사용된 Rails 기반 프레젠테이션 플랫폼 구축 경험을 공유합니다. 이어서 대규모 언어 모델(LLM)의 등장과 그 활용 가능성에 주목하며, Ruby on Rails를 풀스택 LLM 프레임워크처럼 활용하는 방법을 시연합니다. 먼저, 음성 제어 기능 구현을 위해 openai-ruby 젬을 사용하여 음성을 텍스트로 변환(Whisper 모델)하고, GPT-4o의 ‘도구(Tools)’ 기능을 활용하여 텍스트 명령을 특정 동작(예: 가상 강아지 ‘젬’ 이동)으로 변환하는 과정을 상세히 설명합니다. 웹 오디오 API와 Rails의 액티브 레코드, 터보 스트림, 스티뮬러스(Stimulus)를 활용한 풀스택 구현 방식을 보여줍니다. 다음으로, 이미지 인식 및 검색 기능을 시연합니다. 동일한 JavaScript 라이브러리로 이미지를 캡처하고 서버로 전송하여 LLM(GPT-4o mini)으로 이미지 내용을 분석합니다. 더 나아가, ‘임베딩(Embeddings)’ 개념을 소개하며, 텍스트나 이미지를 숫자 벡터로 변환하여 정보 간의 유사성을 수학적으로 비교하는 방법을 설명합니다. PostgreSQL의 PGVector나 SQLite V와 같은 데이터베이스 확장을 통해 이러한 벡터를 효율적으로 저장하고 검색할 수 있음을 시연하며, 이를 통해 “빨간 점퍼를 입은 사람”과 같은 자연어 쿼리로 이미지를 검색하는 기능을 구현합니다. 발표자는 이러한 LLM 기반의 기능들이 웹의 접근성을 높이고(예: 음성으로 글꼴 크기 변경, 다크 모드 활성화) 사용자가 필터나 복잡한 개념 없이도 제품을 쉽게 찾을 수 있도록 돕는 등 사용자 경험을 혁신할 수 있음을 강조합니다. 또한, 웹 개발자들이 PWA(Progressive Web App), 실제 하드웨어 제어(예: 바코드 리더), 3D 그래픽스(WebGL) 등 다양한 웹 기술을 활용하여 더욱 풍부하고 몰입감 있는 애플리케이션을 구축할 수 있음을 시사합니다.

결론

발표자는 AI와 웹 기술의 융합이 가져올 무한한 가능성을 재차 강조하며, 개발자들이 이러한 기술들을 탐색하고 창의적으로 활용하여 새로운 제품과 서비스를 만들어낼 것을 독려합니다. Ruby on Rails가 이러한 신기술과의 통합에 매우 효과적인 프레임워크임을 시연을 통해 입증하며, 빠르면 2-3일 만에 혁신적인 프로토타입을 구축할 수 있다고 말합니다. DHH의 "유능한 것이 더 즐겁다"는 말을 인용하며, 발표자는 여기에 "창의적인 것이 훨씬 더 즐겁다"는 메시지를 덧붙여 강연을 마무리합니다. 이는 기술적 숙련도뿐만 아니라 창의적 사고가 미래 웹 개발의 핵심 동력이 될 것임을 시사합니다.

댓글 0

댓글 작성

0/1000
정중하고 건설적인 댓글을 작성해 주세요.

아직 댓글이 없습니다

첫 번째 댓글을 작성해보세요!