Solid Queue 전환은 Active Job 사용 확인과 Mission Control Jobs 설정으로 시작되었습니다. 프로덕션 환경의 쓰기 부하를 고려, 별도의 MySQL 큐 DB를 구축했습니다. 큐 명명 전략은 지연 허용치(latency tolerance) 기반(예: ‘within one minute’)으로 변경하여 명확한 SLO를 부여하고, 자동 경고 및 리소스 확장을 용이하게 했습니다. 워커는 각 큐에 전용으로 할당하고 부하에 따라 자동 확장되도록 구성했으며, 주요 지표는 Prometheus로 모니터링했습니다.
마이그레이션 중 긴 인자 리스트(DB 컬럼 확장), 메모리 과다(워커 메모리 증설), DB 연결 고갈(DB 크기 증설 및 워커 제한), 느린 작업 유입(실행 시간 모니터링 및 재배치), 대량 작업 동시 인큐잉(배치 처리 및 무작위 지연) 등 여러 문제가 발생했으며, 각 문제에 대한 적절한 해결책을 적용하여 시스템 안정성을 확보했습니다.