1. 운영 효율성을 극대화하는 유연한 Standard Plan 도입
기존 Heroku의 모델 기반 플랜은 특정 모델을 사용하기 위해 매번 별도의 애드온을 프로비저닝해야 하는 운영상의 오버헤드가 존재했습니다. 새로운 Standard Plan은 이러한 마찰을 완전히 제거했습니다.
* 통합 리소스 관리: 단 하나의 애드온(heroku-inference:standard)과 API 키만으로 Heroku가 지원하는 모든 모델 카탈로그를 활용할 수 있습니다.
* 코드 기반 모델 전환: 모델을 변경하기 위해 리소스를 재설정할 필요 없이, 소스 코드 내에서 모델 이름만 수정하면 즉시 적용됩니다. 이는 실험적인 모델 도입이나 장애 대비용 폴백(Fallback) 전략 수립을 매우 간편하게 만듭니다.
* 간편한 배포: CLI 명령(heroku addons:create heroku-inference:standard -a $APPNAME)을 통해 복잡한 설정 없이 즉시 통합 AI 환경을 구축할 수 있습니다.
2. 차세대 프론티어 모델: Claude 4.6 시리즈 합류
업계 최고 수준의 성능을 자랑하는 Claude 4.6 제품군이 Heroku 플랫폼에 공식 지원됩니다. * Claude Opus 4.6: 고도로 복잡한 소프트웨어 엔지니어링, 자율적인 에이전트 워크플로우, 그리고 장기적인 계획 수립이 필요한 고급 AI 애플리케이션에 최적화되어 있습니다. * Claude Sonnet 4.6: 일상적인 개발 작업부터 정교한 금융 데이터 분석까지 폭넓은 분야에서 탁월한 성능을 발휘하는 범용 고성능 모델입니다.
3. 다양해진 오픈 웨이트(Open-weight) 모델 라인업
비용 효율성과 특화 기능을 중시하는 개발자들을 위해 5종의 새로운 오픈 웨이트 모델이 추가되었습니다. * DeepSeek v3.2: 고효율 에이전트 추론과 방대한 문맥 이해가 필요한 작업에 강점을 가집니다. * Kimi K2.5: 대규모 컨텍스트 처리와 복잡한 수학적 추론, 에이전트 스웜 구성에 최적화된 모델입니다. * MiniMax M2.1: 실무 엔지니어링 및 다국어 풀스택 애플리케이션 구축에 특화되어 있습니다. * ZAI GLM 4.7 및 Flash: 안정적인 도구 호출(Tool-calling) 기능을 제공하며, Flash 버전은 속도와 비용 효율성이 중요한 실시간 응답 워크플로우에 적합합니다.
4. 검색 정확도 향상을 위한 신규 임베딩 및 모델 관리
- Cohere Embed V4 지원: 단순한 키워드 매칭을 넘어 문서 간의 개념적 관계를 파악하는 최신 임베딩 모델을 통해 벡터 검색 및 RAG(Retrieval-Augmented Generation) 시스템의 정확도를 높였습니다.
- 레거시 모델 지원 종료: 최신 기술로의 전환을 위해 Claude 3.5, 3.7, 4 버전에 대한 Deprecation 절차가 시작되었습니다. 안정적인 서비스 운영을 위해 최신 4.5 또는 4.6 버전으로의 마이그레이션이 권장됩니다.