
Chapter 15. 덜 쓰기: 사용량 최적화 (Using Less: Usage Optimization)
이번 장에서는 FinOps 라이프사이클에서 가장 어려운 부분인 사용량 최적화를 다룹니다. 이는 엔지니어의 적극적인 참여가 필요한 부분이며, 문화적 전환까지 요구되기에 즉각적인 비용 절감이 쉽지 않습니다. 하지만 장기적으로 큰 절감 효과를 가져다줄 수 있습니다.

☁️ 클라우드 사용의 냉정한 현실
클라우드는 “사용한 만큼만 지불”하는 개념이 아니라 실제로는 “프로비저닝한 리소스에 대해 지불“하는 방식입니다.
- 자원을 필요 이상으로 크게 잡거나 방치할 경우 쉽게 낭비(waste)가 발생
- 초기 구축 시 리소스를 크게 잡는 것이 일반적이나, 이후 점검 및 최적화가 필요
- 리소스가 낭비되면 매월 반복되는 비용 부담으로 이어짐
📌 클라우드 낭비의 원인
클라우드 낭비(waste)란, 사용하지 않거나 과도하게 설정된 리소스에 지불되는 비용을 의미합니다. 낭비의 주요 원인은 다음과 같습니다.
- 초기에 성능 이슈를 피하려고 리소스를 크게 할당(오버 프로비저닝)
- 구축 후 시간이 지남에 따라 사용량 점검 및 최적화 미실시
- 자동화 설정의 오류나 데이터 보존 정책의 부재로 리소스를 방치하는 경우
🛠️ 사용량 최적화 접근법
1. 자원 제거(Deleting Resources)
- 미사용 자원(예: unattached disk)을 즉시 삭제 → 100% 비용 절감
- 데이터 보존 필요 시 저렴한 콜드 스토리지로 이동 (AWS Glacier, Azure Archive 등)
2. 자원 크기 조정(Rightsizing)
- CPU, 메모리, 디스크, 네트워크 등 자원 사용량 분석 후 적정 사이즈로 조정
- 생산성에 지장이 없는 범위에서 추천안 제공
- 엔지니어가 추천안을 평가 후 안전하게 조정할 수 있도록 협업
3. 재설계(Redesigning)
- 클라우드 네이티브한 아키텍처 도입으로 탄력적 자원 사용 지원
- 오토 스케일링 및 서버리스(Serverless) 등 클라우드 고유의 장점 활용
🚧 자원 크기 조정 시 자주 하는 실수들
- 평균값이나 최고값만 사용한 추천안 의존
- 실제 워크로드의 특성을 무시하면 장애 유발 가능성 있음
- percentile 기반의 정확한 분석 방법 활용 필요
- 컴퓨트(Compute) 리소스만 최적화
- 디스크(Storage), 데이터베이스(RDS), 네트워크 등 다른 자원도 최적화 필요
- 리소스 형태(shape) 미고려
- CPU와 메모리 비율 등 자원 특성에 맞는 타입 선택 필요
- 성능 시뮬레이션 없이 즉시 조정
- 변경 전 성능 시뮬레이션 필수 (성능 저하 위험 관리)
- 예약 인스턴스(RI) 약정 문제로 망설임
- 유연한 RI 정책 활용하면 약정에도 불구하고 조정 가능
🔑 컴퓨트 이외의 주요 최적화 대상
- 방치된 디스크 제거 및 성능 조정(저렴한 디스크로 교체)
- AWS Elastic Volume 등 다운타임 없는 리사이징 활용
- 데이터 보존 정책 수립하여 불필요한 데이터 정리
- 데이터 종류에 맞는 저장 클래스 선택 (Intelligent-Tiering 등)
- 미사용 IP 제거 및 최적화된 네트워크 경로 활용(VPC Endpoint 등)
📈 예약 인스턴스(RI)에 미치는 영향
- 최적화로 인해 예약 인스턴스(RI) 사용량에 영향이 있을 수 있음
- 최적화 후 RI 사용량이 줄어들 수 있기에, 초기에는 소규모로 RI 약정하고 점차 늘리는 전략 추천
📐 효용(benefit) vs. 노력(effort)
- 모든 최적화 작업이 비용 대비 가치가 있는 것은 아님
- 절감액이 엔지니어링 투입시간을 초과하지 않는 경우, 작은 절감액은 무시하는 정책 추천
- 엔지니어링 자원과 비용 절감 사이의 균형점 찾기 필요
🔄 사용량 최적화 워크플로우 및 자동화
성숙한 조직에서는 자동화된 워크플로우를 활용하여 지속적 최적화를 실천합니다.
- 추천안을 시스템화하여 각 팀이 확인 후 선택적으로 적용하거나 제외(opt-out) 가능하게 지원
- Jira 등 티켓 시스템을 활용하여 팀별 최적화 진행 상태 관리
💵 절감 효과 추적 방법
사용량 최적화는 “비용 회피(cost avoidance)” 로, 구체적인 절감 내역이 청구서에 바로 나타나지 않으므로, 다음과 같은 방법으로 추적해야 합니다.
- 최적화 이전과 이후 리소스 비용 변화량 기록 및 관리
- 추천안의 총 잠재적 절감액(total potential savings)을 정기적으로 계산하여 최적화 진행 상태를 평가
- 비용 절감을 팀 간 성과 평가 지표로 활용하여 참여 유도 (게임화)
🚦 성공적인 사용량 최적화를 위한 조언
- 초기에는 간단한 작업(미사용 자원 정리 등)부터 시작하여 점차 확장
- 엔지니어 팀과의 협업이 매우 중요하며, 강제적 방식이 아닌 소통과 이해를 기반으로 접근
- 최적화는 단발적이 아니라 지속적으로 수행해야 하는 작업임을 조직 문화로 정착시키기

🎯 결론 정리
- 사용량 최적화는 빠르진 않지만 장기적으로 큰 절감 효과가 있음
- 기술적, 조직적 협력을 바탕으로 체계적인 접근이 필요함
- 효율성과 비용 절감을 넘어 비즈니스 가치를 극대화하는 방향으로 진행해야 함
이제 사용량 최적화를 마쳤으므로, 다음 장에서는 더 저렴한 요금(rate)으로 클라우드를 사용하는 법을 다룹니다.