본문 바로가기

트러블 슈팅2

[AWS 트러블 슈팅] RDS CPU 점유율 99% 스파이크 현상 트러블 슈팅 목차 0. 들어가며 1. RDS CPU 99% 이슈 발생 및 대응 2. RDS 인스턴스 타입 변경 이후에도 동일한 이슈 재발생 3. 또 다른 RDS 인스턴스의 비정상 지표 패턴 4. 작업전 지표와 작업후 지표 비교 5. 후속 대응 작업 6. 글을 마무리하며 0) 들어가며 2022년 당시 AWS 에 대해 무지했던 시기에 "서버 살려야한다.. AWS 배워야 한다." 라는 경각심을 일깨워준 좋은(?) 경험에 대한 내용을 정리해보았습니다. ----- 개발 인력의 퇴사와 더불어 사업 방향성이 웹에서 어플로 변경됨에 따라 어플의 출시와 신규 기능 개발 및 운영을 위해 Typescript 기반의 프론트/백엔드 개발 업무에서 어플의 백엔드 전담으로 업무가 변경 되었습니다. 신규 기능 배포 및 친구 초대 이벤트 홍보등 .. 2024. 3. 14.
[AWS 트러블슈팅] AWS 운영 비용 절감하기 1. 들어가며 1.1 히스토리 ( 썰풀기 ) 이전까지는 "인프라는 팀장님!" 이라는 수식어가 붙어 있었던만큼 해볼 기회가 많이 없었다. 하지만, 기존 인력들이 대거 퇴사하고 내가 서버쪽에 모든 업무를 담당하게 되고 직무가 벡엔드 개발자로 변경됨에 따라 자연스럽게 AWS 서비스들의 운영과 관리등의 업무도 내 담당이 되었다. 이제는 서버에 문제가 생기면, CS 가 들어오면, 신규 기능 추가 요청이 들어오면, 새로운 이슈가 생기면 내 이름이 노티되기 시작했다. 1.2 다시 현재로 전 담당자분이 퇴사하시기전까지는 한달에 약 5**만원 정도의 AWS 비용이 청구되고 있었다. 예전에 아무것도 모를때는 이 비용이 당연한것인줄 알았는데, AWS 서비스들을 공부하고 현재 우리 회사 서비스들의 유저수/트래픽 대비 너무 과.. 2023. 2. 7.