1 개요
1.1 개요
㈜우노시스템즈는 7월 25일 OOO사의 SIS 시스템에 대한 성능
진단을 진행하고 이에 대한 결과를 본 보고서에 기술하였습니다.
본 보고서에서는 ㈜ 자바 서비스 컨설팅사의 APM 솔루션인
제니퍼(Jennifer)를 운영서버에 적용하여 성능 이슈 데이터를 수집하고 서비스 장애 시점의 상황을 면밀히
분석한 데이터를 중심으로 성능 및 장애 진단을 시행하였습니다.
특히, 성능 관련 데이터로는 접속자 및 시간당 방문자수 추이, 업무 부하량, 응답이 저하된 어플리케이션,
성능저하로 인한 장애 발생 시점에서 운영되고(running) 있던 어플리케이션의 상태정보 등을 확인할 수 있습니다.
위의 자료를 토대로 해당 SIS 시스템의 경우 장애 유형은 서비스 큐잉(Queuing)현상으로 판단되면 그의
원인은 서비스 병목구간이 존재하는 것으로 분석되었습니다. 서비스 큐잉 현상으로 인한 장애 시점의 서비스
이용 실태를 점검해 보고, 서비스 병목으로 확인된 구간에 대하여 근거 자료를 토대로 이에 대한 점검의
필요성을 상세히 기술하였습니다.
SIS 시스템은 성능 데이터를 토대로 Peek Time에 발생하는 서비스 장애의 원인을 파악하고 이에 대한
종합적인 조치 방안을 제시하여 보다 안정적인 서비스가 이루어질 수 있도록 가이드하는 것이 본 작업의 목적입니다.
1.2 수행인원
고규백 과장(㈜우노시스템즈 웹시스템 장애/성능 진단 컨설팅 및 APM 전문가)
1.3 진단 기간
2005년 07월 25, 28일
1.4 진단 대상 시스템
OOO사 SIS 시스템
1.5 성능진단 관련 H/W 시스템
- H/W Spec : Window 2000 서버 (HP)
- 운영체제(OS) : Window 2000”
- 데이터베이스(DB) : AS/400 DB2
1.6 성능 진단 관련 S/W 정보
- Web Application Server : WebSphere 5.0
2 성능 분석 결과
2.1 접속 사용자 분석
2.2 업무처리량/부하량 분석
2.3 시스템 자원 분석
2.4 에러/예외사항 분석
2.5 어플리케이션 수행통계
2.6 SQL 쿼리 성능 분석
2.7 서비스 장애 분석
– WebSphere Thread Pool의 스레드 상태 분석
– 네트워크 상태 분석
장애에 대한 조치 사항 권고
WebSphere – Gauce DB Connection Pool
Gauce DB Connection Pool – AS/400 DB2 JDBC Driver
AS/400 DB2 JDBC Driver – AS/400 DB2 Server
3 결론 및 향후 권고 사항
3.1 분석 결과 요점
성능관리 솔루션인 제니퍼(Jennifer)를 적용하여 평상시와 장애시점의 서비스 상태를 분석하였습니다.
제니퍼를 통해서 확인된 전반적인 서비스 데이터를 토대로 장애 및 성능 이슈 사항을 단순화 및 통계화하여,
본질적인 이슈사항에 접근하고자 노력하였습니다.
결론적으로, 본 보고서에서는 그 동안 측정하지 못했던 장애 시점의 전반적인 서비스 상태를 다시 한번
확인함과 동시에 다 방면으로 수집된 데이터를 토대로 장애의 원인 분석을 진행한 사항을 상세히 기술한 것이니다.
본인이 제시한 장애의 원인으로 대두되는 구간을 상세히 점검하시고 이에 대한 결론을 함께 공유하여
서비스 장애를 해결해야 할 것으로 판단됩니다.
3.2 성능관리의 필요성
각 시스템별로 일자별 방문자수 및 특정 시점의 동시단말사용자 수, Active서비스 개수 등, 그동안 성능관련
데이터를 산출하기 위해 많은 시간을 투자했거나, 그러한 데이터를 추출하지 못하였던 것에 비해, 제니퍼(Jennifer)를
적용함으로써, 그 즉시에 실시간 모니터링을 할 수 있다는 점과, 각종 성능 통계데이타를 일자별로 관리함으로써,
과거에 발생한 성능장애 상황을 추적해 낼 수 있는 등, 종합적이고 체계적인 성능관리가 이루어질 수 있음을 말씀 드립니다.
보다 신뢰성 있는 서비스 운영을 위해 반드시 성능 관리는 필요합니다. |