산업문제 내용· 기업소개 : 부산도시가스(SK E&S)-2019년 현재 부산광역시 전 지역 약 143만 세대의 도시가스를 공급하고 있으며, 고객만족 경영에 중점을 두어 2003년부터 2018년까지 16년 연속 고객만족도 조사 도시가스 부문 1위 수상
· 산업문제 : 1. 매월 가스 사용량을 검침/청구를 시행하는 가운데 계량기 고장 또는 고객 미검침에 따른 청구오류 등 현재 운영 중인 검침 기반 방법에 대한 고객 불만이 지속적으로 발생
2. 과거 데이터 분석을 통해 검침 오류 및 이상 세대를 판별하고 미래의 사용량을 예측하여 미검침 세대에 대한 신뢰도 높은 추정 값을 얻는 문제를 해결하기 위해 연구소에 의뢰함
문제해결 결과· 제시된 해결방안 : 1. 예측 알고리즘 개발을 위한 데이터 전처리 과정에서 사용값 표준편차가 크거나 결측 값이 존재하는 세대를 제외하고 확률분포의 거리를 계산하여 평균과 유사한 확률 분포를 가진 세대를 추출하여 분석을 진행하였음
2. 세대마다 개별 모델을 만들어 예측하는 것은 거의 불가능하고 또한 1개의 모델로 전체 세대의 12개월을 모두 예측하는 것은 신뢰도가 낮을 것으로 예상되어, 시간과 온도를 고려한 월별 모델을 개발하여 미래 사용량을 예측함
3. 사용량이 급격히 증가하는 세대, 2년동안 사용량이 동일하거나 ±10% 범위 내인 세대, 평균 사용량과 사용량 거리가 먼 세대, 전반적으로 높은 사용량을 유지하는 세대 등 규칙기반 알고리즘 적용을 통한 이상 데이터 분류 모델 개발
· 활용계획 및 기대성과 : 1. 기존 전년 동월 방법 같은 통합적인 사용량 예측 방법이 아닌 각 세대의 과거 데이터 패턴분석을 통해 신뢰도 높은 사용량 예측 알고리즘을 개발하여 고객들의 불만이 감소할 것으로 기대
2. 1D CNN 딥러닝을 활용한 신규 추정검침값 선정 Logic 개발. 기존 전년동월 방법 대비 28% 정확도 향상 및 LSTM 등 타 시계열 딥러닝 모델 대비 빠른 처리 속도를 얻음
3. 이상세대를 분류하는 규칙기반 알고리즘은 기업 관계자가 쉽게 parameter를 조절할 수 있어 상황에 맞는 분류 작업이 가능함
4. 데이터 전처리 과정에서 발견된 이상 데이터의 일부는 실제 이상여부 확인 후 개선 예정
5. 개발된 1D CNN Deep Learning 모델 / 규칙기반 알고리즘은 추후 업무 시스템 반영 예정