· 기업소개 : 세종충남대학교병원은 2020년 7월 세종시 최초의 대학병원으로 개원하여 의사직만 136명을 확보 세종 및 중부권 중심병원으로 발전하고 있다.
· 산업문제 : 환자의 진료에서 정진기를 사용한 진단은 가장 기초적인 진단법이긴 하나 비침습적으로 환자의 상태를 가장 신속하게 진단할 수 있는 방법이다. 청진시 접촉잡음, 환경음(말소리 등)뿐만 아니라 환자 몸의 장기에서 나는 소리(심장음 등)가 함께 청진이 되어 올바른 진단을 하기 어렵게 문제가 존재한다. 청진의 정확도를 높이기 위해서는 청진시 함께 들리는 이러한 잡음을 제거하는 것이 중요하다.
[문제해결 결과]
· 제시된 해결방안 : Discrete Wavelet Transform (DWT, 이산 웨이블렛 변환), Empirical Mode Decomposition (EMD, 경험적 모드 분해법), Variational Mode Decomposition (VMD, 변동 모드 분해법), Spectral gating/filter, Butterworth Lowpass Filter, Savitzky?Golay smoothing (Polynomial Lowpass Filter)을 활용한 청진음 잡음 감쇠
· 활용계획 및 기대성과 : 위의 결과에서 최종적으로 제안된 알고리즘들이 실제 의료현장에서 질병, 질환 진단 시에 발생하는 심장음, 환경음, 접촉잡음 등과 같은 주요 잡음만을 정확하게 감쇄하거나 제거하는 것은 아니라, 전반적인 잡음의 강도를 약화시키는 정도의 효과를 얻을 수 있었다. 따라서 DWT, Butterworth Lowpass Filter, Savitzky?Golay smoothing와 심장음, 환경음, 접촉잡음 등과 같은 패턴을 분석하여 추출할 수 있는 변형된 EMD, VMD 방법론을 개발할 수 있으면 매우 좋은 잡음감쇄 또는 잡음제거 알고리즘을 개발할 수 있을 것으로 기대된다.
[키워드]
청진음, 잡음제거, 기계학습, 데이터분석
[산업문제내용]
· 기업소개 : 세종충남대학교병원은 2020년 7월 세종시 최초의 대학병원으로 개원하여 의사직만 136명을 확보 세종 및 중부권 중심병원으로 발전하고 있다.
· 산업문제 : 환자의 진료에서 정진기를 사용한 진단은 가장 기초적인 진단법이긴 하나 비침습적으로 환자의 상태를 가장 신속하게 진단할 수 있는 방법이다. 청진시 접촉잡음, 환경음(말소리 등)뿐만 아니라 환자 몸의 장기에서 나는 소리(심장음 등)가 함께 청진이 되어 올바른 진단을 하기 어렵게 문제가 존재한다. 청진의 정확도를 높이기 위해서는 청진시 함께 들리는 이러한 잡음을 제거하는 것이 중요하다.
[문제해결 결과]
· 제시된 해결방안 : Discrete Wavelet Transform (DWT, 이산 웨이블렛 변환), Empirical Mode Decomposition (EMD, 경험적 모드 분해법), Variational Mode Decomposition (VMD, 변동 모드 분해법), Spectral gating/filter, Butterworth Lowpass Filter, Savitzky?Golay smoothing (Polynomial Lowpass Filter)을 활용한 청진음 잡음 감쇠
· 활용계획 및 기대성과 : 위의 결과에서 최종적으로 제안된 알고리즘들이 실제 의료현장에서 질병, 질환 진단 시에 발생하는 심장음, 환경음, 접촉잡음 등과 같은 주요 잡음만을 정확하게 감쇄하거나 제거하는 것은 아니라, 전반적인 잡음의 강도를 약화시키는 정도의 효과를 얻을 수 있었다. 따라서 DWT, Butterworth Lowpass Filter, Savitzky?Golay smoothing와 심장음, 환경음, 접촉잡음 등과 같은 패턴을 분석하여 추출할 수 있는 변형된 EMD, VMD 방법론을 개발할 수 있으면 매우 좋은 잡음감쇄 또는 잡음제거 알고리즘을 개발할 수 있을 것으로 기대된다.
· 기업소개 : 교육 및 연구와 진료를 통하여 의학 발전을 도모하고 국민건강 향상에 기여하는 국립대학교병원의 설립이념에 따라 1956년 11월에 개원하여 현재 세계적 수준의 의료진과 첨단 진료센터를 갖춘 최고의 공공 메디컬센터
· 산업문제 : 당뇨발생 예측에 도움이 되는 식이패턴 군집 및 신규데이터 군집 예측
[문제해결 결과]
· 제시된 해결방안 : 기존의 군집기법으로는 유의미한 군집패턴을 찾기가 어려웠기 때문에 새로운 군집기법을 제시하여 유의미한 차이를 보이는 군집들을 찾을 수 있었음
[키워드]
의료, 당뇨, 군집, 음식섭취
[산업문제내용]
· 기업소개 : 교육 및 연구와 진료를 통하여 의학 발전을 도모하고 국민건강 향상에 기여하는 국립대학교병원의 설립이념에 따라 1956년 11월에 개원하여 현재 세계적 수준의 의료진과 첨단 진료센터를 갖춘 최고의 공공 메디컬센터
· 산업문제 : 당뇨발생 예측에 도움이 되는 식이패턴 군집 및 신규데이터 군집 예측
[문제해결 결과]
· 제시된 해결방안 : 기존의 군집기법으로는 유의미한 군집패턴을 찾기가 어려웠기 때문에 새로운 군집기법을 제시하여 유의미한 차이를 보이는 군집들을 찾을 수 있었음
· 기업소개 : loT 데이터를 기반으로 동작균형 분석 솔루션을 제공하는 기업
· 산업문제 : IMU 장치로부터 시계열 측정 데이터를 통해 건강상태를 판단하기 위한 정량적 지표를 위한 수학적 모델 개발
[문제해결 결과]
· 제시된 해결방안 : FFT를 활용한 Entropy 계산 후 건강 상태 구분, Sample Entropy를 계산함, 건강, 보통/심각 분류 XGBoost 93%, Random Forest 97%의 정확도 도출, Feature importance의 결과, sample entropy가 건강의 이진분류에서 중요하게 나타남.
· 활용계획 및 기대성과 : 보행데이터를 바탕으로 근골격계 관련 질병/손상의 정도에 따른 건강상태 구분 가능, 건강상태를 구분하는 새로운 지표를 제시하였고 건강 상태 조기 예측 및 알림 가능
[키워드]
시계열데이터, 건강데이터, Entropy
[산업문제내용]
· 기업소개 : loT 데이터를 기반으로 동작균형 분석 솔루션을 제공하는 기업
· 산업문제 : IMU 장치로부터 시계열 측정 데이터를 통해 건강상태를 판단하기 위한 정량적 지표를 위한 수학적 모델 개발
[문제해결 결과]
· 제시된 해결방안 : FFT를 활용한 Entropy 계산 후 건강 상태 구분, Sample Entropy를 계산함, 건강, 보통/심각 분류 XGBoost 93%, Random Forest 97%의 정확도 도출, Feature importance의 결과, sample entropy가 건강의 이진분류에서 중요하게 나타남.
· 활용계획 및 기대성과 : 보행데이터를 바탕으로 근골격계 관련 질병/손상의 정도에 따른 건강상태 구분 가능, 건강상태를 구분하는 새로운 지표를 제시하였고 건강 상태 조기 예측 및 알림 가능
· 기업소개 : ㈜디엔은 인공지능을 활용한 안과용 진단 의료기기 및 소프트웨어를 개발, 생산하는 기업
· 산업문제 : 원격 동공 반응 검사를 위한 동공 크기 측정 방법 연구 및 관련 문제 해결
[문제해결 결과]
· 제시된 해결방안 : 영상 데이터로부터 측정된 동공의 크기 값에 알맞은 평활화 작업을 찾아서 제시하였고, 이를 바탕으로 동공 반응 검사의 객관적인 지표에 관한 결과를 얻음
· 활용계획 및 기대성과 : 원격의료 시스템 구축 및 모바일 헬스케어를 이용한 생활 밀착형 건강관리 분야에 활용 예정
[키워드]
원격 동공 반응 검사, 영상데이터 분석, 원격 검사
[산업문제내용]
· 기업소개 : ㈜디엔은 인공지능을 활용한 안과용 진단 의료기기 및 소프트웨어를 개발, 생산하는 기업
· 산업문제 : 원격 동공 반응 검사를 위한 동공 크기 측정 방법 연구 및 관련 문제 해결
[문제해결 결과]
· 제시된 해결방안 : 영상 데이터로부터 측정된 동공의 크기 값에 알맞은 평활화 작업을 찾아서 제시하였고, 이를 바탕으로 동공 반응 검사의 객관적인 지표에 관한 결과를 얻음
· 활용계획 및 기대성과 : 원격의료 시스템 구축 및 모바일 헬스케어를 이용한 생활 밀착형 건강관리 분야에 활용 예정
· 기업소개 : 숙박 업소의 정보를 소비자에게 제공하고 편리한 예약을 가능하게 하는 숙박 O2O 서비스 기업임
· 산업문제 : 고객의 구매 이력 데이터 등으로 쿠폰의 효용성 분석 및 구매 전환율을 높이기 위한 쿠폰 효용성 증대 방법 개발
[문제해결 결과]
· 제시된 해결방안 : 지역별 및 요일별 고객의 쿠폰 사용 특성이 구별됨을 확인, Hwakes process로 숙소 사용 이벤트를 예측한 결과 쿠폰 사용 구매가 다음번의 쿠폰 사용 구매를 가장 많이 촉진됨을 확인, 숙박 구매 건수와 쿠폰 사용 구매 건수의 Granger-causality 계산 결과를 확인
· 활용계획 및 기대성과 : 업체의 쿠폰 제공 전략의 효과성을 측정하는 지표로 활용될 수 있는 다양한 수리적 모형의 개발 가능성을 보여줌
[키워드]
특성분석, 고객 분석, 구매전환율
[산업문제내용]
· 기업소개 : 숙박 업소의 정보를 소비자에게 제공하고 편리한 예약을 가능하게 하는 숙박 O2O 서비스 기업임
· 산업문제 : 고객의 구매 이력 데이터 등으로 쿠폰의 효용성 분석 및 구매 전환율을 높이기 위한 쿠폰 효용성 증대 방법 개발
[문제해결 결과]
· 제시된 해결방안 : 지역별 및 요일별 고객의 쿠폰 사용 특성이 구별됨을 확인, Hwakes process로 숙소 사용 이벤트를 예측한 결과 쿠폰 사용 구매가 다음번의 쿠폰 사용 구매를 가장 많이 촉진됨을 확인, 숙박 구매 건수와 쿠폰 사용 구매 건수의 Granger-causality 계산 결과를 확인
· 활용계획 및 기대성과 : 업체의 쿠폰 제공 전략의 효과성을 측정하는 지표로 활용될 수 있는 다양한 수리적 모형의 개발 가능성을 보여줌
· 기업소개 : 삼성서울병원은 최고의 의료 기술로 중증 고난도 환자를 맞춤 치료하여 최고의 치료 성과를 구현하는 병원을 추구하고 있으며, 특히 미래의료를 선도하는 첨단 지능형 병원을 만들기 위해 혁신 중임
· 산업문제 : 기계학습 기반 혈압파형의 정상과 비정상을 자동으로 감지하는 알고리듬 개발 및 실시간 데이터 분류 및 모니터링을 위한 소프트웨어의 개발
[문제해결 결과]
· 제시된 해결방안 : 1. 혈압 파형 자동 주기추출 알고리듬 개발
2. 레이블링을 위한 GUI 소프트웨어 개발
3. 레이블링된 데이터를 이용한 혈압 파형 구분 딥러닝 모델의 개발
4. GUI기반 혈압 모니터링 소프트웨어 개발
· 활용계획 및 기대성과 : 실시간 혈압데이터는 수술장에서 환자의 상태를 모니터링하거나 혈관의 기능을 평가하기 위해 사용되는 데이터로 이에 대한 기계학습 기반의 모니터링은 의사로 하여금 불필요한 작업을 줄여줄 수 있을 뿐만 아니라 정확한 지표를 계산하는데 활용 될 수 있다. 현재 문제해결 단계에서는 실시간 입력파형을 상정하여 데이터를 처리하고 있지만 추후 병원과의 연계를 통해 실제 측정 장치에서 입력받는 데이터를 처리할 수 있을 것으로 기대한다.
[키워드]
혈압파형, 자동추출, 파형구분
[산업문제내용]
· 기업소개 : 삼성서울병원은 최고의 의료 기술로 중증 고난도 환자를 맞춤 치료하여 최고의 치료 성과를 구현하는 병원을 추구하고 있으며, 특히 미래의료를 선도하는 첨단 지능형 병원을 만들기 위해 혁신 중임
· 산업문제 : 기계학습 기반 혈압파형의 정상과 비정상을 자동으로 감지하는 알고리듬 개발 및 실시간 데이터 분류 및 모니터링을 위한 소프트웨어의 개발
[문제해결 결과]
· 제시된 해결방안 : 1. 혈압 파형 자동 주기추출 알고리듬 개발
2. 레이블링을 위한 GUI 소프트웨어 개발
3. 레이블링된 데이터를 이용한 혈압 파형 구분 딥러닝 모델의 개발
4. GUI기반 혈압 모니터링 소프트웨어 개발
· 활용계획 및 기대성과 : 실시간 혈압데이터는 수술장에서 환자의 상태를 모니터링하거나 혈관의 기능을 평가하기 위해 사용되는 데이터로 이에 대한 기계학습 기반의 모니터링은 의사로 하여금 불필요한 작업을 줄여줄 수 있을 뿐만 아니라 정확한 지표를 계산하는데 활용 될 수 있다. 현재 문제해결 단계에서는 실시간 입력파형을 상정하여 데이터를 처리하고 있지만 추후 병원과의 연계를 통해 실제 측정 장치에서 입력받는 데이터를 처리할 수 있을 것으로 기대한다.
· 기업소개 : 삼성서울병원은 병상 수 기준으로 국내 3위 규모의 국내 대표 대형병원임. 최고의 의료 기술로 중증 고난도 환자를 맞춤 치료하여 최고의 치료 성과를 구현하는 병원을 추구하고 있으며, 특히 미래의료를 선도하는 첨단 지능형 병원을 만들기 위해 혁신 중임.
· 산업문제 : 혈압 시계열 등 생체 데이터 분석을 통한 심박출률 예측 모델 개발
[문제해결 결과]
· 제시된 해결방안 : 혈압 시계열 데이터의 전처리 소프트웨어 개발, 심혈관계의 수학적 모델링을 이용한 심박출률 예측, 혈압 시계열의 기준점들로부터 구성된 특성들을 기계학습에 적용한 심박출률 예측과 심박출률에 따른 분류
· 활용계획 및 기대성과 : 혈압 시계열 데이터의 처리 기법과 수학적 모델 기법, 기계학습 기법은 스마트 웨어러블 기계로부터 얻어질 혈압 시계열 데이터를 분석하여 심장기능 진단 지표를 예측, 개인의 건강을 관리하고 위급상황에 대처하는 연구에 있어 중요한 초석이 될 것임
[키워드]
심혈관계, 혈압 시계열, 심박출률, 수학적 모델링, 기계학습
[산업문제내용]
· 기업소개 : 삼성서울병원은 병상 수 기준으로 국내 3위 규모의 국내 대표 대형병원임. 최고의 의료 기술로 중증 고난도 환자를 맞춤 치료하여 최고의 치료 성과를 구현하는 병원을 추구하고 있으며, 특히 미래의료를 선도하는 첨단 지능형 병원을 만들기 위해 혁신 중임.
· 산업문제 : 혈압 시계열 등 생체 데이터 분석을 통한 심박출률 예측 모델 개발
[문제해결 결과]
· 제시된 해결방안 : 혈압 시계열 데이터의 전처리 소프트웨어 개발, 심혈관계의 수학적 모델링을 이용한 심박출률 예측, 혈압 시계열의 기준점들로부터 구성된 특성들을 기계학습에 적용한 심박출률 예측과 심박출률에 따른 분류
· 활용계획 및 기대성과 : 혈압 시계열 데이터의 처리 기법과 수학적 모델 기법, 기계학습 기법은 스마트 웨어러블 기계로부터 얻어질 혈압 시계열 데이터를 분석하여 심장기능 진단 지표를 예측, 개인의 건강을 관리하고 위급상황에 대처하는 연구에 있어 중요한 초석이 될 것임
· 기업소개: (주)지인플러스는 빅데이터 기반의 부동산 정보를 제공하는 스타트업 기업으로 지역 분석 및 아파트 가치에 대한 데이터 플랫폼 부동산 지인을 개발 운영하고 있다.
· 산업문제: 세대수가 많고 거래가 활발한 아파트는 실거래가 시계열 데이터를 활용해서 해당 가치 상승 하락 시세 패턴을 분석하기 쉽다. 또한, 이 실거래가 시계열 데이터를 활용해서 해당 아파트와 패턴이 유사한 아파트를 쉽게 찾을 수 있다. 하지만 거래량이 적거나 세대수가 적은 아파트는 실거래가 자료가 없어서 어떠한 시세 패턴(가격 상승 및 하락)을 따르는지 파악하기가 어렵다. 그래서 기업은 공개된 다양한 부동산 공공 데이터를 활용하여 실거래가 없는 아파트들에 대해서 합리적이고 수학적인 가치평가 방법을 찾고자 연구소에 문제를 의뢰하였다. 거래가 충분한 아파트의 거래 정보로부터 시세 패턴을 추출하여 대표 패턴 (representatives)을 생성하고 거래가 없는 아파트가 어떠한 시세 패턴을 보일 것인지 추정하는 수학적인 방법을 찾는 것을 목표하였다.
[문제해결 결과]
· 제시된 해결방안:
1. (실거래가 패턴 추출) 거래가 많은 아파트의 기준을 설정하고 분석 대상인 시계열 시세 패턴을 추출하는 방법을 찾아서 제시하였다. 단순 거래량이 아닌 거래가 있는 유 개월 수의 비율을 통해서 아파트를 필터링하고 평활화(smoothing)와 선형보간(linear interpolation)을 수행하였다. 평활화 방법으로는 사이즈를 5로 한 rolling median을 적용하였다.
2. (시계열 패턴 군집화) 아파트 대표 패턴의 유사도를 측정하는 방법과 군집화하는 유의미한 방법을 찾아서 제시하였다. 시계열 데이터를 L1 정규화하고 Euclidean 거리로 유사도를 측정하였다. 그리고 L1 정규화된 공간에서 K-means 알고리즘으로 군집화하였다.
3. 아파트를 클러스터로 라벨링하고 아파트의 특성 정보(위치, 평균거래가, 건축연도, 용적률, 연면적 등)로 분류하는 모델을 적용하여 특성 정보로 시세 패턴 매칭이 가능한지 확인하였다. 또한 어떤 특성 정보가 상승 하락 시세 패턴에 큰 영향을 미치는지 분석하였다.
· 활용계획 및 기대성과:
1. 스케일이 다른 시계열 데이터의 패턴 유사도 분석 방법을 기업의 플랫폼에 탑재 예정에 있다. 또한 수학적으로 의미있고 설명 가능한 시계열 데이터 군집화 방법을 제시하였다.
2. 시계열 데이터의 선행 후행 분석 및 일반 거리를 활용한 군집화 방법 연구라는 새로운 연구 주제를 발굴하여 향후 연구소에서 연구할 예정이다.
[키워드]
시계열 데이터, 유사도 분석, 군집화, K-means, 정규화
[산업문제내용]
· 기업소개: (주)지인플러스는 빅데이터 기반의 부동산 정보를 제공하는 스타트업 기업으로 지역 분석 및 아파트 가치에 대한 데이터 플랫폼 부동산 지인을 개발 운영하고 있다.
· 산업문제: 세대수가 많고 거래가 활발한 아파트는 실거래가 시계열 데이터를 활용해서 해당 가치 상승 하락 시세 패턴을 분석하기 쉽다. 또한, 이 실거래가 시계열 데이터를 활용해서 해당 아파트와 패턴이 유사한 아파트를 쉽게 찾을 수 있다. 하지만 거래량이 적거나 세대수가 적은 아파트는 실거래가 자료가 없어서 어떠한 시세 패턴(가격 상승 및 하락)을 따르는지 파악하기가 어렵다. 그래서 기업은 공개된 다양한 부동산 공공 데이터를 활용하여 실거래가 없는 아파트들에 대해서 합리적이고 수학적인 가치평가 방법을 찾고자 연구소에 문제를 의뢰하였다. 거래가 충분한 아파트의 거래 정보로부터 시세 패턴을 추출하여 대표 패턴 (representatives)을 생성하고 거래가 없는 아파트가 어떠한 시세 패턴을 보일 것인지 추정하는 수학적인 방법을 찾는 것을 목표하였다.
[문제해결 결과]
· 제시된 해결방안:
1. (실거래가 패턴 추출) 거래가 많은 아파트의 기준을 설정하고 분석 대상인 시계열 시세 패턴을 추출하는 방법을 찾아서 제시하였다. 단순 거래량이 아닌 거래가 있는 유 개월 수의 비율을 통해서 아파트를 필터링하고 평활화(smoothing)와 선형보간(linear interpolation)을 수행하였다. 평활화 방법으로는 사이즈를 5로 한 rolling median을 적용하였다.
2. (시계열 패턴 군집화) 아파트 대표 패턴의 유사도를 측정하는 방법과 군집화하는 유의미한 방법을 찾아서 제시하였다. 시계열 데이터를 L1 정규화하고 Euclidean 거리로 유사도를 측정하였다. 그리고 L1 정규화된 공간에서 K-means 알고리즘으로 군집화하였다.
3. 아파트를 클러스터로 라벨링하고 아파트의 특성 정보(위치, 평균거래가, 건축연도, 용적률, 연면적 등)로 분류하는 모델을 적용하여 특성 정보로 시세 패턴 매칭이 가능한지 확인하였다. 또한 어떤 특성 정보가 상승 하락 시세 패턴에 큰 영향을 미치는지 분석하였다.
· 활용계획 및 기대성과:
1. 스케일이 다른 시계열 데이터의 패턴 유사도 분석 방법을 기업의 플랫폼에 탑재 예정에 있다. 또한 수학적으로 의미있고 설명 가능한 시계열 데이터 군집화 방법을 제시하였다.
2. 시계열 데이터의 선행 후행 분석 및 일반 거리를 활용한 군집화 방법 연구라는 새로운 연구 주제를 발굴하여 향후 연구소에서 연구할 예정이다.
· 기업소개: (주)타키온테크는 스마트 팩토리 관련 솔루션을 보유한 스타트업 기업으로 제조 공정의 센서 데이터 분석 을 통한 생산품의 불량감지와 기계의 상태 이상 모니터링 솔루션을 개발 운영하고 있다.
· 산업문제: 생산 제조 공정의 생산품 불량감지와 기계 이상감지는 실시간으로 진행된다. 또한 실제 공장에서 수집되는 센서 데이터는 많 은 양의 불량 데이터를 확보하기 어렵기 때문에 정상 데이터만으로 학습해서 불량을 감지해낼 수 있어야 한다. 그래서 본 기업과 연구소는 실시간 처리가 가능하며 정상 데이터만으로 학습하는 One class classification(이하 OCC, 또는 Novelty detection) 이상감지 알고리즘의 개발 및 수학적인 개선을 목표로 하였다.
사전 연구를 통하여 RRCF 알고리즘(Robust Random Cut Forest, 2016)이 CNC 전류 및 생산 로봇 진동 데이터를 포함한 다양한 벤치마크 데이터에서 높은 정확도와 높은 AUROC를 보여주는 등 OCC 문제에 효과적이라는 것을 확인하였다. 하지만 실시간 이상감지에 적용하기 어려울 정도로 속도가 느리고 모델사이즈가 크다는 문제점이 있었다. 이에 RRCF 알고리즘을 실제 산업현장에서 활용 가능한 수준으로 개선하고 RRCF의 적정 하이퍼파라미터에 대한 연구와 기존의 이상감지 알고리즘과의 비교 분석 연구를 의뢰하였다.
[문제해결 결과]
· 제시된 해결방안:
1. 수학적인 분석을 통한 이상 스코어 연산 과정을 경량화하였다. 새로운 포인트의 추가로 인한 트리 생성 과정없이 이상 스코어를 계산하는 방법을 찾아서 제시하였다.
2. 학습 데이터로 트리를 생성할 때 데이터의 모든 특징을 사용하는 것이 아니라 적당한 수 만큼 임의로(uniformly random)선택하여 트리를 생성하는 '특징 샘플링' 방법을 제시하였다. 이 방법을 통해서 트리를 생성하는데 사용되는 데이터의 크기가 줄어들어서 모델 사이즈의 경량화와 개선된 빠른 속도를 얻을 수 있었다. 또한, 사전에 임의로 특징을 선택하기 때문에 레인지가 작은 마이너한 차원에서 발생하는 불량 감지를 가능하게 한다.
3. RRCF는 고정된 테스트 샘플에 대해 매번 다른 스코어 결과를 주는데 기댓값으로 이상 스코어를 주는 방법을 제시하였다. 즉, 스코어링 과정에서 존재하는 랜덤 프로세스를 결정적인 프로세스로 바꾸는 방법을 연구하였다.
· 활용계획 및 기대성과 :
1. 로봇 데이터 뿐만 아니라 사출기, 정밀 가공기, 공장 설비 등에 다양하게 적용할 수 있도록 서비스를 개발 진행 중에 있다. 20201년 해당 방법이 탑재된 솔루션을 개발할 예정이고 다양한 데이터 세트 검증 중에 있다.
2. 중소벤처기업부가 구축중인 AI 중소벤처 제조 플랫폼(KAMP)에 제조 AI 빅데이터 분석 알고리즘으로 탑재를 목표로 하고 있다.
[키워드]
이상감지, RRCF, One class classification, 랜덤 트리
[산업문제내용]
· 기업소개: (주)타키온테크는 스마트 팩토리 관련 솔루션을 보유한 스타트업 기업으로 제조 공정의 센서 데이터 분석 을 통한 생산품의 불량감지와 기계의 상태 이상 모니터링 솔루션을 개발 운영하고 있다.
· 산업문제: 생산 제조 공정의 생산품 불량감지와 기계 이상감지는 실시간으로 진행된다. 또한 실제 공장에서 수집되는 센서 데이터는 많 은 양의 불량 데이터를 확보하기 어렵기 때문에 정상 데이터만으로 학습해서 불량을 감지해낼 수 있어야 한다. 그래서 본 기업과 연구소는 실시간 처리가 가능하며 정상 데이터만으로 학습하는 One class classification(이하 OCC, 또는 Novelty detection) 이상감지 알고리즘의 개발 및 수학적인 개선을 목표로 하였다.
사전 연구를 통하여 RRCF 알고리즘(Robust Random Cut Forest, 2016)이 CNC 전류 및 생산 로봇 진동 데이터를 포함한 다양한 벤치마크 데이터에서 높은 정확도와 높은 AUROC를 보여주는 등 OCC 문제에 효과적이라는 것을 확인하였다. 하지만 실시간 이상감지에 적용하기 어려울 정도로 속도가 느리고 모델사이즈가 크다는 문제점이 있었다. 이에 RRCF 알고리즘을 실제 산업현장에서 활용 가능한 수준으로 개선하고 RRCF의 적정 하이퍼파라미터에 대한 연구와 기존의 이상감지 알고리즘과의 비교 분석 연구를 의뢰하였다.
[문제해결 결과]
· 제시된 해결방안:
1. 수학적인 분석을 통한 이상 스코어 연산 과정을 경량화하였다. 새로운 포인트의 추가로 인한 트리 생성 과정없이 이상 스코어를 계산하는 방법을 찾아서 제시하였다.
2. 학습 데이터로 트리를 생성할 때 데이터의 모든 특징을 사용하는 것이 아니라 적당한 수 만큼 임의로(uniformly random)선택하여 트리를 생성하는 '특징 샘플링' 방법을 제시하였다. 이 방법을 통해서 트리를 생성하는데 사용되는 데이터의 크기가 줄어들어서 모델 사이즈의 경량화와 개선된 빠른 속도를 얻을 수 있었다. 또한, 사전에 임의로 특징을 선택하기 때문에 레인지가 작은 마이너한 차원에서 발생하는 불량 감지를 가능하게 한다.
3. RRCF는 고정된 테스트 샘플에 대해 매번 다른 스코어 결과를 주는데 기댓값으로 이상 스코어를 주는 방법을 제시하였다. 즉, 스코어링 과정에서 존재하는 랜덤 프로세스를 결정적인 프로세스로 바꾸는 방법을 연구하였다.
· 활용계획 및 기대성과 :
1. 로봇 데이터 뿐만 아니라 사출기, 정밀 가공기, 공장 설비 등에 다양하게 적용할 수 있도록 서비스를 개발 진행 중에 있다. 20201년 해당 방법이 탑재된 솔루션을 개발할 예정이고 다양한 데이터 세트 검증 중에 있다.
2. 중소벤처기업부가 구축중인 AI 중소벤처 제조 플랫폼(KAMP)에 제조 AI 빅데이터 분석 알고리즘으로 탑재를 목표로 하고 있다.