본문 바로가기 주메뉴 바로가기
검색 검색영역닫기 검색 검색영역닫기 ENGLISH 메뉴 전체보기 메뉴 전체보기

문제해결 보고서

코어셋 알고리즘 개발

등록일자 :
  • 산업문제명코어셋 알고리즘 개발
  • 기업에이엠스퀘어(주)
  • 키워드1. coreset 2. large-scale data 3. logistic regression 4. Bayesian inference 5. importance sampling 6. sensitivity score
  • 산업문제 내용· 기업소개: 에이엠스퀘어는 제조, 통신, 바이오 등 다양한 산업 분야의 AI 서비스 모델을 개발하는 회사로, 특히 데이터 분석과 수학적 기술의 적용 및 기술 혁신을 통해 현업에서의 실질적인 문제 해결, 가치 창출을 추구함 · 산업문제: 압연공정에서 연속적으로 생성되는 대량의 데이터를 모두 기계학습에 사용하기에는 문제가 있고, 현장의 기술자가 요구하는 대로 데이터 전체를 저장하는 과정에도 한계가 있다. 이를 해결하는 방법으로 에이엠스퀘어(주)는 압연공정에서 생성된 데이터로부터 코어셋을 선택하고 데이터 저장은 코어셋으로 한정하는 방법을 제안하였다. 코어셋은 큰 규모의 원본 데이터를 효율적으로 잘 표현할 수 있는 작은 크기의 부분집합으로, 동일한 기계학습 방법을 적용하였을 때 코어셋만으로 원본 데이터와 비슷한 결과를 얻을 수 있기 때문에 현장의 기술자가 데이터를 삭제하는데 부담을 가지지 않을 수 있다.
  • 문제해결 결과· 제시된 해결방안: - 코어셋 선정에 관한 최근 연구 분석 - 이를 바탕으로 적당한 코어셋 선정 알고리즘을 선택한 후 현실 환경에 맞게 효율적으로 구현 - 구현된 알고리즘을 이용해 압연공정에서 생성된 데이터로부터 코어셋을 추출한 후 비교 분석 · 활용계획 및 기대성과: - 제조 공정에서 수집되는 데이터를 일부(코어셋)만 저장하면서도 분석 시 성능을 유지하게 하여 데이터 저장 비용 절감 - 분산된 데이터 수집 효율성 증대 - 구현 성능 향상을 통한 서비스 개발 가속화

이 페이지에서 제공하는 정보에 대해 만족하십니까?