본문 바로가기 주 메뉴 바로가기

공지사항

2nd Workshop on Artificial Intelligence for Industrial Mathematics

작성일작성자 박세영
![](/file/7f7a59c4fc7248a287b0a6ecae68885f.png) ![](/file/3004d75ca2a7424184d23ff26e229e5f.png) # [일자별 세부 내용] # ▶ 6.26(월) **1. System Identification and Online Learning of LQR. 김연응(서울과학기술대학교)** In this talk, two aspects of learning stochastic Linear Quadratic Regulator (LQR) are discussed. Beginning with the exploration of the offline system identification problem, a recent result on the online learning problem is introduced. We first take a Bayesian perspective to identify unknown parameters of linear stochastic systems with possibly non-Gaussian disturbance distributions. We show that the proposed algorithm asymptotically achieves the concentration of posterior distributions around the true system parameter. We then extend the idea introduced to the online learning problem by leveraging the idea of Thompson sampling (TS). TS is known to effectively address the exploration-exploitation trade-off in online learning problems including reinforcement learning for linear-quadratic regulators (LQR). We propose a new TS algorithm for LQR, exploiting Langevin dynamics to handle a larger class of problems including those with non-Gaussian noises. The talk is based on the joint work with Gihun Kim and Insoon Yang (Seoul National University). **2. 그래프 신경망 및 이종 그래프로의 응용과 챌린지 소개. 신원용(연세대학교)** 그래프 신경망 (GNN: graph neural network)은 그래프에서 높은 표현 능력과 함께 특징 정보를 추출하는 방법론으로 학계와 산업체에서 최근 폭발적인 관심을 받고 있다. 본 강연에서는 그래프 신경망의 개요 및 주요 동작 원리를 다룬다. 구체적으로, message passing의 원리를 이해하고 state-of-the-art 알고리즘에서 사용한 다양한 message passing 함수를 소개한다. 다양한 종류의 그래프들이 존재하지만, 본 강연에서는 이종 그래프 (heterogeneous graph)에서의 그래프 신경망을 활용하여 표현 학습을 하는 방안을 소개한다. 크게 두 가지 방법론이 있는데, meta-path 기반 그래프 신경망 학습법과 관계 예측 기반 그래프 신경망 학습법을 다룬다. 또한, 존재하는 이종 그래프에서의 표현 학습 시 생각해볼 수 있는 여러 연구 챌린지 또한 소개한다. 마지막으로, 발표자 연구실에서 제안한 이종 그래프가 불완전할 경우 관계 예측을 통해 그래프 신경망을 설계하는 새로운 방법을 공유하고 토의한다. # ▶ 6.27(화) **1. Diffusion Models for Inverse Problems in Medical Imaging. 예종철(KAIST)** Recently, diffusion models have been used to solve various inverse problems for medical imaging applications in an unsupervised manner. However, the current solvers, which recursively apply a reverse diffusion step followed by a measurement consistency step, often produce sub-optimal results. By studying the generative sampling path, we show that current solvers throw the sample path off the data manifold, and hence the error accumulates. Furthermore, diffusion models are inherently slow to sample from, needing few thousand steps of iteration to generate images from pure Gaussian noise. In this talk, we show that starting from Gaussian noise is unnecessary. Instead, starting from a single forward diffusion with better initialization significantly reduces the number of sampling steps in the reverse conditional diffusion. This phenomenon is formally explained by the contraction theory of the stochastic difference equations like our conditional diffusion strategy - the alternating applications of reverse diffusion followed by a non-expansive data consistency step. Furthermore, we propose an additional correction term inspired by the manifold constraint, which can be used synergistically with the previous solvers to make the iterations close to the manifold. Experimental results with image inpainting, and compressed sensing MRI and sparse-view CT demonstrate that our method can achieve state-of-the-art reconstruction performance at significantly reduced sampling steps. **2. 응용수학과 딥러닝의 산업에의 적용. 강명주(서울대학교)** 1990년 이후 많은 수학자들이 레벨셋(Levelset) 방법, 편미분 방정식 및 변분법을 기반으로 한 이미지 처리를 연구해왔습니다. 레벨셋 방법은 영화에서 실제 장면을 만드는 데 주요 기술 중 하나였습니다. 이미지 처리 연구에서는 TV 및 최적화 기술을 사용하여 많은 향상이 있었습니다. 그러나 갑자기 딥러닝 방법이 등장하여 매우 어려운 또는 미해결 문제를 해결하는 데 사용되는 기술이 되었습니다. 저는 레벨셋 방법, 이미지 처리 및 딥러닝의 이론과 응용, 또한 산업에의 적용에 대해 발표하려고 합니다. **3. Machine Learning Safety. 신진우(KAIST)** As deep learning models are getting more and more intelligent, unsafe (yet intelligent) AI systems reveal new societal risks.In this talk, I will briefly introduce recent key research trends in AI safety: (a) robustness, (b) monitoring and (c) alignment. **4. 소재 및 반도체 AI 연구 현황 및 향후 발전 방향. 최영상(삼성종합기술원)** SAIT은 지난 수년간 딥러닝 기반 음성인식, 얼굴인식 기술 등 AI 기술을 개발하여 성공적으로 소비자 제품에 적용해 왔으며, 이를 통해 축적된 기술을 바탕으로 반도체 설계, 제조, 품질 등 반도체 개발의 효율화와 신소재 개발 프로세스 혁신을 위한 소재개발 AI 기술을 개발 중이다. 소비자향 AI 기술과 비교할 때 반도체, 소재 연구 등 기술 개발 효율화를 위한 AI 기술은 학습 데이터의 규모와 비용, 도메인 전문가의 지식 활용 필요성 등에서 큰 기술적 도전에 직면하고 있으며, 알고리즘 연구자들이 현업 도메인 전문가들과의 협력을 통해서 이 문제를 해결하고 있다. 거대 언어모델을 포함한 지속적인 연구 개발을 통해 Autonomous Fab 및 Autonomous Lab의 비전을 달성하기 위해 지속적으로 연구할 계획이다. # ▶ 6.28(수) **1. Stochastic Differential Equations + Deep Learning = Diffusion Probabilistic Models. 류경석(서울대학교)** This tutorial overviews the recent development of diffusion probabilistic models and their connection with stochastic differential equations. **2. Introduction to AI in Medicine. 김남국(서울아산병원)** 근래에 혁명적인 인공지능의 발전은 사회 전반에 영향을 끼치고 있다. 특히, 의료 분야에 적극적으로 도입되고 있으며, 향후 많은 의료가 바뀔 것으로 예측된다. 역사적으로 산업화 대열에 늦게 참여한 우리나라에게 인공지능혁명의 도래는 ‘위기이자 기회’가 될 수 있다. 이 ‘딥러닝’ 기술은 자연어 처리, 영상, 음성 등 다양한 영역에서 인간을 넘어서는 성능을 보여주고 있다. 특히 최근 생성 인공지능의 성공적인 개발 및 적용은 의료 분야에서 또 한 번 도약을 할 수 있는 상황이 되었다고 생각된다. 의학분야에서도 인공지능이 개발 시점을 지나서 적극적으로 도입되고 있다. 유수의 해외 저널에서 다양한 인공지능이 다양한 질환을 진단하는 것이 그 분야 전문의와 필적하는 성능을 보인다는 연구나 출간되고 있을 뿐더러, 이제 인공지능을 활용하여 실제 진료에 얼마나 도움이 되고 있는지에 대한 논의를 적극적으로 하고 있다. 하지만, 병원의 특성상 다양한 분야에 다양한 필요성이 있지만, 적극적으로 활용되기 위해서는 넘어야 할 산이 많다. 본 강의는 목요일에 있을 의료 인공지능 Session의 introduction 개념으로 준비되었다. 다양한 임상 진료의 관점에서 자연어처리, 영상, 시그널 등의 인공지능이 어떻게 개발되고, 적용되고 있는지에 대한 개괄을 할 예정이다. 병원에서 연구하는 공학자 입장에서는 이런 기술을 개발하고 적용하는데 필요한 지식을 전달하여 목요일 강의의 준비를 할 수 있게 하는 것이 본 강의의 목표일 것이다. 특히, 다양한 의료 분야에서 진행되고 있는 인공지능 학습 경험, trends 등을 정리하고, 이를 학습할 때 생기는 다양한 문제들을 정리할 것이다. 특히 의료 데이터의 long tail 특성에서 오는 imbalance 문제나 rare pattern 등을 어떻게 해결할 것인지, 또한 convenient sampling에서 오는 bias 문제, novelty issue, continual learning issue 등을 다룰 예정이고, 이를 해결하기 위한 다양한 전략이나 기술 등도 다룰 예정이다. # ▶ 6.29(목) **1. Towards Foundational Deep Learning Models for Medical Imaging in the New Era. 유재준(UNIST)** Deep learning models, particularly convolutional neural networks (CNNs), have become essential to artificial intelligence in medical imaging. However, recent innovations in this field have primarily relied on large models and vast amounts of training data, which can be costly and challenging to obtain, especially within the medical domain. Despite these challenges, the development of a large-scale, 3D-capable pretrained model would undoubtedly benefit the medical imaging and research community. In this presentation, I will first explore the challenges and considerations associated with training a large-scale model for medical imaging, including data requirements, biases, training tasks, network architecture, privacy concerns, and computational demands. I will also introduce recent advancements in foundational models for medical imaging. Although these obstacles are considerable, they can be surmounted through collaboration between academic and industry partners in the information technology sector. **2. Bio-Signal Characteristics, Acquisition, and Artificial Intelligence Applications. 신항식(서울아산병원)** Bio-signals, such as electrocardiogram (ECG) and photoplethysmogram (PPG), hold valuable physiological information and are widely used in healthcare applications. In this lecture, we will explore the unique characteristics of bio-signals, including features such as frequency, amplitude, and duration, and delve into the bio-signal acquisition process. We will also discuss bio-signal feature engineering techniques, including time-domain and frequency-domain analysis, and suitable artificial intelligence (AI) models for bio-signal processing. Challenges and limitations in developing accurate AI models for bio-signals will be addressed, along with the importance of selecting appropriate features and models based on the specific characteristics of bio-signals and application requirements. This lecture aims to provide insights into the unique aspects of bio-signals and their acquisition process, and highlight the potential of AI in advancing healthcare through bio-signal analysis. **3. Math Model + AI for Sleep Disorders. 김재경(KAIST)** In this talk, I will illustrate collaborative stories between our math group and medical researchers to develop digital medicine for sleep disorders. First, I will describe how we used mathematical modeling to analyze the complex sleep patterns of shift workers measured with wearable devices to find optimal sleep patterns to treat sleep disorders of the shift workers. Second, I will describe how we use machine learning to simplify the current diagnosis for sleep disorders based on many sleep questionaries and complex polysomnography. **4. Applications of Deep Learning for Vision Health. 박상준(분당서울대학교병원)** 의학, 그 중에서도 안과 영역에서 컴퓨터 비전을 이용한 연구들과 실제 임상 현장에의 적용, 산업 문제 해결을 위한 노력들을 살펴보고자 합니다. 안과는 의사들도 낯설게 느끼는 분야입니다. 의학의 모든 분야가 전문성을 가지고 있지만, 내과와 외과 등으로 대표 되는 분야는 의학의 기본적인 부분이라 학생 때 주요하게 배우고 수련 기간에도 전공과 상관없이 많이 접하게 됩니다. 반면, 안과는 학생 및 수련 기간에 상대적으로 접하지 못할 뿐만 아니라, 안과에서 전안부 검진, 망막을 포함한 후안부의 검진, 그리고 신경학적 검진 등 낯설고 많은 훈련이 필요한 임상적인 특징들과 다른 임상의사들이 접하기 어려운 다양한 영상검사(망막안저사진, 빛간섭단층촬영영상, 등)과 전기생리학적 검사들이 사용되어 안과를 전공하지 않은 의사들은 안과적인 검진을 수행하기는 커녕, 안과의 임상경과관찰 기록과 안과 영상 및 전기생리학적 검사를 이해하는데도 어려움을 겪곤 합니다. 다행스럽게도 우리나라는 다른 선진국과 비교하더라도 상대적으로 의료 인프라가 잘 갖추어져 있는 편이고, 안과 영역의 인프라는 안과 의사의 수와 질, 그리고 안과 의료기관의 수와 질 모두에서 전세계 어느 나라보다도 더 훌륭합니다. 그렇지만, 선진국을 포함하여 다른 나라의 경우 안검사를 수행할 수 있는 의료 인프라를 갖추는데 많은 어려움을 겪고 있으며, 한정된 의료 자원을 분배할 때 안검사 관련 인프라는 상대적으로 낮은 우선순위를 가지게 됩니다. 이 때문에 대부분의 국가에서 안과 관련한 의료서비스가 충분히 제공되지 못하고 있습니다. 이런 상황에서 인공지능의 발전은 다른 의료분야와 마찬가지고 안과 영역에서도 기준의 미충족 수요들과 여러 문제들을 해결할 수 있을 것으로 기대되었고, 관련하여 많은 연구와 적용이 이루어졌습니다. 이에 제 발표에서는 먼저 안과 영역에 대한 간략한 소개와 질병부담이 큰 주요 안질환들과 이와 관련한 미충족된 수요들에 대해서 간략히 설명드리고자 합니다. 그리고, 지금까지 안과 영역에서 컴퓨터비전과 관련하여 어떤 인공지능연구들이 수행되어왔고 적용되었는지 말씀드리고 향후 발전 방향에 대해서 이야기하고자 합니다. **5. 생성모델 코드를 이해하기 위한 수학. 이준구(서울아산병원)** 생성 모델의 기본 개념은 주어진 데이터 분포를 모사하거나 생성하는 것이다. 영상데이터에서도 여러 생성 모델들이 소개되었으며, autoregressive model에서부터 variational autoencoder(VAE) 또는 generative adversarial network(GAN), flow model, 그리고 최근의 diffusion model에 이르기까지 다양한 종류의 생성 모델들이 연구되었고, 연구되고 있다. 생성 모델 이전의 convolution neural network 기반의 분류, 검출, 분할 모델에서는 레이블의 특성과 몇 가지의 loss function만 가지고도 코드를 이해하는데 어려움이 없었다. 그러나 생성 모델의 기반이 되는 확률 이론과 최적화 이론은 이해하기도 어렵거니와 어떻게 유도가 되었는지는 모르겠지만 코드 상에서는 너무나 간단히 나타나 있어 이 모델의 특징을 살펴보기 어렵게 만든다. 본 강의에서는 대학원에서 수학을 전공하지 않은 비전문가가 이해할 수 있는 수준에서 이 코드를 이해하기 위한 과정을 되짚어 가 보고자 한다. 우선 VAE에서 나타나는 evidence lower bound에 대해 알아보고, 이를 가져와 diffusion model에서도 다루어 보고자 한다. 일단, 소스코드를 설명하고, 코드상 보이는 loss function과 학습과정이 어떻게 유도되었는지 차근차근 따라가 볼 것이다. 이미 앞에서 말했듯 본 강사는 수학을 전공하지 않아서 수학적으로 깊은 이해를 바탕으로 하지 못하므로 유도과정에서 엄밀함이 부족하다는 것을 다시 한 번 말씀드리고, 넓은 아량으로 이해해 주시면 감사하겠다. **6. The Potential for Large-scale AI in Healthcare. 배웅(카카오브레인)** 요즘 GPT4 등 초거대 AI기술이 전 세계적으로 화두가 되고 있습니다. 이런 흐름이 헬스케어분야에도 많은 영향을 미치고 있습니다. 그 중 몇 가지 서비스 및 연구 사례들과 함께 저희 카카오브레인이 초거대 AI 기술력을 바탕으로 준비하고 있는 헬스케어 서비스 및 연구주제에 대해 소개해 드리고자 합니다. 더욱이 카카오브레인 헬스케어는 초거대 AI 기술이 서비스의 핵심이 될 수 있는 의료영상 진단보조 및 AI신약개발 플랫폼 분야의 연구를 진행함에 있어 어떠한 문제들에 주로 직면하게 되는지에 대해서도 공유드리겠습니다. **7. What's Next to Supervised Learning-based AI in Medicine. 김남국(서울아산병원)** Cross-sectional 영상 데이터셋을 활용한 의료 인공지능이 개발되고, 임상에 전향적으로 적용되면서 결과가 나오고 있다. 지난해 대한영상의학회는 포럼을 개최하고 현재의 AI 애플리케이션은 질병 유병률이 낮은 검진 환경에서 위양성이 너무 많아 전문 영상의학과 의사의 판독 시간이 늘어날 수 있다고 발표했다. 이는 훈련 데이터 세트가 주로 시간축으로 cross-sectional 이미지 데이터 세트에 의존하기 때문일 것이다. 따라서 이에 대한 문제점들을 검토하고 향후 longitudinal 및 multi-modal 데이터 세트 훈련, 빅데이터 모델을 사용한 연합 학습, Large scale model 기반의 모델, 설명 가능한 AI, 디지털 트윈 등 이 문제에 대한 다양한 가능한 해결책을 소개하고 논의할 예정이다. 특히 최근에 화두가 되고 있는 large language model(LLM)의 의료 적용 가능성도 논의할 예정이다. 이 모델은 2017년에 Google 연구진에 의해서 제안된 트랜스포머 기술을 기반하고 있다. 최근 chatGPT와 GPT4가 일반에게 충격을 주고 있지만, GPT 뿐 아니라 다양한 GPT, BERT, Chinchilla, Gopher, Bloom, MT-NLG, PaLM, LaMDA 모델 등이 공개되고 nat.dev2와 같은 곳에서 테스트할 수 있다. 소설을 쓰고, 데이터 처리, 시각화를 위한 컴퓨터 프로그램을 작성하고, 외국어를 번역하고, 미래를 추측할 수 있는 이러한 일반화된 LLM의 능력은 우리가 처음으로 인공 일반 지능에 접근하고 있다는 생각을 하게 되었다. 특히, LLM이 인간이 작성한 문장을 고도의 추상적 레벨에서 해석하고, 이를 잠재공간에 mapping 할수 있다는 뜻이 되기 때문에, 다양한 의료응용이 가능할 것으로 사료된다. 예를 들어, 환자의 의무기록(Electric Medical Record; EMR)에서 약 900억단어를 배운 1.1억개의파라매터로 된 GatorTron이라는 모델을 학습하여 다양한 테스트를 했다. 현재 GPT 등을 이용하여 비만수술환자를 지원하거나, 임상의 다양한 비정형 의학 문서의 정형화 등 다양한 의료 분야에 적용하는 연구들이 폭발적으로 수행되고 있다. 이렇듯 LLM은 의료 진단, 치료 및 임상/의학연구의 효율성을 개선하여 의료 및 의료 산업을 혁신할 수 있는 잠재력을 가지고 있다. 예를 들어, GPT를 만든 OpenAI에 투자한 마이크로소프트는 의료음성인식으로 유명한 Nuance라는 회사와GPT를 결합해서 의료용 자동 차팅 솔루션을 내놓았다. 특히, 환자의 의무기록을 이해하고, 임상보고서를 작성하고, 환자 결과를 예측하고, 다양한 임상/의학 연구에 활용할 수 있을 것이라 생각된다. 또한, 임상에서 사용되는 다양한 영상이나 시그널과 같은 비정형데이터와 함께 학습하여 더 좋은 인공지능을 만들 수 있는 가능성도 있다. 이는 현실의료의 약한 고리인 실시간 대응과 전문의 부족의 부분을 메꿀 수 있을 것이라 생각한다. 또한, 빅데이터와 결합해서 희귀 질환을 식별하거나 특이한 유사사례를 찾아주는데 도움을 줄 수 있을것이다. 이를 통해 의사들의 관리 업무, 환자 커뮤니케이션, 진료 예약과 같은 일상적인 업무를 자동화하여 의료 전문가가 더 복잡한 업무에 집중할 수 있도록 도와줄 것으로 예상된다. # ▶ 6.30(금) **1. Recent Trends in Out-of-Distribution Detection. 현윤석(인하대학교)** Most current machine learning (ML) models are trained with the assumption that all testing data comes from the same distribution as the training data, known as the closed-world assumption. However, this assumption is difficult to maintain in real-world scenarios. Inevitably, ML models will encounter examples that are different from what they were trained on, known as out-of-distribution (OOD) samples, which can jeopardize model safety. Over the last six years, a wide array of techniques for detecting out-of-distribution samples have emerged, spanning from methods based on classification to those utilizing density and distance. In this seminar, we will briefly describe the basic concept of out-of-distribution detection algorithms and the details of old and new research trends in this topic. **2. Panel Discussion. “인공지능, 수학 그리고 산업”**