일시: 2024.3.7.(목), 14:00~16:00
장소: 판교 테크노밸리 산업수학혁신센터 세미나실
발표자: 이지형 교수(성균관대학교)
주요내용: Language Models and Code Intelligence
자연어처리를 위한 대규모언어모델이 개발되고 활용됨과 더불어 프로그램코드 처리를 위한 대규모언어모델이 많이 활용되고 있다. 프로그램코드는 자연어와 마찬가지로 순차적데이터로 기존의 자연어를 위한 대규모모델을 그대로 활용할 수 있다. 그러나, 프로그램코드는 순차적데이터이고도 하지만, 여러가지 측면에서 자연어와는 다른 특성을 갖고 있다. 우선 엄격한 문법을 따르고 있다는 것과 의미적 모호성이 없고, 프로그램코드의 생성의 경우 입력에 대하여 정확한 생성인지 아닌지에 대한 명확한 기준이 존재한다는 것이다. 이러한 특성으로 자연어 처리와 다른 여러가지 처리 방식이 개발되고 있다. 본 세미나에서는 자연어와 프로그램코드의 차이, 프로그램코드 처리를 위한 언어모델과 최근 관심을 받고 있는 연구주제에 대해서 소개한다.
일시: 2024.3.7.(목), 14:00~16:00
장소: 판교 테크노밸리 산업수학혁신센터 세미나실
발표자: 이지형 교수(성균관대학교)
주요내용: Language Models and Code Intelligence
자연어처리를 위한 대규모언어모델이 개발되고 활용됨과 더불어 프로그램코드 처리를 위한 대규모언어모델이 많이 활용되고 있다. 프로그램코드는 자연어와 마찬가지로 순차적데이터로 기존의 자연어를 위한 대규모모델을 그대로 활용할 수 있다. 그러나, 프로그램코드는 순차적데이터이고도 하지만, 여러가지 측면에서 자연어와는 다른 특성을 갖고 있다. 우선 엄격한 문법을 따르고 있다는 것과 의미적 모호성이 없고, 프로그램코드의 생성의 경우 입력에 대하여 정확한 생성인지 아닌지에 대한 명확한 기준이 존재한다는 것이다. 이러한 특성으로 자연어 처리와 다른 여러가지 처리 방식이 개발되고 있다. 본 세미나에서는 자연어와 프로그램코드의 차이, 프로그램코드 처리를 위한 언어모델과 최근 관심을 받고 있는 연구주제에 대해서 소개한다.