2024Lancon
home

10:40

발표자 소개

신정규

Lablup Inc. Chief Executive Officer
래블업에서 모델 깎고 시스템 설계합니다. 부업으로 SCV 아니 대표도 합니다. 텍스트큐브라는 블로그 소프트웨어를 만든 적이 있습니다.

발표 제목

한국어 오픈소스 거대 언어 모델의 가능성: 새로운 시대의 언어 이해와 생성(a.k.a. 기브 미 쪼꼬렛: 한국어 오픈소스 LLM 주세요)

발표 내용

한국어 오픈소스 파운데이션 모델의 가능성에 대해 이리저리 탐구해 봅니다.
딥 러닝과 자연어 처리(NLP)의 발전은 언어 모델의 성능을 향상시키는 데 크게 기여하였습니다. 그러나 국제적으로 대부분의 연구와 개발은 영어와 같은 주요 언어에 집중되어 왔습니다. 이에 반해, 한국어와 같은 언어는 상대적으로 덜 주목받았습니다.
본 발표에서는 한국어에 특화된 오픈소스 거대 언어 모델의 중요성과 그 가능성을 강조하고, 한국어 데이터에 대한 깊은 이해와 그에 따른 효과적인 언어 생성이 가능해질 것이라는 점에 대해 이야기합니다. 또한, 이러한 모델이 한국어 자연어 처리 연구와 응용 분야에 어떻게 기여할 수 있는지에 대해 여러 국가들에서 진행되고 있는 실질적인 사례를 제시합니다. 또한, 오픈소스의 중요성에 대해 경험을 토대로 설명하고, 이를 통해 연구자들과 개발자들이 자유롭게 모델을 사용하고, 개선하고, 새로운 응용 분야를 개발할 수 있는 부분에 대해 생각해봅니다. 이미 다양한 (특히 이 자리에 와 계신 여러 분들에 의해 진행된) 한국어 오픈소스 언어 모델 연구들과, 이후 가능한 방향성에 대해 짚어봅니다.
한국어 오픈소스 거대 언어 모델의 가능성을 탐구하고, 이를 통해 언어 이해와 생성, 그리고 한국어 NLP 연구가 모두가 사용할 수 있는 실질적인 파운데이션 모델로 이어지기 위해 필요한 다양한 요소들에 대해 함께 생각해 보겠습니다.

발표 영상