네이버의 국내 최초 초대규모(Hyperscale) 인공지능(AI) 하이퍼클로바 관련 논문이 세계 최고 수준의 권위를 지닌 자연어처리학회서 메인 콘퍼런스 발표에 채택됐다.
네이버는 '하이퍼클로바'의 핵심 연구 논문을 비롯해 총 7개의 논문을 국제 자연어처리(NLP) 학회인 'EMNLP 2021'에서 발표한다고 3일 밝혔다.
EMNLP는 ACL과 더불어 자연어처리 분야의 세계 최고 권위 학회로 꼽힌다. EMNLP 2021은 오는 11월 7∼11일 도미니카공화국에서 개최될 예정이다.
하이퍼글로바는 올해 5월 공개된 초대규모 AI다. 현재는 GPT-3보다 한국어 데이터를 6500배 이상 학습한 단일 규모 최대 한국어 언어모델로 꼽힌다.
해당 논문은 하이퍼클로바와 그 학습에 사용된 데이터를 소개하고, 다양한 크기의 모델이 갖는 성능을 검증하는 내용을 담았다. 논문 저자는 네이버 클로바·AI랩 연구진뿐 아니라 소프트웨어 플랫폼 엔지니어, 검색 엔지니어 등 다양한 팀에 소속된 37명이다.
또한 네이버는 한국과학기술원(KAIST)·고려대·서울대 등과 협력 연구한 결과를 담은 논문 6개를 학회에서 발표할 예정이다.
학회 발표 내용은 초거대 언어모델에서의 프롬프트 최적화, 데이터 토큰화 등에 관한 논의를 발전시키고 ‘하이퍼클로바 스튜디오’를 통해 ‘노 코드 AI’(No Code AI) 등 향후 AI 서비스 개발 방법론의 변화점 등을 담았다.
하정우 네이버 AI랩 소장은 “이번 논문 발표는 영어 중심이었던 기존의 언어모델이 아니라 한국어 AI의 가치를 글로벌 자연어처리 학계가 인정했다는 것”이라고 말했다.