네이버클라우드, AI 경량화 추론모델 오픈소스 공개


네이버클라우드가 독자 기술을 활용해 ‘프롬 스크래치(from scratch, 토대부터)’로 개발한 경량화 추론(reasoning)모델 ‘HyperCLOVA X SEED 14B Think’를 상업용으로 이용할 수 있는 무료 오픈소스로 공개했다고 22일 밝혔다. 이번에 공개한 모델은 상용화된 해외 오픈소스 모델을 개조한 것이 아닌 원천기술로 추론 능력과 경량화 기술을 결합해 개발했다. 

또한 AI 에이전트 서비스의 핵심 기술로 주목받는 추론모델을 연구용으로만 제한하지 않고 비즈니스에도 적용할 수 있게 공개하여, 다양한 산업 영역에서 만들어질 AI 에이전트의 기반 기술로 활용되며 국내 AI 생태계를 한층 활성화시킬 것으로도 전망된다.

HyperCLOVA X SEED 14B Think는 지난달 30일 발표된 추론모델 HyperCLOVA X THINK를 안정적, 비용 효율적으로 서비스에 접목할 수 있게 경량화한 모델이다. 중요도가 낮은 파라미터를 가지치기(pruning)하되 원본 모델이 가진 지식을 최대한 보존시키고, 가지치기 과정에서 손실이 생긴 큰 모델의 지식을 작은 모델에 전이(distillation)하는 방식으로 학습 비용을 크게 낮춘 것이 특징이다.

네이버클라우드 측은 “해당 모델은 140억 개 파라미터 규모의 모델임에도 불구하고, 5억 개 파라미터로 구성된 글로벌 오픈소스 모델보다 더 적은 비용(GPU Hours)으로 학습됐다”며 “동일 크기 글로벌 오픈소스 모델과 비교하면 1회 학습 비용은 약 100분의 1 수준”이라고 밝혔다. 

기사 공유하기

답글 남기기

많이 본 기사