2016년 바둑기사 이세돌 9단과 대국했던 구글 알파고가 나온 이후, 우리의 일상생활에 스며든 AI는 진화를 거듭해 더욱 인간과 가까워졌다.
‘초거대 AI’란 기존 AI의 수백 배 이상 대규모 데이터를 인간처럼 스스로 학습 및 추론할 수 있는 AI다.
#AI #초거대AI #AI반도체 #오픈AI #멀티모달AI #거대언어모델 #네이버 #삼성전자 #SKT #LGU+ #KT
종합적 사고·학습·추론하는 복합지능 모델
언어모델 GPT-3부터 멀티모달 AI...파라미터↑
네이버·이통3사, 초거대 AI 개발 경쟁 '치열'
2016년 바둑기사 이세돌 9단과 대국했던 구글 알파고가 나온 이후, 우리의 일상생활에 스며든 AI는 진화를 거듭해 더욱 인간과 가까워졌다. AI를 넘어 한 단계 진화한 ‘초거대 AI’는 차세대 산업 전반에 폭넓게 사용됨에 따라 몸이 불어나고 있다.
국내외 대기업들의 ‘초거대 AI’ 시장 선점을 위한 발걸음도 분주하다.
‘초거대 AI’란 기존 AI의 수백 배 이상 대규모 데이터를 인간처럼 스스로 학습 및 추론할 수 있는 AI다. 기존 AI는 개별 모델로 개발됐으나, 멀티태스킹을 위해 하나의 모델이 여러 과제를 해결하는 것이 중요해졌고, 이에 대응해 개발된 초거대 AI는 범용적으로 사용돼 종합적으로 사고를 할 수 있게 됐다.
초거대 AI는 대규모의 파라미터(매개변수)를 가지는데, 이것이 많을수록 AI가 추론한 결과물은 더욱 사람과 비슷해진다고 볼 수 있다. 예컨대 알파고가 바둑 분야에 특화돼 이세돌과 겨뤘다면, 이제 AI는 다양한 분야에서 인간과 같이 역할을 수행할 수 있다.
■ 초거대 AI 시초 'GPT-3'부터 '멀티모달 AI', ChatGPT까지
초거대 AI의 시초라 불리는 2020년 출시된 ‘오픈 AI’社의 GPT-3는 딥러닝 기반 알고리즘으로, 구글 알파고, IBM 딥블루 이후 주목받은 거대언어모델(large language model)이다.
거대언어모델은 다양한 분야에서 실용적으로 활용됐다. GPT-3으로 만들어 내는 복잡한 문장들은 마치 인간이 썼다고 해도 믿을 만하고, 글에 맥락도 담겨 있다. 이를 기반으로 만들어진 챗봇을 통해 기계와 인간이 유창하게 대화할 수 있다.
▲지수함수적으로 증가하는 딥러닝 모델의 파라미터 수(출처=가트너)
GPT-3는 GPT-2를 만들 때 사용했던 알고리즘을 거의 유사하게 사용하면서 데이터의 규모를 늘리며 테스트했다. 이때 주목할 만한 점은 GPT-2의 파라미터가 15억 개였던 것에 비해 GPT-3는 1,750억 개의 파라미터를 가졌다는 것이다.
파라미터 수가 커지면 커질수록 AI는 더욱 발전한다는 기대 속에서 초거대 AI는 인간과 더욱 비슷해지고 있다. 언어모델에서 시작한 초거대 AI는 현재 이미지 분야 등 멀티모달 AI로 확장되고 있다.
멀티모달 AI는 시각·청각·촉각 등 다양한 모달리티를 동시에 학습 처리하는 모델로, 복합적인 일 처리가 가능한 범용 AI로의 발전이 촉진되고 있다.
작년 12월, 오픈 AI는 GPT-3와 큰 차이는 없지만 자연스러운 대화를 극대화 한 GPT-3.5 기반 ChatGPT를 출시했다. ChatGPT는 대화 방식으로 상호 작용하는 모델로, 인간의 물음에 답변하고, 이의를 제기하거나, 부적절한 요청을 거부할 수 있다고 설명한다.
ChatGPT는 현재 시점에서 한계점을 가진다. 잘못된 정보를 답변하거나, 정확도 측면에서 인간과 구분되는 차이 때문에 아주 세부적인 질문이 권장되기도 한다.
그럼에도 ChatGPT는 향후 구글 등 검색 엔진을 대체할 것이라는 전망이 제기되고 있어 지속적으로 눈여겨 볼 만하다.
■ 똑똑해지는 네이버 ‘하이퍼클로바’
초거대 AI 개발의 필요조건으로는 막대한 컴퓨팅 성능이다. 초기 모델과 달리 비교할 수 없는 연산량이 요구되기 때문에 이는 빅테크 기업의 주도하에 개발되고 있다.
오픈 AI의 ‘DALL-E’는 텍스트를 입력하면 이미지를 생성하는 대표적인 생성 AI 모델로, 작년 7월 유료화 API의 베타 시리즈를 공개한 바 있다. 구글은 2018년 ‘듀플렉스’라는 서비스를 공개했는데, 이는 AI 에이전트의 가장 적극적인 형태를 보여주었다. 또한 ‘인피니트네이처-제로’ 모델은 사진 한 장으로 3D 뷰를 생성해낼 수 있다.
국내 대표적인 사례로는 단연 네이버가 있다. 한국어에 특화된 GPT-3 기반 AI 모델인 ‘하이퍼클로바’는 21년 5월 공개된 ‘하이퍼클로바’는 GPT-3보다 많은 2,040억개 파라미터로 구성돼 화제를 모았다.
하이퍼클로바는 AI 패러다임을 바꾸고 일상 속에서 AI가 널리 사용되도록 하자는 목표에 맞게 진화하고 있다. 네이버 음성인식에도 적용됐으며, AI가 독거 어르신의 안부를 체크하는 것을 넘어, 친구처럼 대화하는 ‘클로바 케어콜’ 서비스도 같은 해 시작됐다. 또한 클로바 스피커, 클로바 노트 등에도 연이어 초거대 AI 기능을 출시해왔다.
▲네이버 '멀티모달 문서검색' 활용 사례
작년 3월에는 블로그, 카페, 쇼핑, 지식iN, 뉴스 서비스 내 멀티모달 AI '옴니서치(OmniSearch)'를 구축했다. 특히 최근 추가된 ‘멀티모달 문서검색’은 멀티모달 AI를 활용해 이미지, 텍스트 등 입력된 사용자의 검색 의도를 분석, 결과를 토대로 매칭 적합도가 높은 문서를 분류해 맞춤형 검색 결과를 제공한다. 멀티모달 AI로 이미지와 텍스트를 함께 조합하는 식의 복합 정보를 입력해 사용자 맞춤형 검색 편의를 높였다.
한편 네이버는 작년 12월 삼성전자와 AI 반도체 솔루션 개발을 위해 손을 잡기도 했다. 양사는 초거대 AI 모델의 응용 확산을 위한 필수요소인 경량화 솔루션에 대한 기술 검증과 개발에 착수하고, 더 나아가 HBM-PIM, CXL, 컴퓨테이셔널 스토리지 등 고성능 컴퓨팅을 지원하는 차세대 메모리 솔루션의 확산에 대해서도 지속적으로 협력한다.
■ 초거대 AI 시장 선점 노리는 이통 3사
“현재 글로벌 초거대 AI 시장은 국내외 빅테크들이 치열하게 주도권을 쥐기 위해 다투는 전장이 되고 있다”
SKT는 2020년부터는 초거대 언어모델인 GPT-3와 유사 성능을 보이는 한국어 범용 언어모델(GLM) 개발을 위해 국립국어원과 제휴한 바 있다.
또한 작년 5월 AI 에이전트 서비스 ‘A.(에이닷)’을 출시하며 AI컴퍼니로서 도약하고 있다. 에이닷은 GPT-3 및 감정 분석 기술을 바탕으로, ‘나만의 캐릭터’를 만들어 소통하는 AI 플랫폼이다.
▲SKT AI 에이전트 'A.(에이닷)'
오는 2월 중 SKT는 에이닷에 대화에 활용할 수 있는 복합적인 정보를 함께 이해할 수 있게 해주는 멀티모달을 장착해 고도화를 이어 나간다. 또한 국내 AI 기술 기업 코난테크놀로지와 기술 협력을 이어 나가겠다고 전했다.
LG는 21년 12월 공개한 엑사원(EXAONE)에 멀티모달을 탑재해 텍스트, 음성, 이미지, 영상 등의 데이터를 자유자재로 변환 가능하게 했다.
엑사원은 약 3,000억개의 파라미터를 보유하고 있으며, 엑사원은 말뭉치 6,000억개 및 고해상도 이미지 2억 5천만장 이상을 학습해 다양한 산업 분야에서 활약하고 있다.
지난 12월에는 엑사원으로 논문 및 특허 등 전문 문헌의 텍스트뿐만 아니라 수식과 표, 이미지까지 스스로 학습해 데이터베이스화 하는 사례를 소개했다. 이날 엑사원은 분류, 번역, 기계독해, 요약 등 4개 영역 16개 평가 지표 중 15개가 ‘SOTA’를 상회하는 우수한 성능을 보였다고 밝혔다.
▲KT 'AI 원팀 서밋 2022'
KT는 2020년 ‘AI 원팀’을 출범해 초거대 AI 모델 개발에 나섰다. KT, 현대중공업그룹, LG전자, 한국투자증권, 동원그룹, 우리은행, ㈜한진, 녹십자홀딩스, 한국과학기술원(KAIST), 한양대학교, 성균관대학교, 한국전자통신연구원(ETRI)이 함께 AI 공동연구, 생태계 조성, 인재육성 분야에서 협력하고 있다.
AI 원팀은 초거대 AI 모델 확보를 대한민국 AI 경쟁력 확보를 위해 참여 기관과 대규모 GPU 인프라 구축, 데이터 수집·분석, 모델 학습, 응용 적용 등 R&D 및 상용화 관련 업무를 수행한다.
초거대 언어모델을 통해 향상된 STT(음성인식), TTS(음성합성), TA(텍스트 분석), 대화 등 요소기술은 먼저 KT 기가지니와 AICC 서비스 고도화를 위해 활용되며, 나아가 제조·물류·유통 등 AI 원팀 참여기업들의 다양한 사업 분야에 적용된다는 방침이다.
지난 10월 KT는 ‘AI 원팀 서밋 2022’ 행사에서 초거대 AI 개발 및 참여기업 확대로 다양한 기업 문제를 해결해 향후 주요 산업 분야의 AI 혁신을 선도하겠다는 포부를 드러냈다.
한편 KT의 초거대 AI 모델 ‘믿음’은 한국어 해석과 생성 등 다중 영역에서 최적화 학습을 제공한다. ‘협업 융합 지능’을 강조해, 사람과 함께하는 AI를 강조하고 있다.