현재 위치 :뉴스

    '초거대 AI' 시대 성큼…ICT 업계 광폭 행보

    출처:EBN    편집 :编辑部    발표:2021/06/11 10:28:38

    IT업계가 알파고를 뛰어넘는 '초거대(Hyperscale) 인공지능(AI)'에 주목하고 있다. 국내 이동통신 3사 역시 출사표를 던졌다.


    11일 업계에 따르면 최근 네이버, SK텔레콤, KT, 구글 화웨이 등 국내외 업계는 초거대 AI 잠재력에 주목하며 기술성과, 전략적 협업, 개발 계획 등을 잇달아 공개하고 있다.


    초거대 AI는 대용량 데이터를 빠르게 처리할 수 있는 슈퍼컴퓨팅 인프라를 기반으로 딥러닝(심층학습) 효율을 크게 높인 차세대 AI을 말한다.


    2016년 구글 딥마인드가 딥러닝 기술로 개발한 '알파고'가 바둑에만 특화됐다면 초거대 AI은 활용 범위가 넓어 기업의 비즈니스 모델과 서비스를 다양화·고도화하는데 응용할 수 있다.


    초거대 AI를 개발하기 위해서는 슈퍼컴퓨터를 활용해 '파라미터(parameter, 매개변수)' 성능을 크게 높이는 것이 필수다. 파라미터는 인간 뇌의 학습·연산 기능을 담당하는 시냅스와 비슷한 역할로 파라미터 수가 많아질수록 AI 성능을 높이는 셈이다. 인간 뇌 속의 시냅스 수는 100조 개에 달하는 반면 2019년까지 구글·페이스북 등이 보유한 AI은 파라미터가 수억 개, MS가 170억 개 수준이다.


    네이버는 지난달 25일 개최한 '네이버 AI 나우' 컨퍼런스에서 세계 최대 한국어 AI 언어모델인 '하이퍼클로바'를 공개했다. 하이퍼클로바는 오픈AI의 GPT-3(1750억개 파라미터)를 뛰어넘는 2040억 개 파라미터 규모로 개발됐다. 자연어(영어·한국어 등 일상에서 쓰는 언어) 데이터 학습량은 GPT-3의 6500배 이상 학습해 세계에서 가장 큰 한국어 초거대 AI 언어모델이다.


    GPT-3가 영어 중심으로 학습해 국내 기업이 도입하기에 한계가 있었는데 하이퍼클로바는 학습 데이터의 97%가 한국어로 이뤄져 있어 차세대 AI 주도권 확보에 나섰다는 점에 의의가 있다. 국내 최대 인터넷 플랫폼을 운영하며 쌓아온 대규모 데이터 처리능력도 하이퍼클로바의 핵심 자원이다. 네이버는 쇼핑·지도 등 10개 이상의 네이버 서비스에 하이퍼클로바를 적용할 예정이다.


    이통사들도 도전장을 냈다. SK텔레콤은 지난해 6월 GPT-2에 상응하는 첫 한국어 학습 오픈소스 모델 KoGPT-2 개발에 성공한 데 이어 지난달 성능을 개선한 KoGPT-2 모델 2.0 버전을 선보였다.


    또 국립국어원과 국어에 적합한 차세대 AI 모델 개발에 협력하며 고객 응대를 비롯해 문학·역사·시사 등 다양한 분야에 적용 가능한 범용언어모델(GLM) 개발에 나설 계획이다. 카카오와도 1500억 개 파라미터를 갖춘 자연어처리 AI 모델 개발을 목표로 집중 투자하고 있다.


    KT는 2017년 출시했던 음성인식 AI 기가지니를 GPT-3를 뛰어넘는 초거대 AI로 발전시킬 계획이다. 네이버처럼 카이스트와 공동 AI 연구소를 설립하기로 했다. 올 하반기 연구소를 출범시켜 초거대 AI용 컴퓨터 인프라를 구축·지원하고 이르면 내년 연구 성과를 내겠다는 전략이다.


    LG그룹은 올 하반기까지 6000억 개 파라미터, 내년 상반기까지 1조 개 이상 파라미터를 갖춘 초거대 AI를 만들겠다는 계획이다. 소재 발굴, 소프트웨어 코딩, 논문 분석과 학술 데이터베이스 구축, 디자인 시안 제작 등에 초거대 AI를 활용할 방침이다.


    해외에서는 구글과 화웨이가 공격적이다. 구글이 지난달 18일 개발자회의에서 공개한 대화형 AI 언어모델 '람다(LaMDA)'는 사람의 대화 방식을 이해하고 정답이 없는 질문에도 자연스런 대화가 가능하다.


    화웨이는 지난달 대규모 자연어 처리(NLP) 모델 '판구-알파(PanGu-α)' 개발 관련 논문을 아카이브(arXiv)에 게재했다. 판구-알파는 1.1테라바이트 분량의 중국어 전자책, 백과사전, 뉴스, 소셜미디어 게시글, 웹페이지에서 추출한 언어를 학습한다. 연구진은 2000억 개의 파라미터를 보유하고 있어 까다로운 중국어를 텍스트로 요약하고 질문· 답변에 뛰어나 다양한 대화 생성에 우수한 성능을 갖췄다고 강조한다.


    정보통신기획평가원 관계자는 "국내에서도 민간의 한국어 AI 언어모델 개발 성과와 향후 계획이 속속 공개되고 있다"며 "한국어에 최적화된 언어모델 개발에 머무는 것이 아니라 다른 언어로 모델을 확장하고 영상이나 이미지 등도 이해하는 멀티모델 개발, 응용 서비스 모델 발굴 등 차별화가 필요하다"고 말했다.