AI전쟁 끝내러 '뇌'가 왔다

머니투데이 박건희 기자 | 2024.03.07 06:00

과기부, 토종 AI반도체 개발…뇌 신경세포 모방 회로 사용
엔비디아의 625배 전력효

세계 최초 상보형-트랜스포머 AI 반도체/그래픽=조수아
국내 연구진이 초저전력으로 고성능을 내는 AI(인공지능)를 구현할 AI반도체를 세계 최초로 개발했다. AI반도체 시장을 장악한 엔비디아의 'A100' 대비 소모전력은 625배, 칩 면적은 41배 작아 효율을 극대화했다. 속도는 단 0.4초 만에 'GPT-2' 모델을 통한 언어생성이 가능한 정도다.

과학기술정보통신부는 유회준 카이스트(KAIST ) PIM반도체연구센터·인공지능반도체대학원 교수 연구팀이 400㎽(밀리와트)의 초저전력을 소모하면서도 0.4초 만에 LLM(거대언어모델)을 처리할 수 있는 AI반도체 '상보형-트랜스포머'를 삼성전자 28나노(㎚·1㎚는 10억분의1m) 공정을 통해 세계 최초로 개발했다고 6일 밝혔다. 작은 AI반도체 칩 1개만으로 GPT 등 LLM을 구현할 수 있게 됐다.

연구팀은 인간 뇌의 신경세포(뉴런)와 연결(시냅스)을 모방해 설계한 컴퓨팅 시스템인 '뉴로모픽 컴퓨팅' 기술을 활용했다. 연구팀이 활용한 것은 뉴로모픽 컴퓨팅 기술 중에서도 'SNN'(스파이킹뉴럴네트워크)다. 실시간으로 복잡한 시계열 데이터를 분석하는데 적합한 정보처리 방식이다.

기존 뉴로모픽 컴퓨팅 기술은 이미지인식, 비디오분석 등 시각적 데이터 처리에 사용하는 딥러닝(심화학습) 모델인 'CNN'(합성곱신경망)보다 부정확하며 간단한 이미지 분류만 가능했다. 이번 논문의 제1저자인 김상엽 카이스트박사는 뉴로모픽 컴퓨팅 기술의 정확도를 CNN 수준으로 높이고 다양한 응용까지 가능한 'C-DNN'(상보형-심층신경망'(상보형-심층신경망) 기술을 지난 2월에 열린 국제고체회로설계학회(ISSCC)에서 처음 시연했다. 이번 연구는 이 기술을 LLM에 적용해 초저전력·고성능의 온디바이스 AI가 가능하다는 것을 입증했다.


연구팀은 뉴로모픽 네트워크 기반 AI가 문장생성·번역·요약 같은 고도의 언어처리를 성공적으로 수행할 수 있는지 확인했다. 이를 통해 GPT-2 거대모델의 7억800만개에 달하는 파라미터(매개변수)를 약 1억9100만개로 줄였다. 기존 4억200만개 파라미터를 사용한 번역용 T5(Text-to-Text Transfer Transformer)모델에선 파라미터 개수를 7600만개로 줄였다.

파라미터가 압축되면서 언어모델의 파라미터를 외부 메모리로부터 불러올 때 소모되는 전력은 약 70% 줄었다. 이는 엔비디아가 개발한 A100 대비 전력소모량을 625배 줄이면서도 0.4초 만에 GPT-2 모델을 활용한 언어생성이 가능한 정도다. 연구를 이끈 유회준 교수는 "이번 연구는 AI반도체의 전력소모 문제를 해소했을 뿐 아니라 GPT-2 같은 실제 LLM 응용을 성공적으로 구동했다는데 큰 의의가 있다"고 말했다.

(서울=뉴스1) 김명섭 기자 = 정부는 오는 2047년까지 삼성전자와 SK하이닉스 등 민간 기업이 622조원을 투입하는 경기도 남부 일대 '반도체 메가 클러스터' 구축에 지원을 강화한다. 세계 최대 반도체 메가 클러스터 건설로 650조원 생산 유발 효과가 있을 것으로 보고, 인프라·투자 환경 조성, 반도체 생태계 강화, 초격차 기술 및 인재 확보 등을 지원한다. 사진은 17일 서울 종로구 대한민국역사박물관에서 관람객들이 대한민국의 반도체 기술 발전의 역사를 보고 있는 모습. 2024.1.17/뉴스1 Copyright (C) /사진=(서울=뉴스1) 김명섭 기자

베스트 클릭

  1. 1 김호중 콘서트 취소하려니 수수료 10만원…"양심있냐" 팬들 분노
  2. 2 [영상] 가슴에 손 '확' 성추행당하는 엄마…지켜본 딸은 울었다
  3. 3 '100억 자산가' 부모 죽이고 거짓 눈물…영화 공공의적 '그놈'[뉴스속오늘]
  4. 4 김호중, 유흥주점 갈 때부터 '대리' 불렀다…또 드러난 음주 정황
  5. 5 [단독] 19조 '리튬 노다지' 찾았다…한국, 카자흐 채굴 우선권 유력