세계 최초 상보형-트랜스포머 AI 반도체/그래픽=조수아
과학기술정보통신부는 유회준 카이스트(KAIST ) PIM반도체연구센터·인공지능반도체대학원 교수 연구팀이 400㎽(밀리와트)의 초저전력을 소모하면서도 0.4초 만에 LLM(거대언어모델)을 처리할 수 있는 AI반도체 '상보형-트랜스포머'를 삼성전자 28나노(㎚·1㎚는 10억분의1m) 공정을 통해 세계 최초로 개발했다고 6일 밝혔다. 작은 AI반도체 칩 1개만으로 GPT 등 LLM을 구현할 수 있게 됐다.
기존 뉴로모픽 컴퓨팅 기술은 이미지인식, 비디오분석 등 시각적 데이터 처리에 사용하는 딥러닝(심화학습) 모델인 'CNN'(합성곱신경망)보다 부정확하며 간단한 이미지 분류만 가능했다. 이번 논문의 제1저자인 김상엽 카이스트박사는 뉴로모픽 컴퓨팅 기술의 정확도를 CNN 수준으로 높이고 다양한 응용까지 가능한 'C-DNN'(상보형-심층신경망'(상보형-심층신경망) 기술을 지난 2월에 열린 국제고체회로설계학회(ISSCC)에서 처음 시연했다. 이번 연구는 이 기술을 LLM에 적용해 초저전력·고성능의 온디바이스 AI가 가능하다는 것을 입증했다.
파라미터가 압축되면서 언어모델의 파라미터를 외부 메모리로부터 불러올 때 소모되는 전력은 약 70% 줄었다. 이는 엔비디아가 개발한 A100 대비 전력소모량을 625배 줄이면서도 0.4초 만에 GPT-2 모델을 활용한 언어생성이 가능한 정도다. 연구를 이끈 유회준 교수는 "이번 연구는 AI반도체의 전력소모 문제를 해소했을 뿐 아니라 GPT-2 같은 실제 LLM 응용을 성공적으로 구동했다는데 큰 의의가 있다"고 말했다.
(서울=뉴스1) 김명섭 기자 = 정부는 오는 2047년까지 삼성전자와 SK하이닉스 등 민간 기업이 622조원을 투입하는 경기도 남부 일대 '반도체 메가 클러스터' 구축에 지원을 강화한다. 세계 최대 반도체 메가 클러스터 건설로 650조원 생산 유발 효과가 있을 것으로 보고, 인프라·투자 환경 조성, 반도체 생태계 강화, 초격차 기술 및 인재 확보 등을 지원한다. 사진은 17일 서울 종로구 대한민국역사박물관에서 관람객들이 대한민국의 반도체 기술 발전의 역사를 보고 있는 모습. 2024.1.17/뉴스1 Copyright (C) /사진=(서울=뉴스1) 김명섭 기자