버트는 언어모델이 더욱 고차원 문맥을 이해할 수 있도록 MLM(Masked Language Modeling)을 거쳐 작업 수행 능력을 향상시키는 양방향 언어 인코더 모델이다.
기존에도 보안 문서를 대상으로 AI 언어모델을 학습한 시도는 있었으나 일반적으로 사용되는 언어와 전문적인 사이버보안 지식에 사용되는 언어가 달라 맥락을 제대로 이해하는 데 한계가 있었다.
S2W는 이를 개선하기 위해 자체적으로 비정형 데이터를 가공하고 모니터링 기술로 보안 문서 데이터를 수집했다. 비언어적 요소들에 대해선 문장 구성 요소 대신 유형(Class)을 학습하도록 방식을 변경했다.
이 시각 인기 뉴스
이를 통해 사이버보안 관련 문서 분류, 개체명 인식, 사건 탐지 등 다양한 작업에서 유의미한 결과를 얻을 수 있었다는 설명이다. 사이버튠은 오픈소스로 공개된다. 향후 AI로 보안 문서를 분석하고 위협에 대한 대응을 고민하는 조직과 전문가에게 도움을 줄 것이란 전망이다.
서상덕 S2W 대표는 "사이버튠은 보안 위협을 발견하는 것을 넘어 실질적인 해결 솔루션까지 제시할 수 있는 강력한 보안 기술"이라며 "앞으로도 보안 특화 AI 언어모델 분야에서 독보적인 기술 경쟁력을 유지해 나갈 것"이라고 했다.
[머니투데이 스타트업 미디어 플랫폼 '유니콘팩토리']