습관처럼

AI - 제로 샷이란? 본문

금융 & 디지털

AI - 제로 샷이란?

dev.wookii 2020. 3. 13. 23:46

"훈련없이 데이터를 만든다? '제로샷'이란 학습"

AI(인공지능)은 현대 문명에서 '훈련 데이터'는 빠지지 않는다. 하지만 인공지능에 대해 모르는 사람들은 '훈련 데이터'를 통해 인공지능이 만들어지는 것을 알지 못할 것입니다. 하지만 최근 이러한 현상이 현실화 되고 있습니다. 바로 '제로 샷'이라는 것 때문입니다.

 

'제로 샷'은 아직 개발 중인 학습 방법입니다.이 방법은 마이크로소프트, 우버, 바이두(Baidu), 알리바바 등의 AI 기반 기업에서 개발 중인데, 훈련 데이터가 거의 또는 전혀 없어도 유용한 패턴 인식을 가능하게 하는 것이 목표다.

사진 출처: https://image.slidesharecdn.com/25cs-171016061055/95/125-cs-37-638.jpg?cb=1508134309 

이 밖에도 제로 샷 학습은 객체 인식 애플리케이션을 더 다양하게 만들 수 있는 다음과 같은 기능을 지원한다.
 

  • 훈련 데이터에서 상당히 누락될 수 있는 드물고, 익숙하지 않고, 보이지 않는 객체의 즉각적인 인식
  • 매우 높은 수준의 전문 지식으로 분류된 훈련 데이터를 얻기 어려운 패턴 인식
  • 세분화된 카테고리의 확산으로 인해 통계적으로 다양하게 분류된 훈련 데이터를 충분한 양으로 획득하기 어렵거나 엄청나게 비싼 객체 클래스의 인스턴스를 탐지하는 것

제로 샷 학습을 가능하게 하는 것은 통계적 또는 의미적 접근법을 통해 발견하고 용도를 변경할 수 있는 사전 지식의 존재다. 제로 샷 방법은 이 지식을 사용해 훈련해본 인스턴스(훈련 데이터에 있는 인스턴스)와 보이지 않는 인스턴스(훈련 데이터에 없는 인스턴스)를 모두 포함하는 특징(feature)을 예측한다. 이와 같은 자동화된 지식 발견과 관련해, 제로 샷 학습을 위한 가장 유망한 기술 접근방식은 다음과 같다.
 

  • 뚜렷하지만 의미적으로 인접한 객체 인식 영역에 있는 사전 감독된 학습 프로젝트에서 얻은 통계 지식을 바탕으로 분류 모델을 구축 (관련 종에서 추출한 특징에 기초해 한 번도 본 적 없는 척추동물의 종류 식별)
  • 대상 클래스의 텍스트 설명에서 대상 객체의 의미 지식 추출 (인식할 종의 시각적 특징을 설명하는 로봇이 추출한 웹 기사)
  • 대상 클래스의 텍스트 설명을 사용할 수 있는 경우, 단어 벡터기타 그래프 접근법을 사용해 대상 클래스의 의미 특징에 대한 추론을 소스 클래스의 의미 특징에 대한 추론에서 세분화 

제로 샷 학습이 기대대로 'AI 파이프라인 가속기' 역할을 하려면 이런 기술에 대한 간단한 액세스를 제공하는 툴을 데이터 과학자에 제공할 수 있어야 한다. 이는 결국 ‘전송 학습(transfer learning)’이라는 더 큰 패러다임으로 수렴된다.

 

기존 기능적 빌딩 블록에서 새로운 모델을 쉽게 시각적으로 설계할 수 있는 딥 러닝 툴킷이 필요하다. 세부적인 사항은 AI 프로젝트로 빠르게 가져올 수 있는 이전 모델의 재사용 가능한 기능 표현, 신경 노드 레이어링, 가중치, 교육 방법, 학습 속도, 제로 샷 기타 관련 기능을 제공하는 워크벤치 등이 따라 달라질 수 있다.

앞으로 제로 샷 기술이 성숙하고 사전 지식 풀이 커지면, 고급 AI 개발자는 교육 데이터에 대한 의존도가 낮아질 것이다. 데이터 과학자도 더는 많은 양의 최신 교육 데이터를 수집, 준비, 분류할 필요 없이, 기존의 통계와 의미 지식을 구성해 더 지능적인 로봇 공학, 게임, 패턴 인식 애플리케이션을 만들 수 있게 된다.
 
그때가 되면, 더 많은 AI 기반 애플리케이션이 애드혹, 제로 샷, 상황에 따라 적응할 수 있는 기술을 이용해 순수한 무지 상태에서 심도 있는 지능으로 스스로 발전하도록 자동화할 수 있다. 이는 앨런 튜링 시절부터 현재까지 AI 관련 업계 모두가 꿈꿔온 '보편화된 인공 지능'의 진정한 시작이 될 것입니다.

 

 

출처: http://www.itworld.co.kr/news/145802