ICT뉴스
ETRI, "시각 AI" 핵심기술 공개 | |||
작성일자 | 2019.12.12 | 조회수 | 6385 |
---|---|---|---|
첨부파일 | 없음 | ||
시각지능 구현 알고리즘 및 쉽고 자연스러운 얼굴 사진 편집 툴 개발
국내 연구진이 시각 인공지능(AI) 기술의 핵심 알고리즘과 전문 기술 없이도 얼굴 사진을 쉽게 편집할 수 있는 기술을 일반에 공개한다. 시각지능 학습에 필요한 이미지 데이터도 함께 공개해 국내 인공지능 산업 생태계에 큰 도움이 될 전망이다.
한국전자통신연구원(ETRI)은 사물 인식, 행동 추적 등 시각 인공지능 구현에 필요한 핵심 기술인 '백본 네트워크'와 포토샵 없이도 얼굴을 마음대로 편집할 수 있는 기술을 공개한다고 12일 밝혔다. 아울러 연구진은 시각 AI 기술을 학습시키는 데 필요한 도심환경 사물 560종 대상 사물인식 학습 데이터 20만 장도 공개한다.
사람의 눈과 달리 컴퓨터가 영상 속 이미지를 분별하고 인식하기 위해서는 복잡한 과정이 필요하다. ETRI가 공개하는 백본 네트워크는 사진 속 객체들의 특징을 찾아내 정보를 추출하고 분석해 인공신경망으로 모델을 만들어내는 기술이다. 이 기술을 활용하면 사물 검출, 객체 부분별 분할 인식, 안면 인식 등 다양한 기능들을 구현할 수 있다. 개발자들은 이 기술을 통해 손쉽게 원하는 서비스나 혁신적인 기능을 구현해 부가가치를 창출할 수 있다.
연구진은 전문 편집 프로그램 없이도 사람의 얼굴 사진을 쉽고 자연스럽게 편집할 수 있는 기술도 공개했다. 이 기술을 활용하면 사진 속 인물이 하고 있지 않던 액세서리를 추가하거나 머리 모양, 표정까지도 바꿀 수 있다. 심지어 낙서 등으로 인해 일부가 훼손되거나 빈 공간이 생겨도 원하는 내용을 간단하게 그려 복원할 수 있다. 얼굴 사진에 특화돼 다양한 편집이 가능한 알고리즘인 셈이다. 여기에는 딥러닝 기법 중 하나로 인공적으로 데이터를 만들고 이를 판별하면서 진짜 같은 가짜 데이터를 만들어내는 데 효과적인 기술이 적용됐다.
ETRI는 시각 인공지능을 기술을 학습하는데 꼭 필요한 높은 품질의 데이터도 함께 공개했다. 데이터에는 전봇대, 신호등, 자동차 등 CCTV에 주로 녹화되는 도심 환경에 주로 등장하는 사물들이 들어있다. 연구진은 많은 양의 데이터보다 시각지능 기능 구현 및 학습에 적합한 데이터가 보다 효과적이라고 설명했다. 이미 지난해부터 관련 자료를 공개해오면서 현재 누적 공개 데이터 개수는 총 20만 장에 달한다. 박종열 ETRI 시각지능연구실장은 "국내 시각 인공지능 기술이 급속도로 성장하고 있지만 외국 의존도가 점차 높아지고 있어 관련 기술을 공개했다"며 "국내 산·학·연이 보다 경쟁력 있는 기술을 확보하고 생태계를 조성할 수 있도록 적극 지원할 예정"이라고 밝혔다.
원문보기 : https://view.asiae.co.kr/article/2019121208451740077
|