• 토요일, 10월 24일
토요일, 10월 24일

AI 데이터 품질 표준안, 국내외 표준화 추진

AI 데이터 품질 표준안, 국내외 표준화 추진

사진=과학기술정보통신부

[뉴스포픽=김한영 기자] 과학기술정보통신부가 디지털 뉴딜 ‘데이터 댐’의 핵심자원인 인공지능(AI) 데이터 관련 품질의 개념과 범위, 세부 요구사항 등을 정립한 표준안을 추진한다고 지난 5일 밝혔다.

이 표준안을 한국정보통신기술협회(TTA) 단체표준으로 만들기 위해 10월 6일 한국정보통신기술협회 내의 단체 표준화 기구(TTA PG 1005, 인공지능기반기술)에 공식 제안하였고, 관련 전문가 등의 의견수렴 절차를 거쳐 내년 6월에 최종 채택·확정될 것으로 전망된다.

또한, 앞으로 관련 내용을 국제표준화 성과로도 이어질 수 있도록 추진할 계획이다.

이번 표준안은 인공지능 데이터의 품질을 “인공지능 기술(모델 및 알고리즘)에 활용되는 데이터가 다양성, 정확성, 유효성 등을 확보하여 사용자에게 유용한 가치를 줄 수 있는 수준”으로 정의했다. 이는 데이터가 적정한 절차와 요구사항, 규격 등으로 처리되는지에 따라 좌우되며 인공지능 기술과 서비스의 성능을 좌우하는 핵심요소이다.

인공지능 데이터 품질의 개념 / 자료=과학기술정보통신부

하지만, 아직 세계적으로 품질 수준이 높지 않은 상황이다. 예를 들어, 세계적 정보통신기술 기업들인 마이크로소프트나 구글 등이 4~6년 넘게 구축·업데이트해온 유명한 개방 데이터셋의 경우에도 데이터 정확도가 43~83% 수준에 불과하다.

이는 아직 세계적으로 인공지능 데이터 품질에 대한 체계적인 방법론이 정립되지 않은 것이 중요한 원인으로 분석된다.

특히, 지난 4월 우리나라가 ‘인공지능 국제표준화회의(ISO/IEC JTC1/SC42)*’에 인공지능 데이터(딥러닝) 품질 관련 사항을 신규 과제로 제안하여 채택되는 등 이제 막 논의가 시작되는 초기단계이다.

이에 한국정보통신기술협회와 한국정보화진흥원을 통해 기 개발된 ‘인공지능 학습용 데이터 구축 및 품질관리 공통기준(’19년)‘을 해외사례 분석, 인공지능 및 품질관리 전문가 자문 등을 거쳐 보완·구체화하여 이번에 표준안을 개발하게 되었다.

표준안은 자연어처리, 자율자동차, 의료, 농축수산, 제조 등 다양한 분야에서 공통적으로 적용 가능한 범용표준의 형태로 개발되었으며, 데이터의 품질을 체계적으로 확보하고 상호호환성을 제고할 수 있도록 데이터 수집‧정제‧가공‧품질검증‧활용 등 전주기 단계별로 필요한 표준절차와 품질 요구사항 등을 정의하고 기본적인 데이터 규격을 담고 있다.

구체적으로는 △ 원시데이터 수집단계의 다양성, 사실성 등의 품질 요구사항과 파일 포맷, 해상도 등의 기술 적합성 요구사항, △ 정제단계의 데이터 중복방지 및 비식별화 조치 요구사항, △ 가공단계의 객체 분류체계 및 라벨링 규격 요구사항, △ 품질검수·활용 단계의 유효성 등 검수 요구사항·방법 등으로 구성되어 있다.

과기정통부는 이번에 개발된 표준안을 이미 추경사업 과제(10대 분야, 150종 데이터)에 적용하고 있으며,한국정보통신기술협회 내의 단체 표준화 기구(TTA PG 1005, 인공지능기반기술) 내의 산·학·연 전문가 의견수렴을 거쳐 신속하게 단체 표준화를 추진하고, 앞으로 관련 사항을 국립전파연구원 등을 통해 ‘인공지능 국제표준화회의(ISO/IEC JTC1/SC42)’에 제안하는 등 국제표준화의 성과로 이어지도록 할 계획이다.

아울러, 올 연말까지 표준안을 바탕으로 인공지능 개발자, 공공기관 관계자 등이 인공지능 데이터의 품질을 보다 체계적으로 계획·관리할 수 있도록 하기 위해 자세한 설명 등을 포함하는 ‘인공지능 데이터 품질관리 가이드’를 개발·배포할 계획이다.

과기정통부는 이번에 개발된 표준안이 디지털 뉴딜 ‘데이터 댐’의 핵심자원인 인공지능 데이터의 품질을 향상시키고, 나아가 국가 전반의 인공지능 기술과 서비스의 성능을 높이는데 크게 기여할 것으로 기대하며,앞으로 국제표준화를 선도하고 우리나라가 인공지능 강국으로 도약하는데 더욱 노력할 계획이다.

0
이 글을 페이스북으로 퍼가기 이 글을 트위터로 퍼가기 이 글을 카카오스토리로 퍼가기 이 글을 밴드로 퍼가기

0 Comments

Add Comment

captcha
자동등록방지 숫자입력
국제발신 스팸문자 中 '도박 스팸' 93.6%

국제발신 스팸문자 中 '도박 스팸' 93.6%

[뉴스포픽=장성호 기자] 한국인터넷진흥원(KISA)은 코로나19 장기화에 따른 사회 혼란과 불안 심리를 악용한 국제발신 스팸문자가 증가하고 있다고 19일 밝혔다.올해 9월까지 KISA 불법스팸대응센터로 접수된 국...

한국-유럽, 코로나 이후 ICT 표준 방향 모색

한국-유럽, 코로나 이후 ICT 표준 방향 모색

[뉴스포픽=고유미 기자] 과학기술정보통신부는 10월 13일부터 10월 16일까지 유관기관과 함께 ‘비일상(뉴 노멀) 시대 선도를 위한 정보통신기술(ICT) 표준의 역할’을 주제로 ‘글로벌 ICT 표준 콘퍼런스 2020(GISC...

코로나 시대 서비스 산업과 로봇

코로나 시대 서비스 산업과 로봇

[뉴스포픽=장성호 기자] 코로나19가 통제될 무렵 서비스 산업이 어느정도 살아남아 있을지는 누구도 예측할 수 없다. 미국의 한 산업 단체에서는 올해 말까지 미 전역 요식업체의 수익 손실이 2,400억 달러에 이...

AI 데이터 품질 표준안, 국내외 표준화 추진

AI 데이터 품질 표준안, 국내외 표준화 추진

[뉴스포픽=김한영 기자] 과학기술정보통신부가 디지털 뉴딜 ‘데이터 댐’의 핵심자원인 인공지능(AI) 데이터 관련 품질의 개념과 범위, 세부 요구사항 등을 정립한 표준안을 추진한다고 지난 5일 밝혔다.이 표준안...

AI 기업 오드컨셉, 자연어처리 분야 최고 권위 학회에 연구 논문 채택

AI 기업 오드컨셉, 자연어처리 분야 최고 권위 학회에 연구 논문 채택

[뉴스포픽=고유미 기자] 오드컨셉(대표 김정태)이 자연어처리 분야의 획기적 연구 성과를 해당 분야 최고 권위를 자랑하는 국제 학회에서 공개한다.오드컨셉은 최근 자사 기술 개발을 담당하는 문상환 엔지니어링...

에어아시아, 싱가포르 내 전자지갑 서비스 출시 예정

에어아시아, 싱가포르 내 전자지갑 서비스 출시 예정

[뉴스포픽=문현기 기자] 말레이시아의 에어아시아(AirAsia)가 핀테크 자회사 빅페이(BigPay)를 통해 싱가포르 내에 전자지갑 서비스를 출시할 예정이라고 지난 9월 28일 밝혔다. 빅페이는 말레이시아에서 20...

"2023년까지 스마트 랩 시장이 2배 성장할 것"...설리번 보고서

"2023년까지 스마트 랩 시장이 2배 성장할 것"...설리번 보고서

[뉴스포픽=고유미 기자] 28일 프로스트 앤드 설리번이 ‘2020 진단 기관의 혁신을 이끌 스마트 랩(Smart Labs as Key Drivers for the Digital Transformation of Diagnostic Laboratories, 2020)’ 분석 보고서를 ...

한국인공지능협회, 20개 기업과 AI 데이터 구축사업 MOU 체결

한국인공지능협회, 20개 기업과 AI 데이터 구축사업 MOU 체결

[뉴스포픽=김한영 기자] 사단법인 한국인공지능협회(회장 김현철. 이하, 협회)가 서울시의 ‘서울형 뉴딜 일자리 인공지능 학습 데이터 사업’ 주관기관으로 국내 대표적인 인공지능·데이터 기업 20개사와 협약을 ...

글로벌 빅데이터 분석 시장 규모, 2025년 680억9,000만 달러 전망

글로벌 빅데이터 분석 시장 규모, 2025년 680억9,000만 달러 전망

[뉴스포픽=장성호 기자] 빅데이터 분석 시장 경쟁은 치열해지고 있다. 관련 기업들은 지연 시간 단축과 신속한 인사이트 제공이 가능한 엣지 분석 기능을 제공하는 등 제품 포트폴리오의 다양성을 꾀하고 있다.그...

글로벌 AI 인덱스로 본 한국 AI산업의 현주소

글로벌 AI 인덱스로 본 한국 AI산업의 현주소

[뉴스포픽=김한영 기자] 지난 6월 포스트 팬데믹 시대에 국가와 산업 전반의 디지털화를 추진하는 ‘한국형 뉴딜(디지털 뉴딜+그린 뉴딜)’ 계획이 발표되었으나, 정작 IT강국 한국은 인프라․ 특허를 제외하고는 모...