전체메뉴

검색
팝업창 닫기
이메일보내기

챗GPT에 내 정보가 뜬다고?…정부, 방지 위한 기준 마련

CT서 환자번호·성별 지우고

자율주행 데이터서 사람 얼굴 가려야


챗GPT에 활용되는 음성이나 텍스트처럼 인공지능(AI) 기술 개발에서 핵심 재료인 '비정형 데이터'에 대한 사용 기준이 새롭게 마련됐다.

개인정보보호위원회는 4일 이러한 내용이 담긴 '가명정보 처리 가이드라인' 개정안을 발표했다. 가명정보는 개인정보 일부 항목을 삭제·변형해 추가 정보 결합 없이는 특정 개인을 알아볼 수 없도록 한 정보다.

정형 데이터가 엑셀 파일처럼 행과 열 등 규정된 틀에 정리된 수치라고 한다면, 비정형 데이터는 정의된 구조가 없는 음성·텍스트·영상·이미지 등의 정보를 의미한다.

인공지능 기술이 빠르게 발달하면서 지난해 기준 비정형 데이터는 전 세계 데이터의 약 90%를 차지할 정도로 몸집이 커졌다. 그러나 기존에 마련된 가이드라인은 정형 데이터에 대한 기준만 제시한 탓에, 기업이나 연구기관을 중심으로 비정형 데이터 사용 기준이 모호하다는 목소리가 나왔다.

개정된 가이드라인은 비정형 데이터를 활용하는 과정에서 개인정보 유출 위험을 차단하기 위한 원칙을 명시하고, 의료·교통·챗봇 등 주요 7개 분야에 걸맞은 사례를 설명해 현장에서 손쉽게 활용할 수 있도록 한 것이 특징이다.



가령 병원에서 환자의 컴퓨터단층촬영(CT)을 사용할 때 '블랙마스킹' 기법을 통해 환자 번호나 생년월일, 성별 등을 지우도록 권고했다. 자율주행 시스템이나 교통정보 등에 비정형데이터를 활용할 경우 행인이나 차량 탑승자의 얼굴과 차량 번호판을 컴퓨터가 식별할 수 없는 수준으로 가려야 한다고 했다.

인공지능 챗봇의 경우 언어 학습에 활용된 가명 정보가 그대로 답변으로 나오지 않도록 '학습 데이터베이스'와 '답변 데이터베이스'를 분리해 처리할 것을 명시했다.

또 이메일 주소와 ID 등 개인이 식별될 수 있는 항목들을 가명 처리해야 한다고 언급했다.
< 저작권자 ⓒ 서울경제, 무단 전재 및 재배포 금지 >
주소 : 서울특별시 종로구 율곡로 6 트윈트리타워 B동 14~16층 대표전화 : 02) 724-8600
상호 : 서울경제신문사업자번호 : 208-81-10310대표자 : 손동영등록번호 : 서울 가 00224등록일자 : 1988.05.13
인터넷신문 등록번호 : 서울 아04065 등록일자 : 2016.04.26발행일자 : 2016.04.01발행 ·편집인 : 손동영청소년보호책임자 : 신한수
서울경제의 모든 콘텐트는 저작권법의 보호를 받는 바, 무단 전재·복사·배포 등은 법적 제재를 받을 수 있습니다.
Copyright ⓒ Sedaily, All right reserved

서울경제를 팔로우하세요!

서울경제신문

텔레그램 뉴스채널

서경 마켓시그널

헬로홈즈

미미상인