초록
인공지능 시대에 인공지능 기술이 본격적으로 우리의 삶에 들어오면서 많은 새로운 윤리 문제를 제기하고 있다. 특히 인공지능의 품질 내지 능력을 결정하는 학습 데이터로부터 윤리적 고려 사항들이 속출하고 있다. 그로 인해 이전에 강조되던 빅데이터 윤리에서 이제는 인공지능 학습용 데이터 윤리까지 그 중요성이 확장되고 있다. 앞으로 우리가 이용하게 될 인공지능이 어떤 학습 데이터를 가지고 학습했는지에 대한 인증과 검증이 인공지능의 사회적 수용성의 중요한 기준으로 작용할 것으로 예측된다. 데이터 윤리에 관한 확장적 논의가 재요구되는 가운데 실질적 적용성을 가지려면 새로운 데이터 윤리 가이드라인이 전제되어야 한다. 이때 데이터의 수집 및 처리 과정에서부터 결과에 대한 활용 전반에 걸쳐서 지켜야 할 윤리 원칙을 수립하고, 이에 근거하여 데이터 윤리 가이드라인에 대한 사회적 합의가 도출되어야 한다. 이에 본 연구는 다음과 같은 연구 주제를 수행하였다. 첫째, 데이터 윤리를 정의하고 있는 기존 사례를 분석하여 새로운 시대에 요구되는 데이터 윤리의 개념을 정의하였다. 둘째, 선행적으로 데이터 윤리에 관해 활발한 논의를 펼치고 있는 해외의 윤리 가이드라인 사례를 정리하고 주요 내용을 추출하였다. 셋째, 두 가지 연구 주제에서 수행된 사항을 토대로 인공지능의 학습용 데이터의 윤리 프레임워크를 개발하였다.
이렇게 수행된 각 장의 연구 결과는 다음과 같다. Ⅰ장에서는 고도화된 인공지능 기술이 인류 사회에 지대한 영향을 미치고 있음에 따라 인공지능의 핵심이 되는 학습용 데이터에 주목하여 데이터 윤리의 필요성을 확인하였다. 나아가 데이터 윤리가 암묵적인 의식의 차원에서 종결되지 않도록 하기 위한 전제로서 인공지능의 학습용 데이터 윤리 가이드라인이 요구됨을 파악하였다.
Ⅱ장에서는 데이터 윤리의 사례와 정의를 다루고 있다. 기존의 빅데이터 시장에서 일어나는 다양한 유형의 윤리적 이슈들이 있었지만, 최근에는 인공지능과 결합하여 나타나는 데이터 윤리의 사례들이 또 다른 양상으로 펼쳐지고 있다. 그로부터 인공지능으로부터 발생하는 데이터 윤리 사례를 확인하였고, 이를 바탕으로 데이터 권리와 데이터 책임을 핵심 개념으로 하는 데이터 윤리의 정의를 내릴 수 있었다. 이어서 미리 발표되어 온 데이터 윤리 원칙들의 사례를 분석하여 핵심 가치를 총 9가지로 분석하였고, 궁극적으로 데이터 권리와 데이터 책임의 구조를 질문 세트로 구성하여 나타낼 수 있었다.
Ⅲ장에서는 데이터 관리 및 활용에 대한 포괄적인 윤리적 행동 기준으로 제시된 기존의 데이터 윤리 가이드라인을 분석하고 범주화하였다. 데이터 윤리 가이드라인들을 분석한 결과, 다양한 분야에서 각각의 목적에 따라 데이터 윤리 가이드라인이 만들어져서 운용되고 있음을 알 수 있었다. 데이터 윤리 가이드라인은 원리나 가치 중심의 접근과 구체적인 행동 강령 제시를 통해 구성되며, 윤리 원칙과 윤리 프레임워크 등으로 구성된 데이터 윤리 가이드라인은 데이터 윤리를 실용적으로 적용할 수 있는 안내를 제공하고 투명성을 증진할 수 있다는 이점이 있다. 또한 기존의 데이터 윤리 가이드라인 혹은 윤리 규칙들을 바탕으로 하여 귀납적으로 구성된 여섯 개의 범주를 통해 분석하였으며, 여섯 범주는 “AI 학습용 데이터 수집 및 이용에 대한 동의(consent on data collection and use)”, “AI 학습용 데이터 보안(data security, safety)과 개인정보 보호(Privacy)”, “AI 학습용 데이터 공정성과 해악 금지”, “AI 학습용 데이터의 적절성(합목적성)”, “AI 학습용 데이터의 거버넌스”이다.
Ⅳ장에서는 AI 학습용 데이터의 윤리 프레임워크 시안을 개발하였다. AI와 인간이 공존하는 분야가 확대됨에 따라 AI가 학습하는 데이터에 관한 윤리적 고찰이 매우 중요하다. 특히 교육 분야에서 디지털과 AI의 기본 소양을 함양하는 추세가 강화되고 있다. 하지만 데이터의 윤리적 문제는 주로 처리 과정에서 투명성, 프라이버시 보호 등 기술적 처리와 절차 준수에 관한 규정적 수준에 머물러 있다. AI가 학습하는 데이터는 단순히 양과 기술의 문제가 아니라 학습용 데이터의 활용 전 과정에 걸쳐 있는 윤리적 검토를 거쳐야 한다.
AI 학습용 데이터의 윤리 프레임워크 개발을 위해 크게 5가지 사항을 고려하였다. 첫째, AI 학습용 데이터 윤리의 두 수준으로서 책임과 권리이다. 둘째, AI 학습용 데이터가 쟁점이 되는 영역은 일반적인 데이터의 속성에 따라 발생하는 윤리에 해당한다. 셋째, 책임과 권리의 주체는 AI 학습용 데이터의 당사자이다. 이번 연구에서는 범용 AI 학습용 데이터의 생산과 소비의 특성을 고려하여 당사자를 생산자와 소비자로 구분하였다. 넷째, AI 학습용 데이터의 윤리 프레임워크는 학습용 데이터의 생성, 수집, 소비의 전 단계를 고려하였다. 다섯째, AI 학습용 데이터의 윤리 프레임워크의 목적은 학습용 데이터 당사자의 윤리 의식의 함양에 있다.
AI 학습용 데이터의 윤리 프레임워크의 도덕성을 학습용 데이터와 관련된 자신의 결정이 인간 일반에 미치는 복지 향상으로 간주하였다. 인간의 복지를 향상시키기 위한 협력과 갈등 해결을 위한 도덕성 4구성요소를 토대로 다음과 같이 AI 학습용 데이터의 윤리 프레임워크의 도덕성 구성요소를 설정하였다. 첫째, 윤리적 민감성은 AI 학습용 데이터의 당사자가 관여하는 데이터의 생성, 수집, 소비의 전 과정이 영향을 미칠 수 있는 대상과 상황을 이해할 수 있는 윤리 프레임워크의 구성요소이다. 둘째, 윤리적 판단력은 AI 학습용 데이터의 당사자가 데이터의 생성, 수집, 소비의 전 과정에서 판단하는 도덕적으로 옳고 그름에 대한 판단 기준들에 관한 윤리 프레임워크의 구성요소이다. 셋째, 윤리적 동기화는 AI 학습용 데이터의 당사자가 데이터의 생성, 수집, 소비의 전 과정에서 결정한 판단 기준들에서 개인적인 가치보다 가장 윤리적인 가치에 우선순위와 의미를 부여하는 윤리 프레임워크의 구성요소이다. 넷째, 윤리적 실행력은 AI 학습용 데이터의 당사자가 생성, 수집, 소비의 전 과정에서 자신의 의도대로 실행하는 수행기술을 강화하고, 평가 및 환류를 통해 윤리적으로 개선된 실행을 지속하는 윤리 프레임워크의 구성요소이다.
이를 통해 학습용 데이터의 당사자인 생산자와 소비자, 책임과 권리의 2가지 윤리 수준을 반영한 생산자용 AI 학습용 데이터 윤리 프레임워크와 소비자용 AI 학습용 데이터 윤리 프레임워크를 각각 개발하였다.
더보기
목차
Ⅰ. 서론 1
1. 데이터 윤리의 필요성 3
2. 데이터 윤리 가이드라인의 필요성 4
Ⅱ. 데이터 윤리의 사례와 정의 7
1. 데이터 윤리의 사례 9
2. 데이터 윤리의 정의 11
3. 데이터 윤리의 원칙 분석 15
4. 데이터 권리와 데이터 책임의 구조 21
Ⅲ. 기존 데이터 윤리 가이드라인 분석 25
1. 데이터 윤리 가이드라인에 대한 요구 27
2. 데이터 윤리 가이드라인 현황 27
3. 데이터 윤리 가이드라인의 분석 72
Ⅳ. 인공지능(AI)의 학습용 데이터의 윤리 프레임워크 개발 81
1. 교육분야에서 AI 윤리원칙과 데이터 83
2. AI 학습용 데이터 윤리 프레임워크 개발을 위한 고려 사항 88
3. AI 학습용 데이터의 윤리 프레임워크 시안 98
Ⅴ. 논의 119
참 고 문 헌 128
Abstract 131
부 록 135
1. 생산자용 AI 학습용 데이터의 윤리 프레임워크 구조 138
2. 소비자용 AI 학습용 데이터의 윤리 프레임워크 구조 151
더보기
저자소개
■ 연구책임자
- 변순용(서울교육대학교)
■ 공동연구자
- 송선영(경상국립대학교)
- 이청호(상명대학교)
- 김정남(한국교육학술정보원)
■ 연구보조원
- 방은찬(의정부부용초등학교)
- 장희영(수원금곡초등학교)
- 이지형(서울서원초등학교)
■ 과제책임자
- 정광훈(한국교육학술정보원)
- 김정남(한국교육학술정보원)
더보기