공개 데이터 활용 기준, AI 시대 개인정보 보호의 새 이정표

정당한이익

1. 왜 ‘공개된 개인정보’ 처리 기준이 필요한가 인공지능(AI) 기술이 급속도로 발전하면서, 챗GPT나 생성형 AI 모델 대부분은 인터넷상 공개된 데이터를 통해 학습 과정을 거칩니다. 예컨대, 커먼크롤(Common Crawl), 위키백과(Wikipedia), 블로그, 웹사이트 등 ‘누구나 합법적으로 접근할 수 있는’ 데이터가 광범위하게 AI 학습에 투입되고 있습니다. 이러한 공개 데이터 중에는 개인의 주소·고유식별번호·신용카드번호 등 각종 민감 정보가 섞여 있을 가능성이 높습니다.이처럼 … Read more