입력 2019.02.27 03:12
수십 년 동안 공상과학 영화에서나 볼 수 있었던 '인공지능'.
'기계학습'이라는 이름 아래 최근 새로운 기술과 산업의 기반이 되고 있다.
이토록 비약적인 발전의 비밀은 무엇일까?
천문학적으로 늘어난 데이터와 새로운 컴퓨터 프로세서, 그리고 '딥러닝'이라 불리는 뇌 모방 학습 알고리즘 모두 중요한 역할을 했을 것이다. 하지만 기계학습 발전에 공헌한 또 하나의 숨은 챔피언이 있다.
바로 '오픈 소스(Open Source)' 운동이었다.
새로운 컴퓨터 알고리즘의 핵심은 엔지니어가 코딩한 '소스 코드'다.
새로운 컴퓨터 알고리즘의 핵심은 엔지니어가 코딩한 '소스 코드'다.
소스 코드만 있다면 동일한 알고리즘을 누구나 컴파일해 상용할 수 있다.
대부분 IT 업체들이 자신들의 소스 코드를 국가기밀 수준 이상으로 보호하고 있는 이유다.
하지만 딥러닝 리더들은 오픈 소스 방식을 선호한다.
기트허브(Github) 같은 무료 사이트를 통해 최첨단 소스 코드들이 공유되고 있기에
인공지능 기술들이 기하급수적으로 발전했다고 가설해 볼 수 있겠다.
그런데 최근 기계학습 커뮤니티의 오픈 소스 철학에 금이 가기 시작했다.
그런데 최근 기계학습 커뮤니티의 오픈 소스 철학에 금이 가기 시작했다.
일론 머스크가 설립한 OpenAI 재단이 개발한 GPT-2 알고리즘이 한 예다.
입력된 문장을 기반으로 그럴싸한 새로운 문서를 작성할 수 있다는 GPT-2.
브렉시트 관련 기사를 스스로 완성하고
조지 오웰의 디스토피아 소설 '1984'의 첫 문장을 기반으로 새로운 내용을 작성한다.
그렇다면 더 극단적인 상황도 상상해볼 수 있겠다.
그렇다면 더 극단적인 상황도 상상해볼 수 있겠다.
"기후변화는 존재하지 않는다" "예방 접종이 자폐증의 원인
이다" "오바마는 미국인이 아니다" 같은
인터넷에 떠돌아다니는 음모론 키워드만 입력하면
그럴싸한 가짜 스토리를 무한으로 만들어낼 수 있다는 말이다.
그래서일까? OpenAI 재단은 GPT-2 소스 코드를 공개하지 않기로 결정한다.
마치 핵무기 개발 기술이나 인간 복제 기술과도 같이
이젠 최첨단 기계학습 알고리즘 역시 사회적 영향을 고려해야 한다는 말이겠다.
Copyright ⓒ 조선일보 & Chosun.com