스토리

[과학향기 Story] 더 많은 공유로 더 나은 과학을, 오픈 사이언스

<KISTI의 과학향기> 제3045호   2024년 03월 25일
국제보건기구가 코로나19 팬데믹 종식을 선언한 지 약 1년이 되어가는 지금, 전 세계는 경제 침체의 시기를 힘겹게 버티고 있다. 실제 세계가 에너지 자원을 둘러싼 갈등이 고조되고 신재생 에너지원으로의 전환이 지체되는 한편, 온라인 공간은 챗GPT로 대표되는 초거대 인공지능(AI) 언어 모델 서비스가 빠르게 점유하고 있다. 2010년대 초반 중요한 기술 분야로 손꼽힌 ‘빅데이터’가 10여 년이 지나 기술 혁신의 가능성을 증명한 셈이다.
 
지난 2021년 11월 개최된 제41차 총회에서 유네스코는 193개 회원국의 만장일치로 ‘오픈 사이언스 권고안’을 마련했다. 또 미국은 2023년을 ‘오픈 사이언스의 해’로 선포하며 이를 위한 연구 인프라 개선 방향과 추진 체계를 발표했다. 빅데이터와 AI의 영향력 확대와 동시에 국제 사회가 오픈 사이언스라는 키워드에 주목하는 까닭은 무엇일까? 오픈 사이언스의 기본 개념과 활용, 우리나라의 상황을 두루 살펴보자.
 
UNESCORecommendationonOpenScience08
그림 1. 2021년 유네스코는 회원국의 만장일치로 오픈 사이언스 권고안을 마련했다. ⓒwikimedia
 

과학 연구, 더는 혼자 하지 않는다
현대 사회는 하나의 연구실, 단일 국가만으로는 해결할 수 없어 더 많은 집단이 머리를 맞대어야 하는 문제가 늘어나고 있다. 코로나19 백신 개발이 대표적 사례다. 전 세계 과학·의학 연구팀이 누구나 접근 가능한 형태로 연구 결과를 공유하면서, 첫 감염 사례가 나온 이후 한 달 만에 전 세계 모든 연구자가 신종 바이러스의 유전체 분석 결과를 확인할 수 있었다. 이는 20년 전 중증급성호흡기증후군(SARS) 사례에서 분석 결과 공유가 5개월간 지연된 것과 확연히 대비된다. 과학자들 스스로가 연구실, 국가라는 경계를 허물고 모두를 위한 지식을 내놓은 덕에 코로나19 백신은 유례없는 속도로 개발될 수 있었다.
 
오픈 사이언스란 이처럼 과학 연구의 데이터와 아이디어를 모든 연구자에게 개방하고 공유함을 뜻한다. 빅데이터 활용에 관한 관심이 최근 몇 년의 일이 아닌 만큼 오픈 사이언스에 관한 국제적 논의는 2010년대 이후부터 지속되었다. 2011년 OECD는 과학 연구환경의 변화에 따라 오픈 사이언스를 새로운 정책 의제로 내놓으며 연구데이터를 공유하고 상호 협력하여 연구할 것, 연구 성과를 개방할 것을 요청한 바 있다.
 
모두가 공감하는 연구환경의 변화는 이론과 실험 중심이던 지난 세기와 달리, 지금의 연구가 데이터와 컴퓨팅 자원을 적극적으로 활용한다는 것이다. 오늘날 연구자들은 과학자 개개인이 어떤 현상을 모델링해 가설과 결과가 얼마나 부합하는지를 확인하는 대신, 다국적의 연구자가 팀을 이루고 빅데이터와 AI를 활용해 결과를 확률적으로 예측하려 한다. 또 대학과 기업 간 연계, 여러 국가의 컨소시엄, 서로 다른 분야 사이의 공동연구로 연구의 규모 자체가 커지며 개별 결과를 공유할 수 있도록 하는 데이터셋을 설계하고 데이터 센터를 구축할 필요성이 커졌다. 한국과학기술기획평가원의 분석에 따르면 과학자들이 노벨상을 공동 수상한 비율은 1950~1960년대 56~60%에서 2000년대에 90% 수준까지 높아졌다. 공동 연구가 필수가 된 현대 과학에 있어 오픈 사이언스는 원활한 지식공유를 위한 밑바탕이 된다.
 
 
오픈 사이언스 정신의 확산, 협업의 핵심은?
 
image01
그림 2. 오픈 사이언스의 3요소. (* 리포지토리(Repository)는 정보, 데이터 등에 대해 공유·협업의 기능을 갖춘 저장소를 뜻한다) ⓒKISTI

오픈 사이언스 권고안을 마련한 유네스코는 이러한 공유 정신을 현실화하기 위해 여러 국가기관과 MOU를 맺으며 개방형 데이터 생태계 구축에 앞장서고 있다. 특히 과학 및 교육 분야에서 오픈 사이언스 시스템을 마련해, 연구자와 기업뿐만 아니라 일반 시민이 과학 지식에 쉽게 접근할 수 있도록 범위를 넓히고 있다. 유럽연합(EU) 역시 2014년 이래 EU의 지원을 받는 R&D 연구 결과물의 공개를 의무화하고, 데이터 관리 계획을 필수적으로 제출하도록 하고 있다.
 
우리나라에서는 한국과학기술정보연구원(KISTI)이 2010년대부터 오픈 사이언스를 위한 제도와 인프라 구축을 담당하고 있다. KISTI의 설립 목표가 과학기술 R&D 인프라 구축을 위한 만큼 2010년대에는 빅데이터 기반 기초과학을 지원하는 데이터 센터를 운영했으며 현재는 사이언스온(ScienceON), 액세스온(AccessON), 데이터온(DataOn) 등 온라인 플랫폼을 활용해 데이터 접근과 확산을 돕고 있다. 사이언스온(ScienceON)은 사용자가 필요한 학술정보를 한자리에서 검색해 활용 방법을 안내하는 플랫폼이다. 액세스온(AccessON)은 검색한 지식 정보를 활용해 공동 논문을 발행하고 오픈 액세스 학술지에 출판하는 일련의 과정을 지원한다. 데이터온(DataOn)은 전 세계 주요 데이터와 국내 R&D 결과로 나온 데이터를 한곳에 모아 데이터 기반 연구를 효율적으로 수행하도록 한다. KISTI는 국내 오픈 사이언스의 글로벌 선도 기관으로서 과학기술 관련 논문 전문 텍스트, 표, 그림 등을 수백만 건을 데이터화하고 우수 사례를 수집 및 확산하며, 유네스코 등의 기관과 MOU를 체결하고 있다.
 
20240321145521
그림 3. 국가오픈액세스플랫폼 액세스온(AccessON)은 논문 검색부터 저작, 투고심사, 학술지와 학술행사에 대한 정보 확인, 온라인 출판 및 확산, 연구 성과 공유 등 학술출판 전주기의 오픈 액세스와 디지털 전환을 지원한다. ⓒKISTI

대학, 연구소 등에서 쌓은 과학 지식이 국가의 지원을 받아서 생산되므로 국민 누구나 이용할 수 있는 권한을 줘야 한다는 것은 타당해 보인다. 그러나 완전히 공개·개방된 과학 지식들은 약간의 부작용을 야기할 수 있다. 과거 OECD의 제안이 폐쇄적인 과학 연구의 관행을 완화하는 데 집중했다면, 공동 연구가 보편화된 지금의 오픈 사이언스는 타국과 과학 지식을 교류하면서 어떻게 자국의 이익을 보호할 것인가에 관한 고민도 진행 중이다. 가령 미국은 공공 지식의 접근성을 높이고 민간의 활용 범위를 넓히는 한편, ‘보안과 프라이버시’를 강조하며 데이터 공유에 따른 이익을 어떻게 공유할 것인가를 새롭게 논의하고 있다. 
 
챗GPT 등의 민간 인공지능 서비스의 최신 쟁점은 빅데이터를 통해 얻은 이익을 어떻게 분배할 것인지에 있다. 국제 연구의 이후 화두는 공공 지식의 정의로운 사용이 될지 모른다. 이러한 최신 연구 패러다임에 합류하는 하나의 지침으로 오픈 사이언스를 대하면 어떨까. 더 넓은 과학의 길은 연구자 모두에게 열려 있다.
 
 
글: 맹미선 과학칼럼니스트/ 일러스트: 이명헌 작가
평가하기
추천 콘텐츠
인기 스토리
쿠키를 지원하지 않는 브라우저이거나 브라우저 설정에서 쿠키를 사용하지 않음으로 설정되어 있는 경우 사이트의 일부 기능(로그인 등)을 이용할 수 없으니 유의해 주시기 바랍니다.
메일링 구독신청하기