스토리

[과학향기 Story] 유전정보 담는 DNA… 빅데이터 · 우주 시대 이끌 새 저장장치로 각광

<KISTI의 과학향기> 제3125호   2025년 01월 06일
인류 문명의 진보는 곧 데이터 저장장치의 진보이기도 하다. 아주 예전에는 수많은 서사와 지식․지혜가 입에서 입으로 전해지며 문화의 연속성을 유지시켰다. 이후 점토판․파피루스․양피지․죽간․종이 등 새로운 매체가 등장하며 더 많은 정보를 정확하게 저장할 수 있게 됐다. 이렇게 전달된 지식과 정보가 쌓여가며 인류는 찬란한 문명을 이룩할 수 있었다.
 
디지털 기술의 발달로 데이터 혁명이 일어나고 있는 현재, 이러한 진보는 더욱 가속화되고 있다. 1971년 IBM이 처음 내놓은 플로피 디스크의 용량은 고작 50KB. 200자 원고지로 치면 100장을 채 못 저장하는 셈이었다. 이후 CD, USB, SD 등이 등장하며 인류는 더 많은 정보를 편하게 저장할 수 있게 됐다.
 
사진1
사진 1. 수십억 년 동안 유전정보를 저장․전달해왔던 DNA가, 이제는 빅데이터 시대에 어울리는 새로운 저장장치로 거듭날 전망이다. ⓒshutterstock
 
1g에 215PB 정보 담는 DNA… 문제는 경제성
 
최근엔 DNA를 활용한 저장장치가 많은 관심을 받고 있다. 생명체의 설계도로 흔히 비유되는 DNA는 엄청난 정보를 효율적으로 담고 있다. DNA 1g엔 무려 215PB의 정보를 저장할 수 있다고 한다. 1PB는 1000조 바이트에 이르니, 말 그대로 천문학적인 정보량이다.
 
이는 DNA가 가진 네 가지 형태의 염기 덕분이다. 아데닌(A), 시토신(C)을 0, 구아닌(G), 티민(T)을 1로 설정해 정보를 저장하면 일종의 4진법 하드디스크처럼 활용할 수 있는 것. 지난 2017년 콜롬비아대 연구진은 이러한 방법을 도입해 DNA가닥 72,000개에 파일 6개를 저장했다. 연구진은 컴퓨터 OS, 프랑스 고전 영화 1편, 아마존 기프트 카드 등 DNA에 담긴 다양한 정보를 복원해 에러 없이 재생된 것을 확인했다.
 
이는 DNA 저장장치의 실용화 가능성을 확인한 획기적 연구결과로 꼽힌다. 지난 2012년 최초로 DNA 저장장치의 개념을 현실화한 하버드대 연구진은 단어 53,000개, 그림 11개 등 5.27MB가량의 데이터를 DNA에 저장하는 데 성공했으나, 이를 성공적으로 복원하는 작업은 실패했다. 이후 5년 만에 DNA 내 정보 해독 기술이 궤도에 올라 문제를 해결한 셈이다.
 
다만 실질적인 문제가 남았는데, 바로 경제성이다. DNA에 데이터를 저장하기 위해 염기를 조합․합성하는 비용이 상당하다. 2015년 DNA 데이터 저장에 성공한 스위스 연구진은 고작 83KB 저장에 1,500달러라는 비용을 들여야 했다. 더불어 염기 합성 시 발생 가능한 오류를 검수하는 작업은 많은 시간이 필요하다.
 
효율 350배 향상해 비용 대폭 절감… 데이터 완벽 구현
 
그런데 최근 이에 대한 새로운 해결책이 나와 관심을 끌고 있다. 애리조나 주립대 연구진이 2024년 10월 24일 학술지 네이처에 발표한 연구다. 핵심은 후성유전학을 통한 효율 향상이다. 후성유전학은 DNA 염기서열 변화 없이, 환경 적응을 통해 유전자 발현을 조절하는 형질이 다음 세대까지 전달되는 현상을 연구하는 학문이다. 이를 바탕으로 DNA 염기서열은 그대로 두고, 염기만 선택적으로 바꾸는 방식을 도입해 DNA 합성에 들어가는 비용을 아낄 수 있게 된 것이다.
 
연구진은 이를 위해 DNA 염기와 결합이 용이한 메틸기에 주목했다(메틸(CH₃)이 다른 화합물과 붙어 있을 때 메틸기라 한다). 연구진은 삼각피라미드 구조를 가진 메틸기를 DNA 염기에 선택적으로 붙이고, 그 유무에 따라 각각 1과 0으로 구분했다. 기존 4진법 대신 2진법을 적용한 것이다.

연구진에 따르면, 새로운 2진법 방식으론 화학 반응 1회에 350비트 데이터를 저장할 수 있다. DNA 합성에 의존하는 기존 시스템(화학 반응 1회에 1비트 데이터 저장)에 비해 350배나 효율적인 수치다. 연구진은 미리 제작한 DNA 염기에 메틸기를 접합해 27만 5,000비트 용량의 DNA 저장장치를 제작하고, 여기에 호랑이 문양과 판다 사진 데이터를 저장했다. 호랑이 문양의 용량은 1만 6,833비트, 판다 사진의 용량은 25만 2,504비트다.
 
연구진은 DNA 시퀀싱에 유용한 나노포어 기술로 DNA 저장장치 속 데이터를 출력했다. 그 결과 97.47%의 정확도를 보였으며, 여기에 오류 수정 디코딩 알고리즘을 적용해 원본과 동일한 이미지를 얻을 수 있었다. 이로써 DNA 저장장치의 가장 큰 난관이었던 비용 문제 해결의 실마리가 풀렸다.
4158620248040Fig5HTML사진 2. 연구팀은 오류 수정 디코딩 알고리즘을 통해 원본과 차이 없는 이미지를 얻을 수 있었다고 밝혔다. ⓒNature
 
안정적이고 에너지 소모 적은 DNA 저장장치… 향후 활용 기대
 
향후 DNA 저장장치는 대용량․장기간 정보 저장에 주로 활용될 전망이다. CD·USB·SD·HDD 등 기존 저장장치의 데이터 보존 기간은 생각보다 길지 않으며 물리적 손상도 이뤄진다. 반면 DNA는 온도와 습도만 조절해 주면, 손상 없이 오랫동안 데이터를 저장할 수 있다. 실제 영구동토층에서 발견된 몇만 년 전 고대 생물의 DNA 데이터를 성공적으로 복원, 연구에 활용하는 경우가 종종 있다.
 
에너지 소모가 적은 것도 DNA 저장장치의 장점이다. 데이터센터에 있는 디지털 저장 장치는 정보 손실․변형을 감시하기 위해 많은 전력이 필요하다. 그 때문에 오랫동안 엑세스되지 않는 콜드 데이터를 데이터센터에서 보관하는 것은, 필요하지만 비효율적인 작업으로 꼽힌다. DNA 저장장치를 활용하면 이러한 비효율을 해결할 수 있다.
 
한편, 우주 시대 정보 저장․이동장치로서도 DNA는 활용도가 높다. 기존 디지털 저장장치에 비해 우주 환경에서 훨씬 안정적이기 때문이다. 이에 더해 보관 공간 확보가 용이하고, 에너지 소모가 적다는 장점은 다양한 우주 프로젝트에 특히 안성맞춤이다. 지구에 생명체가 탄생한 이후 수십억 년 동안 유전정보를 저장․전달해 왔던 DNA가, 이제는 빅데이터․우주 시대에 어울리는 새로운 저장장치로 거듭날 전망이다. 
 
0106 DNA 디스크 250x250

 
 
글 : 김청한 과학칼럼니스트 , 일러스트 : 이명헌 작가
평가하기
추천 콘텐츠
인기 스토리
쿠키를 지원하지 않는 브라우저이거나 브라우저 설정에서 쿠키를 사용하지 않음으로 설정되어 있는 경우 사이트의 일부 기능(로그인 등)을 이용할 수 없으니 유의해 주시기 바랍니다.
메일링 구독신청하기