- 과학향기 Story
- 스토리
스토리
[데이터 과학-2] 인공지능에게 필요한 데이터는 특별하다!
<KISTI의 과학향기> 제3439호 2019년 10월 14일인공지능은 한 때 주목을 받았지만, 응용 범위에 한계가 있어 관심이 식어졌었다. 알파고 등장 이후 우리나라에서 인공지능(Artificial Intelligence, AI)에 대한 관심이 다시 높아졌다. 지금 인공지능이 다시 주목을 받는 것은 컴퓨터 기술의 비약적인 발전으로 아주 전문적인 영역의 문제를 풀 수 있게 되었을 뿐만 아니라, 인간 생활의 다양한 영역에서 실질적인 기여를 할 수 있는 가능성이 보이기 때문이다.
인공지능을 가능하게 하는 기반은 하드웨어와 데이터
인공지능이 다시 주목을 받게 된 것은 인공지능 알고리즘의 발전도 있었지만, 컴퓨터 핵심 부품인 데이터 저장장치와 처리장치가 과거에 비해서 비약적으로 발전했을 뿐만 아니라 인터넷의 속도도 크게 빨라졌기 때문이다. 데이터 저장장치의 발전은 방대한 학습 데이터를 적은 비용으로도 저장할 수 있게 하고, 데이터 처리장치와 인터넷 속도의 발전은 실시간에 가까운 응답을 가능하게 한다.
그런데 사실은 데이터가 있어야 이 모든 것이 의미가 있다. 데이터가 없다면, 아무리 대용량의 저장장치와 초고속의 처리장치와 인터넷이 있어도 무용지물일 뿐이다. 지금 시대는 빅데이터 시대가 되어 데이터가 곳곳에서 차고 넘치게 되어 데이터 저장장치와 처리장치, 그리고 인터넷이 그 어느 때보다 바쁘게 움직이고 있다. 하지만 모든 데이터가 유효하지는 않다. 그리고 데이터는 디지털화되어야 하고, 신뢰할만해야 하며, 충분한 양이 있어야 한다.
사진 1. 데이터 저장장치 같은 하드웨어의 비약적 발전은 인공지능을 가능케 했다. 이제 필요한 것은 어떤 데이터를 처리하느냐이다. (출처: pixabay)
인공지능을 뒷받침하는 데이터의 특별한 속성
먼저, 데이터가 디지털화되어야 하는 이유는 그래야만 컴퓨터가 읽을 수 있기 때문이다. 종이 매체에 기록된 데이터는 컴퓨터로 입력해야 하기 때문에 많은 비용이 든다. 요즈음은 신문 기사나 학술 논문도 아예 처음부터 디지털화하기 때문에 이러한 측면에서 큰 도움이 된다. 또한 사물인터넷(Internet of Things, IoT)이 확산되면, 수많은 디지털 데이터를 손쉽게 모을 수 있게 된다.
그렇지만, 이러한 데이터는 신뢰할 수 있어야 한다. 인공지능에 활용되는 데이터에 오류 데이터, 가짜 데이터, 위험 데이터가 들어가게 되면, 그 결과는 많은 문제를 야기할 수 있기 때문이다. 마치 수돗물을 사람이 먹을 수 있도록 품질관리를 하듯이 데이터도 인공지능이 오답을 내지 않도록 품질 관리가 꼭 필요하다. 더 나아가서, 원유가 정제될수록 고급 제품이 되어 비싸게 팔리듯, 데이터도 적절한 큐레이션을 통해서 그 가치를 배가할 수 있다.
사진 2. 인공지능이 제대로 된 기능을 발휘하려면, 그 기반이 되는 데이터는 디지털화되어야 하고, 신뢰성과 충분한 양을 확보해야 한다.
마지막으로 인공지능이 정확한 답을 내기 위해 필요한 충분한 양의 데이터가 필요하다. 그러기 위해서는 필요한 데이터가 모두 공개되어야 한다. 그런데, 여러 가지 이유로 데이터 공개가 안 되고 있다. 저작권 있는 데이터, 민감한 데이터, 보안 데이터 등이 있는데, 이러한 데이터를 인공지능에 활용할 수 있는 방안 마련이 시급하다. 이를 위해서 정부에서는 오픈 데이터 정책을 제도화하고, 데이터 공개를 위한 다양한 사업을 시행하고 있다.
글: 서태설 한국과학기술정보연구원(KISTI) 학술정보공유센터장/일러스트: 이명헌 작가
추천 콘텐츠
인기 스토리
-
- 저주파 자극기, 계속 써도 괜찮을까?
- 최근 목이나 어깨, 허리 등에 부착해 사용하는 저주파 자극기가 인기다. 물리치료실이 아니라 가정에서 손쉽게 쓸 수 있도록 작고 가벼울 뿐만 아니라 배터리 충전으로 반나절 넘게 작동한다. 게다가 가격도 저렴하다. SNS를 타고 효과가 좋다는 입소문을 퍼지면서 판매량도 늘고 있다. 저주파 자극기는 전기근육자극(Electrical Muscle Stimu...
-
- 소리에는 소리로 맞선다, 액티브 노이즈 캔슬링
- 이어폰을 끼면 세상의 소음이 모두 멈추고 오직 음악과 나만 존재해 다른 세계가 되는 광고, 다들 본 적이 있을 것이다. 이는 주위의 소음을 차단한다는 이른바 ‘노이즈 캔슬링’ 효과를 강조한 것이다. 정말 노이즈 캔슬링은 세상을 고요하게 만들어 줄까? 그렇다면 그 원리는 무엇일까? 먼저 노이즈 캔슬링은 유명 회사에서 최근에 개발해 내놓은 혁신적인 기...
-
- [과학향기 Story] 소중한 데이터를 반영구적으로 저장할 수 있는 비결은?
- 과거 우리는 앨범과 비디오테이프, LP레코드 등에 데이터를 담았다. 하지만 디지털 시대로 넘어 가며 사진과 영상, 데이터 등을 저장하고 보관하는 방식도 많이 바뀌었다. 컴퓨터 하드디스크 가격이 내려가면서 수 테라 규모의 데이터를 집에서 저장할 수 있게 되었다. 스마트폰으로 찍은 사진과 영상을 클라우드 저장소에 올려 간편하고 안전하게 보관할 수 있다...
이 주제의 다른 글
- [과학향기 for Kids] 엄청난 속도와 성능으로 세상을 바꾸는 슈퍼컴퓨터!
- [과학향기 Story] 소중한 데이터를 반영구적으로 저장할 수 있는 비결은?
- [과학향기 for Kids] 탐정처럼 데이터의 비밀을 밝혀낸다! 데이터 과학자
- [과학향기 Story] 한국의 과학 기술 발전과 함께한 국가 슈퍼컴퓨터의 역사
- [과학향기 Story] 과거부터 현재, 미래를 향한 슈퍼컴퓨터의 진화
- [과학향기 for Kids] 과학 지식을 함께 나눠 더 큰 세상을 만든다? ‘오픈 사이언스’
- [과학향기 for Kids] 지금은 빅데이터 시대! 빅데이터란 무엇일까?
- [과학향기 Story] 내 인생은 어떻게 흘러갈까? AI가 점쳐준다
- 북한이 쏘아올린 작은 ‘만리경-1호’ 궤도 진입 성공, 성능과 목적은?
- 닷새 천하로 끝난 ChatGPT 아버지 샘 올트먼의 해고 사태, 그 이유와 의의는?
ScienceON 관련논문
인공지능[AI]에 이러한 비밀이 숨겨 있었군요. 간단히 볼 일은 아닌 것 같습니다. 좋은 지식 전하여 주셔서 감사합니다. 주님의 평화를 빕니다. 아멘.
2019-10-14
답글 0