본문 바로가기

데이터 과학 무엇을 하는가?

1. 책 제목: 데이터 과학 무엇을 하는가?

2. 지은이(저자): 김옥기

3. 읽은 기간: 2018년 8월 23일 ~ 2018년 9월 7일

4. 책의 주제와 내용:

  이 책은 데이터 과학에 대한 개괄적인 내용부터 저자가 데이터 처리 업계에 종사하며 경험한 데이터 분석 업무의 실무적인 내용과 업계 현황, 그리고 앞으로의 전망과 예측까지 해당 분야에 대해 폭넓게 다루고 있다. 저자는 데이터베이스 관리 기업인 엑시엄(Axiom)에 7년 가량 근무했던 사람이다. 엑시엄에는 9.11테러 당시 비행기 납치범 19명 중 11명의 신원을 빅데이터 기술로서 밝혀낸 업적이 있고, 미국 대선 기간에 후보자 선거 캠프에 상업용 개인정보를 기반으로 한 유권자 성향 데이터를 제공해 당선으로 이끄는 등의 협업을 진행하기도 했다.

  현업에 종사해 오고 있는 사람이 쓴 책이라 신뢰감 있게 읽을 수 있었고, 그럼에도 쉬운 설명을 하고 있어서 좋았다.

5. 나의 생각, 느낀점:

  서두에서 소개된 기업 엑시엄이 미국 시민 3억명을 포함한 전세계 수십억 명의 개인정보와 성향 분석 데이터 등을 가지고 있다는 내용에서부터 개인정보 침해 및 보호의 영역과 충돌하는 문제가 염려됐었다. 책을 읽다 보니 해당 부분에 대한 내용이 있었다. 9.11테러의 테러범들을 찾아낸 사건 이후로 일반인들에게 기업의 이름이 알려지자 개인정보 보호 측면에 대한 문제제기가 있었고, 따라서 엑시엄은 자신들의 데이터베이스 정보를 개방하여 누구나 자신의 정보를 찾아 수정 혹은 삭제를 요청할 수 있게 했다는 것이다.

  각종 기업들이 실무에서 데이터 분석을 어떻게 활용하고 있는지에 대한 내용에서 넷플릭스의 활용사례가 눈에 띄었다. 나도 종종 친구들의 계정을 빌려 이용할 때가 있는데, 평소 궁금했던 시청 기록 기반의 콘텐츠 추천 알고리즘의 내용을 알게 되어 흥미로웠었다.

6. 인상적인 글귀: 

  데이터의 크기가 커진다고 해서 데이터의 가치도 비례해서 커지는 것은 아니다. 작은 데이터라도 꼭 필요한 고급 정보를 갖고 있다면, 쓸모없는 빅데이터보다 훨씬 더 가치 있다. 양만 많은 빅데이터(big data)보다 품질 좋은 데이터(good data)가 낫다는 얘기다. 잘 가공되고 필요한 내용을 첨가해서 정제한 좋은 데이터를 분석해서 추출한 데이터가 똑똑하고 영리한 데이터인 것이다. 그리고 큰 데이터든 오염된 데이터든 복잡한 데이터든 제대로 가공해서 쓸모 있는 인사이트를 뽑아내는 인재가 유능한 데이터 과학자이다.
  데이터 과학자를 희망한다면, 단기 특별 교육 과정을 듣는 것보다는 기존의 통계학과컴퓨터공학과, 수학과, 수리경제학과 등에서 가르치는 다양한 교과를 대학에서 배우고 빅데이터 시대에 필요하다고 생각되는 과목을 대학원 과정에서 보충하는 것이 더 낫다고 생각한다. 가장 중요한 것은 분야별 현업 경험이다. 실제 문제 해결 과정에서는 분석 이론과 복잡한 데이터 기술을 사용해 해결하는 일보다 현장에서 익힌 실전 지식으로 해결하는 것들이 더 많다.
  간혹 분석 도구만 잘 사용해도 데이터 과학자라고 생각하는 사람들이 있는데, 그런 사람은 데이터 과학자가 아니라 프로그래머(Programmer)이다. 예를 들면 R 또는 SAS 프로그래머인 것이다. 이들은 분석 도구를 이용해 데이터에서 원하는 결과를 뽑아주기만 하면 된다. 데이터 과학자는 분석 도구를 잘 다루어야 하는 것은 필수이고 기업이나 조직의 데이터 활용 조건에 맞춰 분석 도구를 선별할 수 있는 경험적 지식도 가지고 있어야 한다.
  한국 기업과 미국 기업은 조직 문화와 일하는 방식이 많이 다르다. 대부분 미국 기업들은 사람 중심이 아닌 일 중심의 운영 프로세스로 굴러간다. 사람 중심의 조직에서는 의사 결정을 개인의 경험에 의존해 직관적으로 하는 경우가 많지만, 일 중심 조직은 프로세스와 프로세스 관리 위주로 의사를 결정하므로 담당 책임자가 바뀌어도 영향을 덜 받는다.

 

 

'' 카테고리의 다른 글

생각을 압축한 딱 한 줄  (0) 2019.01.05
인류의 가장 위대한 모험 아폴로 8  (0) 2019.01.05
미래를 사는 도시, 선전  (0) 2019.01.05
블록체인 무엇인가?  (0) 2019.01.05
리콴유의 눈으로 본 세계  (0) 2019.01.05