데이터 과학자 책 소개
데이터 과학자는 빅데이터를 처음 접하는 사람들을 위한 입문서 입니다. 우연히 데이터라벨링을 교육하는 과정에 대한 홍보를 본 적이 있습니다. 데이터라벨링이 무엇인지 알아보니 AI가 쉽게 학습할 수 있도록 날 것의 데이터를 정리하는 1차 가공 작업을 뜻한다는 것을 알게 되었습니다. 처음에는 재택으로 할 수 있는 부업 정도였던 일이었는데 요즘에는 라벨링 기법이 다양해지고 이와 관련한 민간자격증도 있습니다. 데이터라벨링처럼 일반인도 데이터에 쉽게 접근하고 가공할 수 있습니다. 그만큼 데이터 활용 기술이 일반화되었다는 뜻일 수 있습니다. 그래서 데이터를 다루는 과학자에 대한 관심도 증가하고 있는 것 같습니다. 빅 데이터 과학자 첵은 데이터과학자가 되기 위하여 필요한 지식과 지식과 도구를 설명한 입문서라고 할 수 있습니다. 이미 컴퓨터공학이나 관련 업무 경험이 있는 사람들을 위한 전문서적이 아니기 떄문에 데이터에 관심이 있는 사람이라면 누구나 쉽게 읽을 수 있습니다. 특히 데이터과학자에 관심이 있는 아이가 어느 쪽을 공부해야 도움이 될 것인가를 고민하는 부모라면 더욱 유용한 책입니다. 빅 데이터 과학자의 종류와 어떠한 분야를 공부하면 좋은가에 대해서 나열을 해주고 있기 때문에 빅데이터라는 분야에서 내가 어떻게 경력을 쌓아갈 것인가에 대한 상상을 해볼 수 있습니다.
읽어보기를 추천하는 이유
빅데이터과학자에 대한 이야기만으로도 책 한 권이 나올 수 있다면 그 분야에 대한 전망은 밝다고 할 수 있습니다. 인공지능을 만들기 위한 전제 작업뿐 아니라 빅데이터라는 하나의 주제로도 살아남을 수 있는 영역이라는 생각이 들었습니다. 인공지능은 빅데이터를 어떻게 가공하느냐에 따라 달라집니다. 또한 데이터가 갖고 있는 신뢰도에 의해서도 인공지능의 질이 틀려집니다. 만약 생성형 인공지능으로 사업을 하고자 한다면 인공지능이 내놓는 결과물에 따라 소비자의 반응이 달라질 것입니다. 따라서 이 인공지능이 학습하는 것이 빅데이터 이므로 이를 다루는 분야에 종사한다는 것은 매우 매력적입니다. 당장 어디서부터 어떻게 시작해야 할지 모르는 사람에 도움이 되는 책이었습니다. 빅데이터라는 단어만 듣고 그 분야가 생소했던 사람이라도 이 책을 읽으면 기존 프로그래밍 언어를 공부하고 그 분야에 종사하는 사람이라면 자신의 노력에 따라 빅데이터 분야로 전업이 가능하다는 것을 알게 됩니다. 새로운 분야의 입문서로 추천하고 싶습니다.
빅 데이터의 특징
빅데이터(Big Data) 란 한 대의 컴퓨터가 다룰 수 없을 정도의 많은 자료를 뜻합니다. 모든 데이터를 빅데이터라고 부르는 것은 아닙니다. 빅데이터로 정의를 하기 위해서는 네 가지 특성을 만족해야 합니다. 데이터의 양이 아주 크고 이를 처리하는데 필요한 특별한 컴퓨팅 기법이 있습니다. 또한 데이터 라벨링할 때 사용하는 날 것의 데이터가 아니라 어느 정도 정리가 되어 있어야 합니다. 속도와 신뢰도에 대한 특성도 존재합니다. 이 네 가지 특성을 영어로 정리해서 4V라고 합니다. 모두 알파벳 브이(v)로 시작하기 때문에 4V 입니다. 첫 번째는 데이터의 양(Volume)으로 TB 에서ZB에 이르는 양으로 병렬처리 컴퓨팅 기법이 필요합니다. 두 번째는 다양성(Variety)입니다. 빅데이터는 전혀 구조화되어 있지 않거나 구조화가 약간만 된 데이터를 포함하고 있습니다. 세 번째는 속도(Velocity)로 늘 움직이고 그 속도도 빠릅니다. 마지막 특성은 신뢰도(Veracity)입니다. 데이터가 믿을만한 정보 인가 하는 것을 의미합니다. 이 네 가지 특성을 만족하는 데이터를 빅데이터라고 부릅니다. 빅데이터는 아무나 다룰 수 있는 것은 아닙니다. 목적에 따라 사용 방법이 다를 수 있지만 전문적 지식이 필요하며 분야에 따라서는 오랫동안 쌓은 경험도 필요합니다. 그래서 빅데이터를 다루는 사람을 우리는 빅데이터과학자라고 부릅니다.
관련 분야에서 일하려면
인공지능은 빅데이터를 바탕으로 스스로 학습하여 인간보다 뛰어난 지능을 갖게 되는 것으로 알려져 있습니다. 인공지능이 주목을 받으면서 인공지능이 학습하는 데 필요한 빅데이터도 많은 관심을 받고 있습니다. 빅데이터 과학자가 되고 싶은 학생이나 관련분야에 종사하고 있는데 빅데이터 쪽으로 이직을 검토하는 성인이라면 어떠한 분야의 공부가 필요할지 궁금할 것입니다. 빅데이터 과학자가 되려면 우선 프로그래밍 언어를 알고 있어야 합니다. Java 나 Pearl과 같은 객체지향 프로그래밍 언어를 능숙하게 구사할 줄 아는 사람이면 더 유리합니다. 현재는 기존 IT분야의 개발자가 전업을 하여 빅데이터 개발자로 활약하는 경우가 더 많습니다.
빅데이터 개발자로 경험이 쌓이면 더 넓은 분야로 영역을 넓힐 수 있습니다. 데이터 창작자가 데이터 사업가로 자신만의 사업을 할 수도 있습니다. 대학에서 오랫동안 빅데이터를 연구하는 교수와 같은 사람은 학문 분야 종사라고 말합니다. 빅데이터 분야는 새로운 분야이기는 하지만 직업이라는 관점에서 바라보자면 다른 학문 분야와 비슷한 양상을 띱니다. 관련 분야에 종사해 근로자, 사업가, 연구자, 창작자로 일하는 형태입니다. 만약 데이터 과학자를 목표로 공부하는 학생이라면 수학과 통계학, 그리고 프로그래밍 언어를 공부하는 것이 좋습니다. 빅데이터는 맵리듀스, 하둡분산파일시스템을 도구로 사용하는데 이를 이해하기 위해서 수학과 통계학, 프로그래밍 언어까지 섭렵하는 것이 좋다고 합니다. 작가는 경험을 쌓으려면 Kaggle이라는 데이터 과학 대회에 참가하거나 관련 회사의 인턴쉽을 활용할 것을 권고하고 있습니다. 점점 더 많은 스타트업이 탄생하고 있기 때문에 빅데이터를 공부해 둔 학생이라면 많은 일자리를 가질 기회가 있을 것입니다.
'도서리뷰' 카테고리의 다른 글
책 생초보도 TM영업으로 10억 버는 비법 작가 (1) | 2023.04.17 |
---|---|
책 지능의 역설 질문과 진화심리학, 불안함 (0) | 2023.04.14 |
책 이반 일리치의 죽음 줄거리, 인물, 느낀점 (2) | 2023.04.10 |
책 욕망의 진화 소개 및 남자와 여자 (0) | 2023.04.07 |
책 클루지 뇌에 대한 설명과 결정 (0) | 2023.03.28 |