다른 빅데이터 도서와의 차별점은 다음과 같습니다.
R관련 데이터 처리, 마이닝, 시뮬레이션, 최적화에 이르는 빅데이터 분석 대부분이 포함되어 있습니다. 빅데이터 분야에 대해 유일하게 Simulation, Optimization가 제시되어 있습니다. R 관련 새로운 package가 소개되어 있습니다. R sample script가 아닌 실제 사용가능한 script를 활용 가능합니다. 다양한 분야에 대한 활용 예시가 포함되어 있습니다. 저자의 기존 도서와 함께 보면 단기간에 다양한 시각 및 비즈니스적인 분석 관점 획득이 가능합니다. 후속 시리즈를 통한 지속적인 학습이 가능합니다.
최근 서점에 가보면 빅데이터의 붐을 느낄 수 있다. 통계에서부터 시작해 분석 툴인 R, SAS, SPSS, 그리고 Python. 빅데이터 기술서도 많고, 빅데이터 관련 인문 서적도 많다. 그 중에서 데이터 마이닝 책도 꽤 된다. 그런데 이 중에서 데이터 사이언티스트가 되려면 어떤 책을 봐야 할까?
이 책이 위의 의문사항에 해답을 제시한다고 감히 말하고 싶다. 본서는 실전을 접해보고 싶은 독자들에게 비즈니스 관점의 시각으로 분석을 경험할 수 있는 기회를 제공한다. 여기에 쓰인 데이터는 저자가 프로젝트로 실제 작업했고, 교육과정에서 워크샵을 통해 4~32시간의 과정을 거쳐 검증된 사례들이다.
본서에서는 빅데이터 이용 목적과 접근방법, 데이터 획득 및 가공, 모델링 및 검증, 결과물에 대한 커뮤니케이션을 하나하나 설명하며 제시 한다. 분량이 많기 때문에 단기간 집중적으로 따라해 보는 게 필요하다. 그리고 본서 이후에 나올 흥미로운 주제들이 계속 나올 것이므로 1달 안에 마스터 한다고 해보기를 권유한다. 빅데이터 시대의 경쟁력은 속도와 창의력이다.
전체적으로 새로운 패키지들로 작성을 했고, 특히 Visualization, Financial Analysis, Social Network Analysis, Simulation에 관한 내용을 많이 수록했다. 금융분석은 환율 및 KOSPI200 예측에도 일부 사용되었고, 소셜 네트워크 분석은 이전에는 간단한 그래프 표현을 통한 인사이트에 주력했다면 이번에는 구체적인 통계량을 갖고 해설할 수 있는 수준으로 제시했으며, 시뮬레이션은 개념 수준에서 구체적인 모델링을 할 패키지와 함께 예제를 제시했다.
요즘 스마트폰 앱을 이용해 데이터를 모으고 분석하여 사용자에게 무언가를 제안하는 것이 가장 hot하다. 이러한 분석은 데이터 마이닝의 다양한 유형과 알고리즘을 통해 패턴을 찾고 이를 응용한 것이다. 지금까지 이론적으로만 공부해 왔다면 이 책에 수록된 예제들을 익히고 분석으로 접근해 실력 있는 데이터 사이언티스트에 한 발 더 다가서게 될 것이다.
■ 저자 소개
김 경 태
⦁The ECG 대표
⦁한국데이터베이스진흥원 빅데이터 아카데미 분석전문가 과정 강사
⦁주요 분야 : CRM, Data Mining, Big Data AnalyticsInline
⦁前 한양대학교 산업공학과 겸임교수
⦁前 Ernst & Young Business Advisory Service Director
⦁前 Accenture Manager
⦁前 Oracle DW/DBM Principal Consultant
⦁30여개 다국적 기업 및 대기업 CRM, 전략, Big Data 분석프로젝트 수행
안 정 국
⦁前 The ECG 상무
⦁한국데이터베이스진흥원 빅데이터 아카데미 분석전문가 과정 멘토
⦁前 삼성SDS
⦁前 삼일회계법인
⦁前 두산정보통신
⦁한국공인회계사/세무사, 컨설턴트, CISA, CFE
⦁데이터분석/기획/재무/IT 부문의 다양한 경험
⦁금융, 제조업, 통신업, 공기업 컨설팅 다수 경험
김 동 현
⦁한국정보기술단 수석 : 공공, 금융기관 정보시스템감리
⦁前 한신정평가 근무
⦁前 한국신용정보 근무
⦁전사DBA
⦁개인신용평가, 기업재무분석, 상장기업분석시스템, 기업신용평가시스템 등 구축
⦁수협중앙회 RMS구축 프로젝트
⦁한국데이터베이스진흥원 빅데이터 아카데미 1기 수료
(최우수 프로젝트 : 소셜분석을 통한 주가변동 예측)
⦁보유자격 : 정보관리기술사, 정보시스템감리 수석감리원
⦁저서 : 임베스트 CISA(공저)
BIGDATA,텍스트마이닝,경영과학,경영정보,상장폐지,질병예측,imageProcessing,모델링,시뮬레이션,최적화,D3Network,데이터베이스론,데이터마이닝,비정형데이터마이닝,인사이트,데이터분석,데이터분석기획,전략인사이트도출,빅데이터처리기술,비즈니스모델,빅데이터활용,처리기술,시각화,직무분석,simulation,optimization,d3network,통계분석,마이닝