메뉴 바로가기 검색 및 카테고리 바로가기 본문 바로가기

한빛출판네트워크

한빛랩스 - 지식에 가능성을 머지하다 / 강의 콘텐츠 무료로 수강하시고 피드백을 남겨주세요. ▶︎

비즈니스를 위한 데이터 과학 : 빅데이터를 바라보는 데이터 마이닝과 분석적 사고

한빛미디어

번역서

절판

  • 저자 : 포스터 프로보스트 , 톰 포셋
  • 번역 : 강권학
  • 출간 : 2014-06-24
  • 페이지 : 420 쪽
  • ISBN : 9788968481093
  • 물류코드 :2109
  • 초급 초중급 중급 중고급 고급
3.8점 (4명)
좋아요 : 55

왜 이 책을 읽어야 할까?

데이터 과학을 직접 응용할 일이 없더라도 데이터 과학을 이해하는 일은 매우 중요하다. 데이터 분석적 사고 방식에 익숙해지면 데이터 마이닝 프로젝트를 평가하는 데 도움이 된다. 예를 들어 어떤 컨설턴트나 잠재적인 투자자가 데이터에서 지식을 추출하는 업무를 개선하고자 제안할 경우, 제안서를 체계적으로 평가함으로써 제안이 과연 타당한지, 아니면 문제가 있는지를 판단할 수 있다. 그렇다고 해서 프로젝트가 성공한다고는 확신할 수 없지만(데이터 마이닝 프로젝트는 실제로 시도해봐야 결과를 알 수 있는 경우가 많다) 적어도 제안서에 있는 결함이나 비현실적 가정, 빠진(놓치는) 부분은 알아낼 수 있다.


데이터 과학에 대한 이 책의 개념적 접근 방법

이 책에서는 데이터 과학에서 가장 중요한 기본 개념을 설명한다. 이 개념의 일부는 각 장의 '제목'이 되기도 하고 다른 일부는 설명을 통해 자연스럽게 소개된다(설명에 들어 있는 개념은 기본 개념이라고 표시되어 있지 않다). 이 개념들은 문제에 대한 계획을 세우는 일부터 데이터 과학 기법을 적용하고 더 나은 의사 결정을 하기 위해 결과를 배치하는 과정까지 폭 넓게 적용될 뿐만 아니라 다양한 비즈니스 분석 방법론 및 기법의 기반이 되기도 한다.


대상 독자

- 데이터 과학자와 함께 일을 하거나 데이터 과학 중심의 프로젝트를 관리하는 사람들
- 데이터 과학 벤처 기업에 투자하려는 기업가
- 데이터 과학 프로젝트를 구현하려는 개발자
- 데이터 과학자를 지망하는 사람


이 책으로 가르치는 분들께

"이 책은 매우 다양한 데이터 과학 과정 교재로 훌륭히 사용되어 왔습니다. 초기에 이 책은 포스터 교수가 2005년 가을 뉴욕대 스턴 스쿨에서 여러 과의 주제를 종합해 가르치기 위해 만든 교재에서 시작되었습니다*. 원래 강의는 MBA와 MSIS 학생을 대상으로 했지만, 대학의 다른 학과의 학생들이 많이 몰려와 원래 이 강의 대상이었던 MBA 및 MSIS 학생들뿐만 아니라 기계 학습 등에서 든든한 기반이 있는 학생들에게도 특히 유용했다는 점이 이채롭습니다. 아마도 그들의 교과 과정에서는 알고리즘 이외에 근본적인 원리에 대해 주목하지 않았기 때문일 것 같습니다.
뉴욕대에서는 현재 이 책을 데이터 과학에 관련된 다양한 강의에서 교재로 사용하고 있습니다. 원래의 MBA 및 MSIS 과정은 물론이고, 학부 비즈니스 분석학, 뉴욕대 스턴 스쿨의 비즈니스 분석학 석사 과정, 뉴욕대에 신설된 데이터 과학 석사과정을 위한 데이터 과학 입문 교재로 사용되고 있습니다. 게다가 이 책이 출판되기도 전에 이미 7개국 10여 개 대학의 경영대, 컴퓨터 과학과 및 데이터 과학에 대한 입문 일반 과정에서 이 책을 교재로 채택해 사용해 왔습니다."

포스터 프로보스트 저자

포스터 프로보스트

뉴욕대 스턴 비즈니스 스쿨의 NEC 교수로서 비즈니스 분석학, 데이터 과학, MBA 프로그램을 강의하고 있으며, 다양한 수상 경력에 빛나는 연구 업적은 여러 곳에서 인용되고 있다. 뉴욕대에 오기 전에는 버라이즌에서 데이터 과학 연구원으로 근무했으며, 지난 10여 년간 여러 성공적인 데이터 과학 전문 기업들을 공동 설립했다.

톰 포셋 저자

톰 포셋

기계 학습으로 박사 학위를 받았으며 GTE, NYNEX/Verizon, HP 등 기업의 연구소에서 근무해왔다. 포셋 박사는 데이터 마이닝 결과 평가 등의 데이터 과학 기법, 사기 사건 탐지 및 스팸 필터링 등 데이터 과학 응용에 대한 논문들을 발표했으며, 이 논문들은 데이터 과학 분야의 필수 논문이 되었다.

강권학 역자

강권학

중앙대학교 컴퓨터공학과에서 학사와 석사학위를 받았다. 국방과학연구소, 퓨쳐시스템, 안철수연구소에서 13년간 개발자, 보안전문가, 프로젝트 관리자로 근무하였으며, 2009년 4월 호주 멜번에 iGonagi Pty. Ltd.를 설립하고 아이폰 애플리케이션을 개발하고 있다. 『Head First iPhone Development』, 『Head First Programming』, 『iPhone Programming 제대로 배우기』, 『iPhone 3D Programming: using OpenGL ES』(이상 한빛미디어)를 번역했다.

1장. 개요 : 데이터 분석적 사고 방식
    1.1 데이터가 제공하는 무한한 기회 
    1.2 예 : 허리케인 프란시스 
    1.3 예제 : 고객 이탈 예측 
    1.4 데이터 과학, 데이터 공학, 데이터 주도 의사 결정 
    1.5 데이터 처리와 '빅 데이터' 
    1.6 빅 데이터 1.0에서 빅 데이터 2.0으로 
    1.7 전략적 자산으로서의 데이터 및 데이터 과학 능력 
    1.8 데이터 분석적 사고 
    1.9 이 책에 대하여 
    1.10 다시 보는 데이터 마이닝과 데이터 과학 
    1.11 데이터 과학과 데이터 과학자의 일은 화학과 시험관의 관계 
    1.12 요약 


2장. 비즈니스 문제와 데이터 과학 해결책
    2.1 비즈니스 문제에서 시작해 데이터 마이닝 작업으로 
    2.2 감독 방법과 자율 방법 
    2.3 데이터 마이닝과 그 결과 
    2.4 데이터 마이닝 프로세스 
    2.5 데이터 과학팀을 관리한다는 것은? 
    2.6 그 외 분석 기법 및 기술 
    2.7 요약 


3장. 예측 모델링 개요 : 연관성에서 감독 세분화까지
    3.1 모델, 유도, 예측 
    3.2 감독 세분화 
    3.3 세분화 과정의 시각화 
    3.4 규칙 집합으로서의 트리 
    3.5 확률 추정 
    3.6 사례 : 트리 유도로 고객 이탈 문제 해결하기 
    3.7 요약 


4장. 데이터에 대한 모델 적합화
    4.1 수학 함수를 통한 분류 
    4.2 수학 함수를 이용한 회귀 분석 
    4.3 계층 확률 추정과 로지스틱 회귀 분석 
    4.4 사례 : 로지스틱 회귀 분석과 트리 유도 비교 
    4.5 비선형 함수, 지원 벡터 기계, 신경망 
    4.6 요약 


5장. 과적합화 문제 해결
    5.1 일반화 
    5.2 과적합화 
    5.3 과적합화 검사 
    5.4 사례 : 선형 함수 과적합화 
    5.5 * 사례 : 왜 과적합화가 문제인가? 
    5.6 예비 데이터 평가에서 교차 검증까지 
    5.7 다시 모델링한 고객 이탈 문제 
    5.8 학습 곡선 
    5.9 과적합화 회피와 복잡도 제어 
    5.10 요약 


6장. 유사도, 이웃, 군집
    6.1 유사도와 거리 
    6.2 최근접 이웃 추론 
    6.3 유사도 및 이웃에 관한 주요 세부 사항 
    6.4 군집화 
    6.5 비즈니스 문제 해결과 데이터 탐사 문제 
    6.6 요약 


7장. 결정 분석적 사고 1 : 좋은 모델은?
    7.1 분류자 평가 
    7.2 모델 평가에 대한 일반적인 원리 
    7.3 핵심 분석 프레임워크 : 기댓값 
    7.4 평가, 기준선 성능, 데이터 투자의 영향 
    7.5 요약 


8장. 모델 성능 시각화
    8.1 분류 대신 서열화하기 
    8.2 수익 곡선 
    8.3 ROC 그래프와 곡선 
    8.4 ROC 곡선 하위 영역(AUC) 
    8.5 누적 응답 곡선과 향상도 곡선 
    8.6 예제 : 고객 이탈 모델링에 대한 성능 분석 
    8.7 요약 


9장. 증거와 확률
    9.1 예제 : 온라인 고객 광고 타겟팅 
    9.2 증거의 통계적 조합 
    9.3 데이터 과학에 베이즈 규칙 응용 
    9.4 증거 '향상도' 모델 
    9.5 예제 : 페이스북 '좋아요'의 증거 향상도 
    9.6 요약 


10장. 텍스트 표현 및 마이닝
    10.1 텍스트가 중요한 이유 
    10.2 텍스트가 어려운 이유 
    10.3 텍스트 표현법 
    10.4 예제 : 재즈 음악가 
    10.5 * IDF와 엔트로피의 관계 
    10.6 단어 주머니보다 복잡한 표현들 
    10.7 예제 : 주가 변동을 예측하기 위한 뉴스 기사 마이닝 
    10.8 요약 


11장. 결정 분석적 사고 2 : 분석 공학
    11.1 자선 단체 후원할 가능성이 높은 후원자 타겟팅 
    11.2 훨씬 더 복잡한 고객 이탈 문제 
    11.3 요약 


12장. 기타 데이터 과학 작업과 기법
    12.1 동시 발생과 연관성의 발견 
    12.2 프로파일링 : 전형적인 행동의 발견 
    12.3 연결 예측과 친구 추천 
    12.4 데이터 축소, 잠재 정보, 영화 추천 
    12.5 편중, 편차, 조합 기법 
    12.6 데이터 주도 인과 관계 설명과 바이럴 마케팅 예제 
    12.7 요약 


13장. 데이터 과학과 비즈니스 전략
    13.1 돌아온 데이터 분석적 사고 
    13.2 데이터 과학으로 경쟁 우위 획득 
    13.3 데이터 과학으로 경쟁 우위 유지 
    13.4 데이터 과학자 및 팀의 영입과 육성 
    13.5 데이터 과학 사례 연구 조사 
    13.6 모든 창조적인 아이디어의 수용 
    13.7 데이터 과학 프로젝트 제안서 평가 
    13.8 기업의 데이터 과학 성숙도 


14장. 결론
    14.1 데이터 과학의 기본 개념 
    14.2 데이터가 할 수 없는 일 : 사람이 중심에 
    14.3 개인 정보 보호, 윤리, 데이터 마이닝 
    14.4 데이터 과학에 대한 남은 이야기 
    14.5 마지막 사례 : 크라우드 소싱에서 클라우드 소싱으로 
    14.6 책을 마치며 


부록 A.1 제안서 검토 가이드
부록 A.2 또 다른 제안서 예제
부록 A.3 용어 정리

[빅데이터?? 사물인터넷?? 과연...]

요즘 IoT 사물인터넷으로부터 많은 양의 데이터들이 주는 많은 정보력과 분석의 필요성에 대해 많은 이야기가 대두되고 있다. 특히 이런 데이터들의 양은 빅데이터라 불릴만큼 많아질 것이며, 그만큼 빅데이터를 분석하고 분석할 환경을 만들 인재에 대해서 정부와 학계에서 발벗고 나서서 많은 지원사업을 벌이고 있다. 과연 많은 양의 데이터로부터 정말 의미있는 정보를 얻을 수 있을까??..
누구나 빅데이터 분석에 대한 이야기를 처음 접한 사람이라면 한번쯤은 생각해볼 의문일 것이다.
빅데이터... 필자의 생각에는 충분히 이 빅데이터로부터 의미있는 정보를 얻을수 있다. 단, 그만큼의 분석력과 분석 계획 및 목표가 명확하다면 말이다..


[비즈니스를 위한 데이터 과학]
필자가 맨 처음 이 책을 펼쳐 목차를 보고 사실 좀 아쉬운 감이 있었다. 바로 챕터간 연관성이 부족하다고 생각했기 때문이다. 사실 공부를 하는 학생의 입장에서 보면 각 챕터의 연관성은 곧 공부의 흐름이기 때문에 중요하다고 생각한다. 이 목차가 각각의 연관성을 가지고 잘 배치가 되어있다면 학생의 이해도는 높아져 정보의 흡수력이 높아질 것이다. 하지만 반대로 목차의 배치가 연관성이 부족하게 배치가 되어있다면 이대로 공부했던 학생의 이해도는 떨어져 여러번 책을 읽어봐야 할꺼 같다는 생각이 든다. 물론 책이 전체적으로 이상하다 그런게 아니라 각 목차들이 연관성이 조금 떨어지게 배치되었다는 것이다. 즉, 이 책은 초보자들에게는 약간 어려울 수 있다고생각한다.

물론 내용은 아주아주 명쾌하고 하나하나 단어들의 설명이 자세해서 좋다. 내용면으로 봐서는 너무나 이책은 자세하다. 용어 하나하나에 대한 정의와 설명이 세세하게 잘 되어있다. 마치 용어사전을 보는 것 같이 정의와 쓰임세들이 잘 나와있다.

이 책에서 아쉬운 점이 하나 더 있다. 처음부터 끝까지 약간 딱딱한 느낌이 든다. 많은 수식과 모델링 개념들 그리고 다양한 유사도 비교를 포함한 알고리즘들에 대해선 설명이 잘 되어있다. 하지만 이런 개념들로만 끝나있다. 실제 약간의 소스들을 이용한 구현부분이나 활용된 사례들이 좀 들어가 있다면 보기 좋지 않을까라는 생각이 든다.

아!! 그리고 처음부터 끝까지 흑백이다. 조금 컬러풀하게 나와도 되는 부분에서도 흑백이라서 눈은 즐겁지 못하다.
하지만 이 책은 데이터 분석 개념서로써 많은 마이닝 알고리즘들에 대해서 다루지는 못했지만 각각의 기본 개념 설명은 아주 충실하다. 표과 설명을 위한 그림도 충실히 들어가 있기 때문에 어느정도 데이터 분석에 대한 기본 개념이 있는 사람이라면 한번쯤 읽어봐도 좋을꺼 같다.


[서평을 마치고..]
위에서 언급했던 이 책의 장점과 단점을 나열하자면 아래와 같다.

[장점]
- 용어 하나하나에 대한 정의와 설명이 세세하게 잘 되어있다. 마치 용어사전을 보는 것 같이 정의와 쓰임세들이 잘 나와있다.

- 데이터 분석 개념서로써 많은 마이닝 알고리즘들에 대해서 다루지는 못했지만 각각의 기본 개념 설명은 아주 충실하다.

- 표과 설명을 위한 그림도 충실히 들어가 있기 때문에 어느정도 데이터 분석에 대한 기본 개념이 있는 사람이라면 한번쯤 읽어봐도 좋을꺼 같다.


[단점]
- 각 목차들이 연관성이 조금 떨어지게 배치되어 데이터 분석을 처음 접하는 사람에게는 전체적으로 이해가 어려울 수 있다.

- 조금 컬러풀하게 나와도 되는 부분에서도 흑백이라서 눈은 즐겁지 못하다. 게다가 수식이 많아서 그런지 조금 지루하고 딱딱하게 느낄수 있다.

이로써 이책의 리뷰를 마치고자 한다. 이책은 막 데이터 분석 공부에 빠진 사람들에게 이 책은 자신의 지식을 좀더 촘촘히 다듬어서 빈틈이 없게 만들어줄 마감재 역할을 해줄 것이라 생각한다.

이 책을 고른 결정적인 이유는


학과 수업으로 데이터 마이닝 등 관련 분야를 접한 적이 있지만, 설명을 해보라면 벙어리가 되어 버린다.
그런데 이 책은 말한다 "오늘날 사용되는 여러 데이터 마이닝 기법을 쉽게 이해할 수 있을 겁니다" 라고..



그래서 책장을 펼치게 되었다.

목차에서부터 알 수 있지만 개념부터 차근차근 나아가는 느낌이다.



수업때 배웠던 용어도 보이고 읽는 재미는 있었지만.. 내공이 부족한 나에겐 쉽지 않은 책이었다. 슬퍼3

그래서 점점 읽는 속도가 떨어지면서 꾹꾹 눌러 읽기보다는 방법을 바꿔 사례 중심으로 읽게 되었다.




그래서 데이터 과학이란? 데이터로부터 지식을 뽑아내는 방법을 알려주는 근본적인 원리로, 데이터 마이닝은 이 원리에 따르는 기술을 이용해 데이터에서 지식을 뽑아내는 기법을 말한다. 즉, 데이터 과학은 현상을 이해하는 원리와 절차, 기법을 통해 더 나은 의사 결정을 할 수 있도록 하는데 목적을 둔다.

그리고 데이터 과학은 누구나 쉽게 알 수 있는 구조화된 프로세스에 따라 데이터 마이닝을 할 수 있게 하는데 집중한다.

데이터 마이닝 알고리즘에는 1. 분류와 계층 확률 추정 2. 회귀 분석(가치 추정) 3. 유사도 매칭 4. 군집합 5. 동시 발생 그룹화 6. 프로파일링 7. 연결 예측 8. 데이터 축소 9. 인과 모델링 등이 존재한다. 이들의 차이를 통해 효율적인 알고리즘을 사용하는 것이다.





장점!!
★ 챕터마다 마무리할 때 요약을 해주는 공간은 나에게 단비같은 페이지였다!!

단점!!
☆ 저자가 절적하게 말하려는 핵심 위주로 말하기 때문에 관련 용어 등 모든 것을 한번에 말할 수 없다는 것은 이해한다. 하지만 너무 빈번하게 ex. 이 내용은 챕터 -에서 자세하게 설명하겠다 와 같은 말이 나온다. 그로인해 맥이 끊기는 느낌이 들기도 한다...



책을 덮으면서 "좀 더 배우고 다시 읽어야 겠다" 란 목표가 생겼다. 열공

책평가에서 별 하나 준 이유는 단지 참고문헌이 없기 때문입니다.
책 자체는 추천할만합니다.
왜 참고문헌 목록을 뺐는지 알 수가 없네요.

비즈니스 관점에서 바라본 데이터 과학에 대한 교과서로 데이터에 관심(빅데이터)이 많은 분들이 읽기를 권합니다.

데이터에서 지식과 가치를 뽑아내는데 필요한 지식(데이터 과학의 근본 원리와 데이터 분석적 사고 방식)을 얻을 수 있으며, 비즈니스 문제를 해결하는데 필요한 프로세스와 전략의 토대를 데이터 마이닝 기법을 통해 해결

결제하기
• 문화비 소득공제 가능
• 배송료 : 2,000원배송료란?

배송료 안내

  • 20,000원 이상 구매시 도서 배송 무료
  • 브론즈, 실버, 골드회원 무료배송
닫기

리뷰쓰기

닫기
* 상품명 :
비즈니스를 위한 데이터 과학 : 빅데이터를 바라보는 데이터 마이닝과 분석적 사고
* 제목 :
* 별점평가
* 내용 :

* 리뷰 작성시 유의사항

글이나 이미지/사진 저작권 등 다른 사람의 권리를 침해하거나 명예를 훼손하는 게시물은 이용약관 및 관련법률에 의해 제재를 받을 수 있습니다.

1. 특히 뉴스/언론사 기사를 전문 또는 부분적으로 '허락없이' 갖고 와서는 안됩니다 (출처를 밝히는 경우에도 안됨).
2. 저작권자의 허락을 받지 않은 콘텐츠의 무단 사용은 저작권자의 권리를 침해하는 행위로, 이에 대한 법적 책임을 지게 될 수 있습니다.

오탈자 등록

닫기
* 도서명 :
비즈니스를 위한 데이터 과학 : 빅데이터를 바라보는 데이터 마이닝과 분석적 사고
* 구분 :
* 상품 버전
종이책 PDF ePub
* 페이지 :
* 위치정보 :
* 내용 :

도서 인증

닫기
도서명*
비즈니스를 위한 데이터 과학 : 빅데이터를 바라보는 데이터 마이닝과 분석적 사고
구입처*
구입일*
부가기호*
부가기호 안내

* 온라인 또는 오프라인 서점에서 구입한 도서를 인증하면 마일리지 500점을 드립니다.

* 도서인증은 일 3권, 월 10권, 년 50권으로 제한되며 절판도서, eBook 등 일부 도서는 인증이 제한됩니다.

* 구입하지 않고, 허위로 도서 인증을 한 것으로 판단되면 웹사이트 이용이 제한될 수 있습니다.

닫기

해당 상품을 장바구니에 담았습니다.이미 장바구니에 추가된 상품입니다.
장바구니로 이동하시겠습니까?

자료실

최근 본 상품1