경험 또는 직관만으로 의사결정자나 이해관계자를 설득할 확률은 0%에 가깝다. 상사나 고객을 설득하려면 데이터에 기반하여 소통해야 한다. 이 책은 데이터 분석을 실무적으로 다루며 방대한 데이터 속에서 핵심 인사이트를 찾아내 그 결과를 명확하게 전달하는 방법을 안내한다. 또한 데이터 분석 결과를 비즈니스에 성공적으로 적용한 여섯 가지 사례를 통해, 분석 목표 파악부터 데이터 유형에 따른 적절한 분석 기법 선택, 분석 결과를 바탕으로 의사결정자를 설득하는 실무 과정까지 익힐 수 있다. 데이터 기반의 의사결정 절차를 살펴보면서 데이터를 효율적으로 분석하고, 그 결과를 근거로 원활히 소통하는 전문 역량을 키워보자.
저자소개
저자
이상석
어린 시절부터 사람에게 관심이 많던 저자는 자연스럽게 HR 분석가로 성장했다. 하지만 직관과 감, 경험으로 무장한 경영진을 설득하는 데 한계를 느꼈고 이 벽을 넘기 위해 미국 듀크 대학교 데이터 사이언스 석사 과정을 졸업했다. 그리고 데이터 과학자로서 공공기관에서는 최초로 HR 애널리틱스 분야에 뛰어들었다. 입사부터 퇴직까지의 HR 데이터를 데이터 레이크에 담아 채용, 승진, 이동, 평가 등을 종합적으로 분석하여 데이터 기반 HR 정책 효과성 측정 및 개선에 활용하고 있다. 또한 HR과 데이터 사이언스를 융합한 분야를 연구하며 기업의 HR 애널리틱스 도입 관련 자문 및 강사로도 활동 중이다. 감정 분류 모델, 인재 추천 시스템, HR 면접관 추천 시스템 등을 개발하여 특허를 출원했고 London Text Analytics, AI Summit Seoul, HR AI Forum 등의 콘퍼런스에서 발표하기도 했다. 그간 데이터에 기반한 의사소통과 보고를 하며 느낀 데이터의 힘을 나누고자 이 책을 썼다.
목차
| 1장 | 데이터 드리븐 보고
1.1 일상의 보고 상황
1.2 데이터 드리븐 의사결정이란
_1.2.1 일상부터 비즈니스 의사결정까지
_1.2.2 데이터 드리븐 흐름
_1.2.3 데이터 드리븐 효과
1.3 데이터 드리븐 보고란
_1.3.1 데이터 드리븐 보고에 관한 오해들
_1.3.2 데이터 드리븐 보고의 여섯 가지 유형
_1.3.3 데이터 드리븐 보고가 나와 무슨 관계가 있을까?
1.4 데이터 드리븐 보고 5원칙
_1.4.1 설명 가능해야 한다
_1.4.2 데이터 드리븐 보고는 중립적이지 않다
_1.4.3 문제를 정의할 수 있어야 한다
_1.4.4 MVP부터 시작하라
_1.4.5 추론과 예측을 구분하라
| 2장 | 데이터 드리븐 보고 절차
2.1 데이터 드리븐 보고 전략
2.2 분석 전 알아야 하는 용어
_2.2.1 독립변수와 종속변수
_2.2.2 테이블, 행과 열
_2.2.3 데이터 분리
_2.2.4 모델링
2.3 분석 목표 설정
_2.3.1 분석 목표(가설)를 확실하게 정의하라
_2.3.2 의사결정자에게 최대한 많이 질문하라
2.4 계획서 작성
_2.4.1 분석 계획서의 필수 요소
2.5 데이터 선정
_2.5.1 데이터 수집
_2.5.2 EDA & 데이터 정제
2.6 분석 방법 결정 및 해석/검증
_2.6.1 기본 통계
_2.6.2 가설검정
_2.6.3 선형회귀분석
_2.6.4 분류예측모델
2.7 보고 대상자에 따른 보고 방식
_2.7.1 실무자용 보고
_2.7.2 의사결정자용 보고
| 3장 | 데이터 드리븐 보고 실전 사례 with 챗GPT
3.1 데이터와 친해지자: EDA & 기술통계
[사례] 행복에 영향을 미치는 변수와 국가별 행복지수 분석하기
_3.1.1 상황
_3.1.2 분석 목표 파악하기
_3.1.3 분석 계획 세우기
_3.1.4 데이터 선정하기
_3.1.5 EDA 수행하기
_3.1.6 해석하기
_3.1.7 보고하기
_3.1.8 챗GPT 활용하여 EDA 수행하기
3.2 데이터도 백문이 불여일견: 데이터 시각화
[사례] 회사의 중장기 인력구조 예측, 분석, 시각화하기
_3.2.1 상황
_3.2.2 분석 목표 파악하기
_3.2.3 분석 계획 세우기
_3.2.4 데이터 선정하기
_3.2.5 EDA 수행하기
_3.2.6 분석 및 예측 방법 결정하기
_3.2.7 시각화하기
_3.2.8 해석하기
_3.2.9 보고하기
_3.2.10 챗GPT 활용하여 시각화하기
3.3 당신의 질문에 데이터가 답한다: 가설검정
[사례] 마케팅 효과 분석 및 최적의 광고 플랫폼 찾기
_3.3.1 상황
_3.3.2 분석 목표 파악하기
_3.3.3 데이터 선정하기
_3.3.4 분석 방법 결정하기
_3.3.5 해석하기
_3.3.6 보고하기
_3.3.7 챗GPT 활용하여 가설검정하기
3.4 데이터에 맞는 직선을 찾아라: 선형회귀분석
[사례] 유학 컨설팅을 위한 해외 대학 합격률 분석하기
_3.4.1 상황
_3.4.2 분석 목표 파악하기
_3.4.3 분석 계획서 작성하기
_3.4.4 데이터 선정하기
_3.4.5 EDA 수행하기
_3.4.6 분석하기
_3.4.7 해석하기
_3.4.8 컨설팅하기
_3.4.9 챗GPT 활용하여 회귀분석하기
3.5 합격이냐 불합격이냐: 분류예측
[사례] 당뇨병 예측모델 수립 및 사전 예방 솔루션 제공하기
_3.5.1 상황
_3.5.2 분석 목표 파악하기
_3.5.3 분석 계획서 작성하기
_3.5.4 데이터 확인하기
_3.5.5 EDA 수행하기
_3.5.6 분석하기
_3.5.7 해석하기
_3.5.8 솔루션 제공하기
_3.5.9 챗GPT 활용하여 분류예측모델 만들기
3.6 대량의 텍스트 데이터를 이해하다: 토픽 모델링
[사례] 전 직원 대상 설문조사의 서술형 응답 분석하기
_3.6.1 상황
_3.6.2 결과물 미리 보기
_3.6.3 검증하기
_3.6.4 토픽 모델링 따라하기
_3.6.5 챗GPT 활용하여 워드 클라우드 만들기
| 4장 | 데이터 드리븐 커뮤니케이션
4.1 데이터 드리븐 커뮤니케이션의 필요성
_4.1.1 나의 연봉과 상사의 연봉이 다른 이유
_4.1.2 타이밍이 중요한 이유
4.2 데이터 드리븐 커뮤니케이션 구성 요소
_4.2.1 메시지
_4.2.2 시각화
_4.2.3 스토리
4.3 데이터 드리븐 커뮤니케이션 방법
_4.3.1 어떤 차트가 효과적인가
_4.3.2 어떤 도구를 써야 하는가
_4.3.3 어떤 전달 방식이 적합한가
4.4 스토리텔링
_4.4.1 스토리텔러의 핵심은 속임수?
_4.4.2 스토리 만들기
4.5 데이터 드리븐 커뮤니케이션 체크리스트
_4.5.1 내가 이해하는 만큼 상대방도 이해한다
_4.5.2 보고는 내가 하고 싶은 이야기를 전달하는 것이 아니다
_4.5.3 나보다 보고 주제를 더 잘 아는 사람은 없다
_4.5.4 보고의 성패를 가르는 사전 준비 질문
_4.5.5 보고가 끝났다고 모든 일이 끝난 것은 아니다
출판사리뷰
데이터 유형별 효과적인 분석 기법 선정부터
설득을 위한 커뮤니케이션까지
실무에 바로 써먹는 데이터 기반 보고의 모든 것
비즈니스 영역에서 데이터 분석의 궁극적인 목적은 이해관계자를 설득하여 효율적인 의사결정을 내리는 데 있다. 데이터를 분석하는 역량만으로는 모든 결과를 가치 있게 만들 수 없다. 복잡하고 화려한 분석 결과물을 얻더라도 의사결정자에게 설득력 있게 전달하지 못한다면 그 데이터는 의미가 없다.
이 책은 문제 해결을 위한 올바른 문제 정의부터 데이터 수집, 정제, 분석 그리고 스토리텔링, 시각화까지의 과정을 통해 데이터로 이해관계자를 설득하는 데이터 드리븐(Data-Driven) 보고 능력을 키우는 방법을 상세하게 제시한다. 국가 공인 데이터분석전문가(ADP)이자 HR 데이터 과학자인 저자의 경험을 바탕으로 다양한 비즈니스 사례를 통해 상황별 가장 적합한 분석 기법을 어떻게 선택하는지 익힐 수 있다. 또한 방대한 양의 데이터에서 핵심 인사이트를 찾아내고 이를 설득력 있는 보고로 만들어내는 방법뿐만 아니라, 상대방이 가진 편향을 고려해 효과적으로 의사소통하는 방법까지 얻을 수 있다. 데이터 중심의 의사결정을 하고자 하는 데이터 분석가의 필독서로, 데이터 분석 사고의 폭을 넓히고 데이터를 기반으로 한 보고 방식에 대한 명쾌한 해답을 얻을 수 있을 것이다.
● 내용 구성
1장. 데이터 드리븐 보고
일상에서 데이터를 기반으로 의사결정하는 사례를 소개하고 데이터 드리븐 의사결정이 비즈니스에 어떻게 적용되는지 알아본다.
2장. 데이터 드리븐 보고 절차
성공적인 데이터 드리븐 보고를 위한 ON AIR 분석 절차를 단계별로 설명한다.
3장. 데이터 드리븐 보고 실전 사례 with 챗GPT
실제 비즈니스에 활용되는 데이터셋을 통해 데이터 형식과 보고 목적이 각각 다른 여섯 가지 사례를 실습한다.
- 행복에 영향을 미치는 변수와 국가별 행복지수 분석하기
- 회사의 중장기 인력구조 예측, 분석, 시각화하기
- 마케팅 효과 분석 및 최적의 광고 플랫폼 찾기
- 유학 컨설팅을 위한 해외 대학 합격률 분석하기
- 당뇨병 예측모델 수립 및 사전 예방 솔루션 제공하기
- 전 직원 대상 설문조사의 서술형 응답 분석하기
4장. 데이터 드리븐 커뮤니케이션
데이터를 기반으로 의사소통할 때 꼭 점검해야 할 체크리스트와 보고 대상자에 따른 맞춤형 커뮤니케이션 방법을 안내한다.
● 주요 내용
- 데이터에 기반한 보고 방법
- 보유한 데이터 특성에 따른 적절한 데이터 분석 기법 선정 방법
- 데이터 분석 결과물을 바탕으로 설득 대상에 따라 효과적으로 의사소통하는 방법
- 실제 분석 업무에 적용할 수 있는 단계별 실습 사례
- 구글 콜랩, 파이썬, 챗GPT를 실제 보고에 활용하는 방법
- 선형회귀분석을 통한 고객 설득 방법
- 수치형, 범주형 데이터에 적용하는 추론과 분류예측 방법
- 텍스트 데이터에 적용하는 워드 클라우드와 토픽 모델링 방법
● 대상 독자
- 파이썬 기초 문법을 알고 데이터 분석을 해본 적 있는 사람
- 데이터를 근거로 의사결정자 또는 이해관계자를 설득하고 싶은 사람
- 다양한 상황별로 적합하고 효율적인 분석 기법을 알고싶은 사람
- 분석 업무에 챗GPT를 활용하고 싶은 사람
- 데이터분석전문가(ADP), 빅데이터분석기사를 준비하는 사람
● 먼저 읽은 베타리더의 한 마디
- 비즈니스와 맞닿아 있는 신선한 사례들을 경험할 수 있고 실무에 적용하는 데 큰 도움을 준다. _김수현
- 데이터에 익숙하지 않은 주니어를 포함하여 이미 관련 경험이 있는 매니저급도 자신의 역량을 한 단계 끌어올릴 수 있을 것이다. _윤명식
- 데이터 분석, 시각화 코드 생성, 분석 결과를 보고서화하기 위한 챗GPT 프롬프트까지 알찬 내용만 담겨 있다. _윤세완
- 데이터 기반의 보고를 주저하는 직장인에게 자신감을 심어주고 끝내 보고할 수 있게 만든다. _정보영
- 편견과 인지 편향으로 가득한 상사를 설득하기 위한 체계적인 프레임워크를 제시한다. _조현석
- 데이터에 관심이 있고 분석을 할 줄 알아도, 이를 활용하는 방법 및 보고의 실체에 대해 감이 잡히지 않는다면 반드시 이 책을 읽어야 한다. _최철훈
회사 생활을 해보면 알겠지만, 대부분의 회사 생활은 실제 능력만큼 중요한 게 바로 '설득'능력이라고 할 수 있다. 능력이 압도적으로 뛰어나서 누군가에게 말을 할 필요도 없다면 모르겠지만, 사실 그런일은 없다시피하고 모든 일들이 설득을 배제하고는 돌아가지 않는다. 그렇다면 우리는 어떻게 '설득'을 해야할까? 관련한 해답을 책에서 찾을 수 있다.
이전의 데이터 관련 책들은 코딩만하거나, 아니면 챗GPT만 사용하는 경우들이 많았는데, '데이터 드리븐 리포트'의 경우는 그 두 개를 적절히 활용한다. 특히, 예시가 차지하는 부분이 굉장히 많은데 그 예시가 매우 알차게 되어 있다. 실제 있을 법한 상황을 가정하고 어떻게 분석을 이끌어나갈지 계획을 수립하고 데이터를 수집 및 분석한다. 그리고 개인적으로 이 책의 포인트라고 생각하는 부분인 '해석, 인사이트'를 통하여 '의사결정자용 보고'까지 어떻게 도출하는지 보여준다. 데이터에 기반한 보고가 처음인 사람들은 이런 레퍼런스를 통해 어떻게 보고를 해야 하는지 틀을 잡을 수 있어 매우 도움이 될 것이라는 생각이 들었다.
또한 마지막에 '보고는 내가 하고 싶은 이야기를 하는 것이 아니다'라는 섹션이 있다. 내가 말하고 싶은 것이 아니라 상대방이 궁금해하는 것을 이야기해주는 것, 가장 중요하고 기초지만 그래서 쉽게 잊게 되는 이야기인데 책의 마무리 부분에서 다시 한 번 짚어주어 좋았다. 단순히 분석을 어떻게 하는가?에 대한 책이 아닌, 우리가 분석을 어떻게 활용을 해야하는가에 대한 내용이라 정말 읽어볼만한 가치가 있는 책이라고 생각한다.
요즈음의 회사 업무는 챗 GPT가 일상이다. 작년부터 챗 GPT나 각종 Ai 툴들을 쓰고 있었고, 올해에는 챗 GPT의 유료 버전까지 따로 결제해서 업무에 활용하고 있는 중이다. 회사에서는 이번 달 들어서 업무에 Ai를 적극 활용해 보고자 업무 프로세스를 도입하려고 하고 있다. 아마 앞으로의 직장인은 Ai를 업무에 얼마나 잘 활용하는 지로 퍼포먼스가 나뉠 수 있을 것 같다. 그리고 그 챗 GPT와 파이썬을 활용하여 상사와 고객을 설득할 수 있는 책이 있어 소개하게 되었다. (사실 난 개발팀이라 고객은 관심 없고, 상사는 관심이 있지)
이상석 저자의 '데이터 드리븐 리포트'를 보게 된 건, 신규 아이템 제작 회의에서 개발이 드랍된 후였다. 나름 철저하게 자료를 준비했다고 생각했는데, 의사 결정권자가 보기에는 데이터가 부족하다고 했다. 여기에는 뭐 어느 정도 다른 이해관계도 포함되어 있긴 하지만, 사실 데이터가 충분하지 않았던 것은 인정하는 바다. 그렇다고 업무가 넘쳐 워라밸은커녕 숨 쉴 틈 찾기도 어려운 때에 데이터를 정리하겠다고 시간을 오래 들이기도 어려운 편이다.
"인생은 타이밍이다."라는 말을 아는가? 나도 가끔 하는 말이기는 한데, 이 책의 뒷부분에 나오는 내용이 뼈를 때렸다. '타이밍이 중요한 이유'. 상사의 기준에서 내 보고가 꼭 필요한 순간이 있고, 내 보고는 유효기간이 정해져 있는 우유와 같기 때문에 유효기간이 지난 순간 가치를 잃는다는 것. 정리해서 보고할 필요가 있었으나 솔직히 보고를 위한 보고라서 시간이 없어 미루다가 결국은 진행하지 않고 태스크 목록에만 남아 이제는 보고할 타이밍도 놓친 일들도 있다.
물론 시일을 다루는 보고는 그날 바로바로 써서 올리기는 한다면, 이번 신규 아이템 제작 회의도 미리 더 준비를 해서 타이밍에 맞춰 딱 내놓았다면 결과가 달라졌을지도 모른다. 명심하자. 기간 내 결과를 내야 하는 것도 직장인으로서의 중요한 역량이다.
누적된 기존 업무 성과들로 인해 어느 정도 결정권자(경영진)의 신뢰를 얻고 있다고 해도 새로운 것을 시작하려면 그것을 실행하기 전에 '근거'를 가지고 있어야 한다. 그리고 그 '근거'를 가지고 설득을 해야 하고.
"데이터가 없으면 당신은 단지 의견을 가진 평범한 사람에 불과하다."라는 에드워즈 데밍의 말처럼 회사에서 의사 결정을 하기 위해선, 그리고 비용 투자가 필요한 프로젝트를 진행하고 싶다면 근거가 되는 데이터를 준비해야 한다.
데이터 드리븐 의사결정은 개인의 경험이나 직관이 아닌 객관적인 데이터를 기반으로 하는 의사결정이며, 우리 삶에 필수적이다.(물론 경영진의 경험이나 직관 앞에 데이터가 무 쓸모 해지는 경우도 있으니 너무 상처받지는 말자)
책에서는 데이터 드리븐 보고의 여섯 가지 유형에 대해서 다룬다. 필수 역량인 '데이터 문해력'이라는 말이 등장한다. 실제로 책을 보면서 통계학과 수업 들을 때가 떠오를 정도였지만, 저자는 수학과 통계, 코딩이 아니라 데이터로 생각하는 습관과 내가 가진 데이터로 주어진 문제를 분석 및 시각화하는 방법을 아는 것이라고 말한다. 개인적인 생각으로는 사회 초년생이 보고 따라 할 수 있는 내용은 아니었지만, 2~3년 차 이상이라면 상사에게 본인의 의견을 피력할 때, 상사의 마음에 드는(상사가 상사의 상사에게 보고하기에 흡족한) 보고서를 작성하기에 꽤 도움이 될 내용들이다.
책은 보고 대상자가 실무자인지 의사결정자인지에 따라 보고 방식을 다르게 해야 한다고 하며, 보고 방법에 대해 알려준다. 회사는 학교나 학원이 아니기 때문에 이런 부분들은 사회 초년생에게도 도움이 될 내용들이라고 생각했다. 알잘딱깔센(알아서 잘 딱 깔끔하고 센스 있게) 사원이 되고 싶다면, 알아두면 좋을 내용들이다.
내게 유용했던 부분은 바로 여기. 챗 GPT와 함께 하는 실전 사례 부분이다. 이미 업무에 챗 GPT를 쓰고 있기 때문에, 좀 더 효율적으로 데이터 시각화 업무를 할 때 사용하고 싶었는데, 마침 이 책에서 이런 부분을 다루고 있어서 좋았다.
이 책은 전체적으로 이론 설명에 그치지 않고 실제 비즈니스 상황에서 어떻게 적용할 수 있는지를 구체적으로 다루고 있다. 예를 들어, 데이터 유형에 따른 분석 기법 선택이나, 보고 대상자에 따른 맞춤형 보고서 작성법 등을 상세히 설명한다.
데이터 분석의 복잡한 개념을 나름 쉽게 설명하고, 각 단계별로 필요한 사항들을 정리해 놓아 이해하기 쉬운 편이다. (모두에게 그런 것은 아니지만, 이 정도면 조금 어려워도 따라 할 수는 있다. 어차피 어려운 건 GPT가 다 해줌) 데이터 드리븐 보고의 5원칙 등은 펀쿨섹 보고서를 쓰기 위해 꼭 기억해 두어야 할 가이드라인이라고 생각한다.
다음은 개인적으로 내 업무에 활용하기 유용하다고 생각되는 챕터들이다.
게임 기획자라는 업무 특성상 데이터 시각화 부분은 잘 추려서 팀원들 교육에 활용해도 좋을 것 같다는 생각이 들었다.
분류 예측. 나는 지금 회사에서 중간 관리자라서 신입 채용이나 인사도 관여를 하고 있는데 신입 지원자들 지원서와 포트폴리오를 보는 데에 꽤 많은 시간을 뺏기는 편이다. 솔직히 말해서 너무 바쁠 때는 미안한 말이지만 훑어보고 눈에 띄는 부분이 없으면 걸러지기도 한다. (이래서 인생은 타이밍이다. 현실은 실무진이 꼼꼼하게 지원서와 포폴을 검토할 시간조차 주어지지 않는다.) 분류 예측을 보자마자 이거 잘 응용하면 지원서 검토에 쓸 수 있지 않을까라는 생각을 해보았다.
실제 업무에 활용하면 좋을 것 같은 토픽 모델링. 이 부분을 보자마자 이 책을 '신규 아이템 개발을 위한 시장 조사 보고서' 작성을 하고 있는 팀원에게 전달해 줘야겠다는 생각이 들었다. 토픽 모델링을 어떻게 하는지와 어떻게 효율적으로 하는지, 효용성에 대해서 다루고 있다. 제목만 보고 유용한 책일 거라고 생각해서 신청했는데 역시나 매우 유용한 책이었다. :)
한빛미디어의 데이터 드리븐 리포트는 데이터 분석을 통해 보다 효과적인 의사결정을 내리고 싶은 실무자들에게 매우 유용한 책이다. 데이터 기반의 보고서 작성법과 실제 사례를 통해 배운 내용을 실무에 바로 적용할 수 있는 실질적인 가이드를 제공하며 데이터 분석의 기본부터 고급 기술까지 폭넓게 다루고 있어, 데이터 분석에 대한 경험이 있는 경력자들뿐만 아니라 신입이나 초년생들에게도 추천할 만 하다. 예쁨 받는 보고서를 효율적으로 쓰기 위한 지름길을 가르쳐 주는 책이랄까. 물론 뭐든 처음은 어렵기 때문에 처음의 삽질은 감수해야겠지만, 일단 해두고 익혀두면 이후 업무의 질이 확연하게 달라질 것 같다.
이것은 여담. 4장 데이터 드리븐 커뮤니케이션에서 나의 연봉과 상사의 연봉이 다른 이유가 나온다. 아주 재미있고 유용하니 꼭 직접 읽어보시길 바란다.
이번 책은 데이터 드리븐 리포트. 부제는 상사와 고객을 설득하는 데이터 기반의 의사결정 with 파이썬이다.
6년간 다닌 회사에서 개발자 어깨너머로 보기만 했던 파이썬을 책을 통해 이제 와서 이해하고 있는 상황이다. 내 위치를 이야기하자면 디자이너로 웹/앱에 이용되는 이미지를 담당자다. UI/UX를 공부하면서 데이터에 관심을 갖기 시작했다. 사용자 입장에서 조금 더 생각해 보려고 하다 보니 회사와 부딪히는 부분도 많았다. 다크 패턴을 활용해 사용자를 더 묶어두려던 회사를 설득하고 싶었던 적도 있고 다른 곳에서 인기 있는 UX를 마구잡이로 회사 앱에 매칭 시키려고도 하는 데 반박하고 싶었던 적이 많았다. 설득력이 약한 것도 있었고, 내 업의 위치에서 의견 반영은 병이나 정 정도되는 듯 부장 선에서 정리되기 일쑤라서 힘을 잃었다.
그래서 데이터를 기반으로 다루고 싶었지만 그 데이터는 개발자 선에서 좌지우지되니 다가가기도 어려웠다. 만약 그 권한이 나에게도 주어졌다면 누적되는 데이터 관리나 이를 정제해서 인사이트를 뽑아 사용성 개선하는 것도 데이터 드리븐 리포트로 상사를 설득할 수 있었으리라 뒤늦게 깨우쳐본다. 이런 상황에 데이터 드리븐에 대한 관심이 높다. 설득도 잘 해보고 싶고, 데이터를 기반으로 화면 구성을 기획하고 디자인해 나간다. 상사를 설득하고 사용성 개선에 적극적으로 필요한 것이 데이터니 앞으로 나의 관심사는 데이터를 기반으로 확장될 것이다. 그래서 이번에 읽은 책 덕분에 애널리틱스 정도까지만 알고 있던 나에게 통계까지 확장되는 계기가 되기도 했다.
데이터 드리븐 보고는 데이터로 생각하는 습관을 갖고 주어진 데이터로 문제를 분석하고 시각화하는 역량(p.37)이 주 포인트니 잘 익혀본다면 활용면에서 좋으리라 생각된다.
책에서 권하는 대상 독자로는
파이썬 기초 문법을 알고 데이터 분석을 해본 적이 있는 직장인 / 상사와 고객을 설득해야 하는 데이터 분석가 / 기존의 보고 방식을 뛰어넘어 예측 가능하고 선제적인 분석 기법을 알고 싶은 사람 / '해봤는데 안 돼', '예전에 검토해 봤어' 등의 이유로 상사에게 거절당한 경험이 있는 사람 / 분석 업무에 챗 GPT를 활용하고 싶은 사람 / 데이터 분석 자격증과 실무를 동시에 고민하고 있는 사람으로 제시하고 있다.
디자이너로 호기심에 선택된 이 책을 읽고 내가 느낀 바로는 파이썬은 기본 지식이 있어야 이해할 수 있겠지만 그것 빼고는 일반적인 방법론 책과 달리 실무자 입장에서 작성되었다는 것이 중요했다. 데이터 드리븐의 기본 목적을 전달하고 이를 제대로 실천하기 위해 데이터를 가지고 통계나 결괏값만 도출하는 것에서 끝나지 않고 상사를 설득하며 사업에 활용할 수 있도록 데이터로 인사이트 찾는 사례들이 자세하게 적혀 있었다. 데이터 문해력을 키울 수 있도록 사례 제시와 챗 GPT로 활용하는 방법까지 자세히 다루고 있다. 그리고 데이터 드리븐 보고 5가지 원칙은 꼭 데이터를 다루지 않아도 실제 보고하는 방법에도 적용해도 유용해 보였다.
2014년 아마존에서 신규 입사자의 이력서를 점수로 환산해 주는 알고리즘 개발하며 벌어진 일은 충격적이었다. AI를 마냥 믿지 못하는 것도 이런 문제 때문일 것이다. 데이터는 중립적이지 않으며, 어떻게 데이터를 편집하느냐에 따라 주관적으로 변한다. 지난 데이터를 취합하여 결괏값으로 추려진 알고리즘은 지난 10년간 테크 기업의 성비가 남성이 많았다는 것으로 데이터화되어 이력서에 '여대', '여성 체스 클럽 회장'이라는 단어가 나오면 자동으로 페널티를 받게 설계되어 버렸다. (p.49) 이후 알고리즘을 포기했으며, 이런 편협적인 사건으로 AI의 설명 가능성, 투명성이 중요해졌다.
"데이터 시각화 분야의 세계적인 권위자 알베르토 카이로는 [숫자는 거짓말을 한다(웅진지식하우스, 2020)] 에서 어떻게 읽는지에 따라 숫자도 글자만큼 주관적이라고 말한다. 즉 우리가 데이터 기반의 보고를 잘하기 위해서는 데이터로 정보를 제공하는 신문 기사나 기타 보고 자료를 보고 그대로 수용하는 것이 아니라 비판적으로 사고할 줄 알아야 한다는 뜻이다."
데이터 드리븐 리포트. p.51
데이터를 다룬다면 주의해야 할 사항이 나에게는 유익했다. 데이터 문해력이 약한 사람이라면 헷갈릴 수 있는 용어의 차이도 세세하게 설명을 해주니 개인적으로 추가 검색으로 설명을 보태 이해할 수 있었다. 한번 읽고 이해하기에는 어려운 파이썬과 데이터 드리븐 쌩 초보자지만 신세계를 연 것 같이 신선했다. 그래도 알아서 나쁠 것은 없다고 2-3번 더 읽어 활용해 볼 여지를 찾아보려 한다.
나에게는 새로웠던 구글 콜랩에 대한 방법도 부록으로 실려 있으니 데이터를 다루는 사람이라면 유용할 것이다. 깃허브에 올린 자료로 실제 참여해 볼 수 있으니 데이터를 분석하고 싶은 입문자라면 데이터 문해력과 실무에서 직접 활용할 수 있는 보고서 활용까지 유용하니 적극적으로 추천해 보고 싶다.
데이터 분석에 대한 관심이 조금이라도 있는 사람이라면 '데이터 드리븐'이라는 용어를 많이 들어보았을 것이다. 몇 년 전부터 나오기 시작하는 많은 책들에도 '데이터 드리븐'이라는 용어가 나오고 있다. 하지만 '데이터 드리븐' 의사 결정을 할 때 어떤 방식으로 해야할지 정확히 아는 사람은 얼마나 될까?
데이터 드리븐 의사결정을 하고 싶은 사람 중 하나로서, 데이터 분석을 배워보기도 하고 다양한 BI 도구의 사용법도 배워보았지만 데이터 드리븐 의사결정을 하기 위한 방법을 명확히 알려주는 사람이나 도서는 적었던 것 같다.
그러나 최근 한빛미디어에서 나온 '데이터 드리븐 리포트'라는 책을 알게 되었다. 의사 결정자들이 데이터 드리븐 의사 결정을 하기 위해 도움을 줄 수 있는 실무자들의 데이터 드리븐 리포트를 작성할 수 있는 방법을 알려줄 것 같아 읽게 되었다.
'데이터 드리븐 리포트'라는 책 제목에서 예추할 수 있던 것처럼 문제 정의부터 데이터 수집, 데이터 정제, 데이터 분석과 시각화, 분석 결과로부터의 해석과 의견/제안을 담은 보고서 작성까지 모두 다루는 좋은 책이었다. 목차부터 흥미로운 책이었고, 설명도 쉽게 되어 있어 데이터 분석에 조금이라도 관심이 있는 사람이라면 누구도 금세 읽을 수 있는 책이었다.
특히 좋았던 것은 보통의 데이터 분석 책들처럼 분석과 시각화로 끝나는 것이 아니라 보고서 작성법과 예시를 많이 다루어 주고 있다는 점이었다. 분석의 결과를 어떻게 해석하는지, 그리고 어떻게 의사결정자들에게 효과적으로 보여주고 의사 소통해야 하는지를 다양한 예시를 통해 알려주어 실제 현업의 경험을 조금이나마 엿본 느낌이었다.
또한 상세하고 반복적인 설명도 좋았다. 물론 어떤 사람들에게는 계속 반복한다는 지루함을 줄 수 있겠지만 옹어와 그 의미를 반복해서 설명하여 초보자들이 용어의 의미를 다시 되새기느라 책의 앞 부분을 뒤적이지 않아도 될 것 같다. 하지만 상세한 설명이 길어 어떤 사람에게는 실제 보고서 작성 방법이나 실제 업무 노하우가 조금 빈약하다는 느낌을 받을 수 있겠다는 생각이 들었다.
조금 아쉬웠던 점은 데이터 수집에 대한 설명이 부족했던 것이다. 이 부분은 각자의 상황이나 데이터 수집 방법이 다를 수 있어서 그럴 수 있겠지만 데이터 수집을 위해 어떤 생각을 해야 하고, 어떤 부분을 고려해야 하는지에 대해 조금 더 자세한 설명이 있었으면 좋았을 것 같다는 생각을 했다.
ChatGPT를 이용한 데이터 분석 방법이나 해석 방법은 코딩을 잘 모르는 사람들에게는 도움이 될 수 있겠지만 ChatGPT가 유행하니 한번 넣어본 것 같은 느낌을 받았다. 앞에서 설명한 분석 내용을 반복하는 것은 1번으로 족하고 나머지는 텍스트 마이닝 파트처럼 다른 분석을 시도해 보았으면 어땠을까 하는 생각이 든다.
그래도 전체적으로 데이터 드리븐 리포트를 작성하는 방법과 의사 결정자들과의 커뮤니케이션 노하우가 잘 담겨 있고, 분석 과정에 대한 설명이 상세하고 쉽게 잘 되어 있어서 데이터 드리븐 의사결정을 하고 싶은 실무자들에게 추천하고 싶은 좋은 책이다.
데이터 직무를 계속 하고 싶은 사람으로서 분석 결과를 갖고 팀원들, 다른 부서, 나아가 고객과도 잘 소통하기 위해서 이번 도서를 선정했습니다. 고백하자면 그동안 업무를 하면서 분석을 잘했을지언정 누구나 잘 이해하게 내용을 전달했나? 에 대한 대답은 잘 모르겠습니다. 스토리텔링이 중요하다는데 그런건 소설 쓰는 사람들이 알아야 하는 것 아니었나 의문을 가진 채로 어디서부터 시작해야 하나 막막해하며 다른 사람들이 써왔던 문서를 보면서 간접적으로 배웠던 것 같습니다. 도서 설명을 읽고 바로 이 책은 진짜로 실무에 바로 도움될 수 있겠다 싶어 신청했습니다.
이런 어려움은 저만 겪은 것이 아니었는지, “조사에 따르면 데이터로 향하는 변화의 흐름이 조직의 성장과 수익 창출에 긍정적인 영향을 끼친 것은 맞지만, (중략) 데이터 기술 분야에 엄청난 비용을 투자했음에도 결과가 좋지 않은 이유를 ‘데이터 드리븐 보고(리포트)’ 역량의 부재 때문이라고 생각”(10페이지)이라고 하는 내용도 있었습니다. 저자도 ”직관과 감, 경험으로 무장한 경영진을 설득하는 데 한계를 느꼈고 이 벽을 넘기 위해“(14페이지) 데이터 과학을 공부하셨다고 하네요. 저처럼 데이터를 활용한 보고에 어려움을 느낀 분들, 저자처럼 보고에 데이터를 더해 설득을 하고 싶은 분들에게 모두 도움될 만한 도서라고 생각합니다.
1장 데이터 드리븐 보고에서는 데이터 드리븐 보고를 위한 필수조건과 데이터를 기반으로 의사결정하는 사례를 소개합니다. 특히 데이터 드리븐 보고를 위한 5가지 원칙을 설명하면서 왜 중요한지, 어떻게 적용할 수 있는지, 실제 관련된 사례로 어떤 것들이 있는지 함께 알려준 것이 인상적이었습니다. 앞으로 보고가 있을 때마다 이 원칙들이 잘 적용되었는지 검토해야겠습니다.
2장 데이터 드리븐 보고 절차에서는 보고를 위한 절차를 단계별로 설명합니다. 목표를 설정하고 데이터를 수집하고 분석 방법을 결정, 실제 수행 후 해석과 보고를 하는 과정을 상세하게 알려줍니다. 빅데이터 분석기사를 비롯한 데이터 관련 자격증에서 개념적으로만 배웠던 내용들을 실제 사례, 코드와 함께 확인할 수 있었습니다. 분석에 필요한 기본 용어 설명부터 통계 방법론을 적용하는 코드까지 다뤄주고 있어 데이터 분석을 처음 접하는 분들도 어렵지 않게 적용할 수 있을 것 같습니다. 개인적으로는 분석 계획서의 필수 요소들과 보고 대상자에 따른 보고 방식 내용을 집중적으로 살펴봤습니다.
3장 데이터 드리븐 보고 실전 사례 with 챗GPT에서는 데이터 형식과 보고 목적이 다른 6가지 비즈니스 사례를 실습합니다. 데이터를 시각화하고 분석 방법을 정해 수행하는 과정까지 챗GPT의 도움을 받아 파이썬 코드를 작성합니다. 실무자용 보고와 의사 결정자용 보고를 다르게 제안해서, 어떻게 다르게 작성해야 하는지도 이해할 수 있습니다. 챗GPT 3.5 버전을 사용하고 있어 유료 결제를 하고 있지 않아도 사용할 수 있어 좋은 것 같습니다. 챗GPT의 답변을 그대로 따라했을 때 발생하는 오류에 대처하는 과정까지 있어서 파이썬, 챗GPT가 낯선 분들도 당황하지 않고 따라하실 수 있을 듯합니다.
4장 데이터 드리븐 커뮤니케이션에서는 데이터를 기반으로 의사소통할 때 어떻게 진행해야 좋은지 설명합니다. 성공적인 커뮤니케이션을 위해 메시지/시각화/스토리는 왜 중요한지, 어떤 차트/도구/전달 방식이 적합한지, 스토리는 어떻게 만들어야 하는지를 제안합니다. 특히 보고에서 점검해야 할 체크리스트를 제공하고 있어 실제로 업무를 수행하면서 적용하면 좋을 것 같습니다.
이 책도 깃허브를 통해 실습 자료를 제공하고 있습니다. 각 장에서 QR 코드를 함께 붙여줘서 바로 자료를 확인할 수 있어 좋습니다.
여러 사례들과 각 상황에서의 사례를 설명해주어 더욱 이해가 쉬웠고 실무에 적용하기도 좋아 보입니다. 꼭 데이터 과학자가 아니더라도 데이터가 수반되는 모든 부서의 직장인들이 업무 역량을 기르는 데에 도움 받을 수 있을 것 같습니다. 이제 SQL이나 파이썬 같은 도구를 이용해 데이터를 분석할 수 있는지 보다는 해결하고 싶은 문제를 명확하게 정의하고 의사결정에 도움되는 통찰을 도출하는 것이 중요할 테니까요.
다소 불편했던 점은 구글 도서에서 목차를 제공해주지 않았다는 점, 책을 이미지로 제공해서 글씨 크기 조절은 불가능하다는 점입니다. 이미지가 많이 포함되어있고 많은 기술책들이 이북에서는 페이지 단위로 볼 수 있으니 후자는 이해할 수 있지만.. 제공되는 목차가 아래 내용이 전부였다는 점이 아쉬웠습니다. 구글 도서가 목차 페이지를 자동으로 탐지해서 텍스트로 변환해주면 좋을텐데 말이죠..
독서를 마친 후 드는 생각은 “이걸 사회 초년생에 알았다면 더 좋았을텐데..”였습니다. 지금에라도 좋은 내용을 익혀서 다행이라고 해야할까요.. 책을 읽으며 나의 보고 능력은 지금 어떤 수준인지를 돌아보고, 보고 능력이 이렇게나 중요하구나 깨닫는 계기가 되었습니다. 문제를 정의하고, 데이터를 수집하고 올바른 분석 방법론을 선택하고 자료를 작성해 커뮤니케이션하는 과정까지 정말 많은 기술과 노력이 필요하지만.. 저자가 언급한 것처럼 "지속 가능한 커리어 성장과 나를 차별화하기 위해"(47페이지) 반드시 필요한 역량이라고 생각합니다.
아래와 같은 분들에게 이 도서를 추천하고 싶습니다. 1. 분석은 잘하지만 어떤 방식으로 전달해야 좋을지 막막한 분 2. 이해관계자 설득을 위해 문제 정의부터 데이터 분석을 수행하는 과정 전체를 알고 싶으신 분 3. 챗GPT를 이용하여 분석 업무를 해보고 싶은 분
저자는 도입에서 “데이터 드리브 보고는 데이터 문해력과 스토리텔링의 조합으로 이뤄진 예술적인 행위”(16페이지)라고 하였습니다. 아마 5년 전쯤 언젠가 지도교수님께서 통계가 예술이라고 말씀하신 적이 있었는데요. 통계가 데이터를 읽고 쓰는 데이터 문해력을 적용하며 메시지를 전달하는 스토리텔링까지 하는 행위를 모두 포괄하기 때문에 그렇게 비유하신 것을 이제서야 명확하게 이해하였습니다.
올바른 문제 해결을 위한 문제 정의부터 데이터 수집, 분석을 거쳐 스토리텔링, 시각화를 수행하여 의미 있는 결론을 내고 결국 설득까지 해내는 과정을 위하여, 그리고 AI에 대체되지 않기 위해서..ㅎㅎ 이 책을 통해 배운 점들을 잘 적용해서 문서 작성할 수 있도록 해야겠습니다.
단어적 의미로만 보면 [데이터에 따라 처리를 하는]이라고 설명을 하고 있는데, 어떤 결정을 내릴 때 데이터를 활용한다는 의미로 추측된다. 처음 이 책의 제목만 봤을 때는 그리 관심이 없었는데, 표지에 추가로 담겨있는 [상사와 고객을 설득하는 데이터 기반의 의사결정 with 파이썬]이라는 문구에 눈이 쏠리게 되면서 읽어보게 된 책이다. 사업을 하거나 직장인이라면 아니 거의 대부분이 관심을 두지 않을까 여겨진다. 다만 꼬리에 달린 'with 파이썬'이라는 프로그래밍 언어가 등장해서 어려운 내용이 담겨있지는 않은지 조금 불안할 뿐이다.
설득.
시작은 상사에게 마케팅 전략에 대해 나름 설득력 있는 수십 페이지의 보고서를 작성하여 상사에게 보고를 하였지만 상사가 던진 질문에 대답을 하지 못하면서 설득에 실패하는 상황에 대한 일례로 시작한다. 그러면서 보고 과정에서 상사와 보고자 모두 감에 의한 보고와 의사결정을 하고 있다는 점을 주시하면서 설득의 과정이 무너진 점에 대한 분석을 대리며 이에 대한 방법으로 데이터를 기반으로 하는 보고가 설득에 유리하다는 점을 부각시키며 상사가 가진 특정 편향에 맞추어 테이터를 준비하고 활용한다면 설득의 성공가능성을 높힐 수 있다. 여기서 객관적인 테이터를 기반으로 의사결정을 하는 것을 '데이터 드리븐 의사결정'이라고 하며 이 방법은 일상에서 일어나는 일부터 비즈니스 상황에서 일어나는 일까지 유용하게 사용할 수 있으며 특히 비즈니스 환경에서는 '데이터 드리븐 보고'라는 절차와 켜뮤니케이션으로 활용되는 점을 안내하며 보고의 유형과 원칙에 대해 설명하는 것으로 1장을 마무리 하고 있다.
이어진 2장에서는 '데이터 드리븐 보고 절차'에 대한 본격적인 내용을 담고 있는데 [목표 설정(Objective) - 데이터 선정(Necessary dta) - 분석 방법 경정(Analytics) - 해석 및 검증(Interpretaation) - 보고(Report) : ON AIR 분석 절차]라는 이름으로 그 과정에 대해 소개함으로써 데이터 드리븐 보고가 단순한 데이터 분석이 아닌 체계적이고 전략적인 프로세스라는 점을 강조하고 있다.
이렇게 이론적인 배경을 바탕으로 예제를 통한 학습과정이 3장에 펼쳐지는데, 예제를 통해 데이터를 이해하고 이미지/시각화 하는 방법이나 가설을 세우고 검증하는 방법이나 올바른 예측을 찾아가는 방법을 소개하기도 하고 마지막으로는 숫자로 된 정형화된 데이터가 아닌 비정형 테이터를 분류되는 텍스트 분석에 대한 예제를 통해 다양한 실습 과정을 소개한다.
그리고 이 모든 과정이 마무리 되었다면 4장에서는 상사 또는 고객을 설득한는 켜뮤니케이션의 중요성에 대해 설명을 하고 있다. 기본적으로 이 켜뮤니케이션이 얼마나 중요하고 필요한지에 대한 설명을 시작으로 구성요소와 도구, 방법 등에 대한 내용과 이 모든 것들을 논리적으로 배치하고 설득해 나가는 스토리텔링에 대한 설명으로 정리하고 있으며 마지막으로 최종 보고에 앞서 확인해야될 체크리스트와 보고를 마친 후의 조치 상황에 대해 설명하는 것으로 마무리하고 있다.
마지막 5장에서는 책 제목에 있는 'with 파이썬'이라는 제목에 걸맞게 개인 PC환경에서 실행가능한 '구글 콜렙'과 '파이썬 라이브러리'를 설치하고 실행하는 방법과 활용하느 방법에 대한 간단한 설명으로 마무리하고 있다. 물론 5장의 내용외에 2/3장에서는 콜렙과 파이썬에서 활용 가능한 코드 등을 안내하고 있다.
데이터 드리븐 리포터
콜렙이나 파이썬 등의 프로그램을 운용할 수 있는 분들이라면 이 책을 아주 유용하게 활용할 수 있겠지만 그렇지 않는 분들이라도 상사나 고객을 설득하기 위해 무엇을 해야하는지 그 방법을 찾는 독자들에게는 충분히 도움이 될 만한 책이라고 추천한다.
대학생활을 하거나 직장에 다니면서 우리는 많고 다양한 요구사항들을 접하게 됩니다. 대다수는 어떤 안건에 대해 자료를 수집하고 정리하여 보고자료를 만드는 데 있죠. 그러한 보고자료들은 채점자인 교수, 혹은 상사, 나아가서는 불특정 다수들에게 노출되고 심판대 위에 서게 됩니다. 그리고 딱 두 가지 판단만이 존재하게 됩니다. 매력적인가, 그렇지 않은가 이 두 가지겠지요. 이를 가르는 가장 중요한 요인은 놀랍게도 데이터를 어떻게 다루고 표현하느냐에 달려있다는 것이 이 책의 골자입니다.
우리가 지금까지 살아온 시대는 감성보다는 이성, 논리를 앞세운 설득법을 가르치는 데 집중했었죠. 논술의 중요성을 내세워 논리적인 글쓰기를 자꾸만 가르쳐왔죠. 이러한 교육이 불필요하게 되었다는 건 아닙니다만, 이런 교육방향은 다소 구시대적인 방법이라고 말씀드리고 싶네요. 제시된 근거를 갖고 주장하는 일은 누구나 할 수 있는 능력이 되었고, 이제는 주장에 맞는 근거를 적절하게 생성해내는 사람이 필수적인 시대가 되었습니다. 데이터들은 세상에 너무나 많아졌고, 이 데이터를 어떻게 쓸지는 개개인의 몫이 되었습니다. 저자는 이런 시대에서 Data를 원하는 방향으로 Drive 하여 report 하는 능력은 자신의 직무 역량을 한층 높여줄 수 있을 것이라고 말합니다.
첫 장에서 저자는 독자들이 자신의 책에 설득될 수 있도록 데이터 드리븐 리포트를 사용하며 그 힘을 여실히 보여줍니다. 그리고 곧 독자들 역시 자신처럼 역량을 기를 수 있을 것이라고 북돋아주며 데이터 드리븐 리포트 세계로 초대합니다.
2. 정석적이면서 연속적인 문제해결적 보고 : 철저히 실무에 집중하는
이 도서의 가장 큰 장점은 정석적인 문제해결적 보고 기법을 가르쳐주는 것이라고 생각합니다. 마치 정확하고 완벽한 사수가 바로 옆에서 알려주는 느낌마저 듭니다. 그럴 법도 한 것이, 많은 data-driven report경험이 있고 능력 있는 HR분석가로 인정받는 저자로선 애매모호하고 의미 없는 기법들을 가르쳐 줄 리가 없겠죠. 독자들이 왜 이런 방법들을 쓰는지 납득가게 하면서, 깔끔한 설명과 적용을 보여줍니다. 저자는 이런 정석적인 방법만 잘 알고만 있어도, 데이터 분석가로서의 역량을 충분히 기를 수 있음을 보여주는 듯했습니다.
이 글을 보고 있는 분들 중에는 혼공학습단에 참여를 해보셨거나, 혼자 공부하는 시리즈를 접해보신 분이 있으실지도 모르겠습니다. 이 책은 '혼자 공부하는 R데이터분석'과 어느 정도 배우는 것이 비슷합니다. 다만, 실무에서 직접 활용되는 양상을 더 많은 예제로 기록해 둔 것은 이 책입니다. 좀 더 발전적이고 연속적이죠. 통계에 대해 약간이라도 베이스가 있다면, 혹은 파이썬을 활용한 분석에 관심이 가신다면 이 책을 추천드리고 싶습니다.
3. 친절한 구성에 탄식마저 들었던 책
제가 대학에서 통계 과목을 수강할 때 느꼈던 점은 너무나도 어렵게 가르쳐주신다는 것이었습니다. 교수님께선 기본적인 배경지식을 다 아는 걸로 간주해 생략하시고, 자주 쓰는 통계 기법을 왜 이럴 때 써야 하는지 제대로 얘기도 해주지 않은 채 가르치시는 걸 자주 봐왔었습니다. 그러다 보니 수업을 쫓아가는데 어려움을 많이 겪었습니다. 실제로 제 동기들, 그리고 대학을 나오신 분들도 통계를 제대로 전공하지 않는 경우에는 좋은 기억을 갖고 있지 않는 경우가 허다했습니다.
그러나 이 책은 탄식을 자아내기 충분했습니다. 통계 지식뿐만 아니라 코딩 지식도 어느 하나 빠뜨리는 것 없이 세세하게 담아 설명해 줍니다. 그리고 통계 기법이 실제로 적용되는 양상을 예제를 통해 보여주죠. 읽어 내려가면서 친절하고 자세한 설명에 감사함은 물론, 진작에 이런 책을 갖고 공부했더라면 조금이라도 더 재미 붙이며 배울 수 있었지 않았을까 하는 아쉬움 마저 들었던 것 같네요.
앞서 설명했다시피, 이 책은 보고를 위한 통계법들을 알려주는 데 포커싱이 되어있습니다. 그렇지만, 기본적으로 설득력 있는 보고를 위해 쓸 수 있는 기술들도 기록되어 있습니다. 차례도 가독성 있게 잘 구성되어 있으니, 꼭 데이터 분석이 아니더라도 기본적인 보고 능력을 기르고 싶은 누구라도 읽기 좋은 책이라 생각합니다.
☆ 이 포스팅은 한빛미디어 <나는 리뷰어다> 활동을 위해 책을 제공받아 제작된 서평입니다 ☆
저는 21학번으로 인공지능공학과 다니다, 현재는 메디컬 관련 학과 전공하고 있는 대학생입니다. 21년도 당시엔 C++라는 낯선 프로그래밍 언어를 접하고 애먹었던 기억이 있죠. 그 와중에 같이 입시 공부도 병행했던 지라 아무래도 학과 공부량은 조금 부족했던 것이 사실입니다. 그렇지만 인공지능 프로그래밍이 언젠가는 꼭 필요하게 쓰일 것이라 믿음이 있었기에, 꿋꿋이 공부해 나갈 수 있었습니다. 그리하여 22년도 중고 신입생이 되어 1학년을 보낸 겨울방학, 이따금씩 작년에 프로그래밍하던 기억이 떠오르더군요. 그 기억을 살려 다시 컴퓨터 공부를 하면 좋겠다는 생각이 들었습니다. 그렇지만 학과 공부처럼 각 잡고 하고 싶진 않아서 고민하던 중에, '혼공학습단'을 알게 되었습니다. 딱 6주 동안 혼공책을 가지고서, 정해진 분량을 갖고 숙제를 해나가면 되는 활동이었습니다. 혼공책 자체도 혼자 공부하기 정말 좋은 책입니다만 학습단 활동까지 하니, 공부한 내용을 학습단의 다른 분들과 공유하기도 좋고, 스스로도 공부한 내용을 정리할 수 있는 시간을 가질 수 있었습니다. 정말 좋은 시간이었죠. 동기부여도 되고, 좋은 정보도 많이 알아가면서 근 1년의 방학을 그렇게 보내왔습니다.
이번 <나는 리뷰어다> 활동은 '혼자 공부하는' 시리즈를 출판한 한빛미디어에서 주관하고 있는 활동입니다. 한빛미디어는 주로 프로그래머들을 위한 책들을 출판하고 있는데, 요즘은 디자인이나 스타트업 등 다방면으로 좋은 책들을 내고 있는 듯하더군요. 게다가 책을 읽고 리뷰하길 좋아하는 사람들을 대상으로 한 달의 한번 책을 지원받고 서평 쓰는 활동을 지원해 준다 하니, 저는 너무 감사했죠. 한빛미디어에서 내는 책들은 주로 혼공시리즈만 접했는데, 다른 책들도 읽을 수 있다고 하니까 말이죠. 그리고 책 자체도 힙하기 때문에 예비독자분들께 포인트들을 뽑아내기 참 괜찮습니다. 앞으로는 틈틈이 읽고 싶었던 책들 지원받으면서 매달 한편씩 서평을 쓰고자 합니다.
회사에서 크고 작은 의사 결정함에 있어 데이터 기반 분석은 자체 만으로 아주 강한 설득력을 가진다. 마케팅, 개발등 여러 직무에서 보고와 의사 결정 단계에서 데이터 분석 결과는 신뢰성을 보증하며 감에 의한 오류와 주관적인 판단을 최소화 할 수 있다
현대 사회는 방대한 양의 데이터가 생성되고 활용되는 데이터 시대며, 이러한 시대를 살아가는 개인과 조직 모두에게 데이터는 필수적인 요소가 되었다. 기존의 비즈니스 프로세스를 데이터 기반으로 혁신하는 과정인 디지털 트랜스포메이션이나 데이터를 조사하고 해석하여 의미 있는 정보를 얻는 과정인 데이터 분석, 데이터 분석을 통해 비즈니스 문제를 해결하고 의사결정을 내리는 비즈니스 애널리틱스등 관련 분야의 도메인 지식이 있는 사람들은 몸값이 높고 중요한 의사 결정에 참여한다.
이렇듯 데이터 활용은 효과적인 의사결정으로 더 정확하고 합리적인 결과를 도출할수 있으며,
데이터를 활용하여 새로운 시장 기회를 창출하고 운영 효율성을 높여 경쟁력을 강화 할 수 있다.
또한 데이터 분석을 통해 새로운 제품과 서비스를 개발할 수도 있다.
이 책은 데이터 기반 의사결정의 중요성을 강조하며, 특히 데이터 드리븐 보고 역량의 중요성을 명시한다. 책에서 정희한 '데이터 드리븐 보고'는 '데이터 수집, 정제, 분석부터 스토리텔링과 시각화까지를 포함하는 일련의 과정이며, 의사결정자에게 설득력 있게 데이터를 전달하는 방법'
데이터 시대를 살아가는 개인과 조직 모두에게 필수적인 데이터와 관련된 주요 개념들을 소개하고, 데이터 활용의 중요성을 강조한다. 또한, 개인과 조직이 데이터 활용 능력을 향상시키기 위한 노력의 방향을 제시한다.
통상의 데이터 사이언스 책은 Python, R등 언어에 집중되어 데이터 분석 전체 숲을 보지 못하는 맹점에 빠지기 쉬운데, 이 책은 데이터 분석의 전반적인 프로세스를 처음부터 끝까지 해보는 것에 중점을 둔 것 같아 마음에 들었다.(전체 적인 흐름만 알고 있으면 세부적인 코딩은 AI의 도움을 받을수 있는 세상이라, 이를 활용할 수 있는 감만 있다면 코딩은 그리 큰 문제가 아니라는 개인 생각이다) 그리고 분석결과로 상대방을 설득 시켜보는 목적을 위한 역량 배양에 중점을 두었다는 점도 이 책의 강점이다고 생각한다.
데이터 드리븐 리포트는 데이터 분석과 보고를 처음 접하는 입문자부터 전문가까지 모두에게 유용한 책이 될 것이다. 체계적인 절차와 다양한 실전 사례, 최신 기술 활용 방법 등을 통해 데이터 드리븐 의사결정의 모든 과정을 이해하고 실천할 수 있도록 돕는다. 이 책은 데이터 중심의 사고와 분석 방법을 익히고자 하는 모든 이들에게 강력히 추천할 만한 필독서라고 생각한다.
데이터가 중요하다고 하는데 정말 데이터 드리븐 의사결정이 되고 있는 조직은 많이 없는 것 같다. 조직문화나 의사결정자마다 다르겠지만, 보고를 하는 실무자 입장에서도 데이터 기반의 의사결정을 할 수 있도록 올바른 리포트를 작성하는 것도 중요하다. #️⃣ 데이터가 중요함을 데이터로 설득한다. 저자는 데이터를 가지고 조직에서 소통하는 방법을 제시한다. 개인의 경험이나 감이 아니라 데이터를 통해 상대방을 설득하는 것의 중요성을 강조한다. 이를 위해 데이터로 독자에게 설명한다. 실제 설문조사나 통계자료를 가져와서 말이다. #️⃣ 암묵지를 형식지로 꺼내준다. 암묵지란 경험, 직관, 감각 등 개인에게 내재되어 있으나 명확한 표현하기 어려운 지식을 말하고 형식지란 문서, 데이터베이스, 매뉴얼 등 명확하게 표현되고 기록할 수 있는 지식을 말한다. 자전거 타는 법, 수영하는 법이 사실 명확하게 표현할 수 없는 것 처럼 세상엔 암묵지로 된 지식의 비주이 더 많다. 책은 보통 형식지를 대표하는데 이를 내재화하여 암묵지로 바꾸는 과정을 거친다. 이 책은 그러한 내재화에 충실하다고 할 수 있다. 비즈니스 환경에서 겪을 수 있는 상황과, 실제 사례, 그리고 파이썬을 활용한 코드 예시를 통해 독자의 이해를 돕고 있다. 특히 2장에서 제시한 데이터 분석 보고 프로세스는 일반적인 데이터 분석방법론을 토대로 짜여진 내용이지만 몰입하여 이해할 수 있게 잘 구성되어 있다고 있다고 생각한다. 시나리오도 상상하면서 직접 실습도 해본다면 형식지를 금방 암묵지로 바꿀 수 있을 것 같다. 반대로 4장은 짧지만 필자의 암묵지를 다시 형식지로 펼쳐놓았는데 사회초년생때 보았다면 분명 상사에서 한결 더 좋은 평가를 받았을 거란 생각이 든다.
#️⃣ 혼자서도 할 수 있는 데이터 분석 방법을 제시한다. 파이썬이 배우기 쉽고, 컴퓨터공학이 대중화되었지만, 아직도 비전공자에게는 진입장벽이 있는 분야다. 말 그대로 프로그래밍 언어이기 때문이다. 나 역시 데이터 분석을 본업보다는 서브로 하는 입장에서 Chat GPT와 같은 생성형 AI의 등장은 새로운 패러다임을 만들었다. 교양수준의 통계 지식을 이용해서 간단한 ML모델을 만들어보거나, 간단한 탐색적 데이터분석은 큰 허들없이 할 수 있게 되었다. 이 책은 그러한 최근 트렌드를 가장 잘 반영한 책이다. 실제로 Chat GPT의 어떤 프롬프트를 작성해야 혼자서 분석을 할 수 있는지를 설명해놓았다. 그러니까 이 책을 1회독을 하고 나면 그 다음부터는 생성형 AI가 사수가 되어 직접 분석할 수 있도록 구성했다.
추천독자 매주 혹은 매달 전년대비, 동시점 비교, 성장률, 매출, 수익 등 단순 숫자를 나열하는 보고만 하는 직장인이라면 이 책을 통해 새로운 세계에 눈 뜰 수 있다고 생각한다. 반면, 현업 데이터 분석가라면 기초적인 내용이 많은 이런 책보다는 좀 더 데이터 커뮤니케이션에 포커싱을 둔 책을 보는 게 낫겠다. 기본적인 분석 방법론은 굳이 필요하지 않을테니 말이다. 이 책을 통해 포트폴리오를 만들려고 이 책을 추천하는 것이 아니라, 일반적인 비즈니스 환경에서 왜 데이터 분석이 필요한지, 어떤 프로세스로 분석 프로젝트가 이루어지는지 간접적으로 알 수 있다.
이 책은 데이터를 근거로 의사소통해야 하는 모든 실무자를 위한 데이터 기반의 의사결정 가이드입니다.
다음과 같은 내용을 다루고 있습니다.
데이터를 기반으로 하는 보고의 5원칙
실제 분석 업무에 적용할 수 있는 단계별 실습 사례
데이터 유형별 적절한 분석 기법 선정 방법
보고 대상자에 따른 맞춤형 커뮤니케이션 방법
챗GPT를 활용한 노코딩 데이터 분석 실습
선형회귀분석을 통한 고객 설득 방법
이 책의 내용을 더 알아보도록 하겠습니다.
2. 책의 구성
이 책은 총 4개의 장으로 구성되어 있습니다.
제 1장. 데이터 드리븐 보고
일상에서 데이터를 기반으로 의사결정하는 사례를 소개하고 데이터 기반 의사결정이 비즈니스에 어떻게 활용되는지 알아본다. 데이터 드리븐 보고가 비즈니스에 어떻게 적용되는지 살펴본다
제 2장. 데이터 드리븐 보고 절차
성공적인 데이터 드리븐 보고를 위한 ON AIR 분석 절차(목표 설정 - 데이터 선정 - 분석 방법 결정 - 해석 - 보고)를 단계별로 설명한다.
제 3장. 데이터 드리븐 보고 실전 사례 with 챗GPT
실제 비즈니스에 활용되는 데이터셋을 통해 데이터 형식과 보고 목적이 각각 다른 여섯 가지 사례를 직접 실습한다. 사례별로 챗GPT를 활용하여 코딩에 대한 지식 없이도 파이썬 코드 작성할 수 있도록 했다.
제 4장. 데이터 드리븐 커뮤니케이션
분석 결과로 상사 혹은 고객을 설득해 원하는 결과를 얻는 것은 분석 과정 만큼이나 중요하다. 데이터를 기반으로 의사소통할 때 꼭 점검해야 할 체크리스트를 안내한다.
3. 책의 내용
1) 데이터 드리븐 보고
데이터 기반의 의사결정(Data driven decision making, DDDM)을 위한 데이터 드리븐 보고(리포트)가 무엇인지? 데이터 드리븐 보고가 우리의 일상에서 어떻게 적용할 수 있는지? 비즈니스에서는 어떻게 가치를 창출하는지? 실제 기업에서 어떻게 활용하는지?를 알려준다. 데이터 드리븐 보고의 중요성을 깨닫길 바랍니다.
2) 데이터 드리븐 보고 절차
제2장에서는 데이터 드리븐 보고의 전략적인 단계를 살펴보고 분석을 하기 전에 알아야 할 기본 용어, 개념을 이해하고, 목표 설정 -> 데이터 선정 -> 분석 방법 결정 -> 해석 및 검증 -> 보고(리포트) 까지 단계에 대해서 알려줍니다.
3) 데이터 드리븐 보고 실전 사례 with 챗GPT
실제 현장의 절차를 기반으로 데이터 드리븐 보고를 진행하는 것을 알려줍니다. 실제 비즈니스 적용 방법이 궁금한 실무자를 위한 내용을 다루고 있습니다.
4) 데이터 드리븐 커뮤니케이션
데이터 드리븐 보고의 마지막 절차인 ‘데이터 드리븐 커뮤니케이션'에 대해서 알려줍니다. 왜 데이터 드리븐 커뮤니케이션이 필요한지? 커뮤니케이션의 성공 기준부터 효과적인 메시지, 시각화, 스토리텔링까지 다양한 측면을 다루고 있습니다.
4. 책을 읽은 후
데이터 분석은 정말 쉬운 분야가 아닙니다.
분석의 80%는 기본 통계와 시각화를 통해 이뤄지고
20%는 고도화된 분석 도구를 사용할 수 있어야 합니다.
기본을 알고 있어야 고도화된 분석이 가능합니다.
데이터 분석관련 책이 어려운 이유입니다.
하지만 데이터 분석 책 가운데 실제 예시를 통한 전반적인 분석 절차에 대한 예시가 다양하고, 좀더 쉽게 접근하려는 저자의 의도를 볼 수 있습니다.
그리고 예시를 따라할 수 있도록 모든 소스코드는 GitHub에 공개를 하고 있습니다.
OpenAI 사의 ChatGPT가 출시되고 전세계에 지각 변동이 일어나고 있습니다.
‘AI는 당신을 대체하지 않는다. AI를 사용하는 사람이 당신을 대체할 것이다.’ 라고 산티아고 발다라마 가 말했습니다.
직장인의 생존 스킬, 지속가능한 비즈니스를 위한 필수적인 도구임에는 틀림이 없습니다.
이 책을 통해서 고객을 설득하고, 상사를 설득할 수 있는 직장인, 분석가가 되기를 희망합니다.
회사생활을 하다 보면 업무와 직군 상관없이 굉장히 많은 자료를 만들게 된다. 그리고 그 자료의 목적이 상황마다 다르겠지만 기본적으로 내가 준비한 자료는 내가 말하고자 하는 것을 뒷받침할 때 사용된다. 사람은 객관적인 자료에 신뢰를 느낀다. 그리고 최근에 느낀 점인데 근거가 빈약하거나 잘못된 자료라 하더라도 그럴싸해 보이면 신기하게도 뭔가 신뢰를 느끼는 경우가 종종 있는 것 같다. 그렇기 때문에 자료의 근거와 출처를 꼼꼼히 확인하고 올바른 선택을 할 수 있도록, 이성적인 판단을 할 수 있도록 비판적으로 보는 시각이 필요한 것 같다.
내가 말하고자 하는 것은 보기 좋은 떡이 맛있다는 말도 있는 것처럼 내가 고생해서 얻은 자료와 지표에 더 힘을 실어주기 위해선 이를 위한 적절한 표현법이 필요다는 것이다. 아무런 정렬 없이 문장으로 나열하는 것보다는 리스트 형식으로 정리하는 것이 눈에 더 잘 들어온다. 하지만 여기서 조금 더 신경 써본다면 데이터의 성격에 따라서 적합한 표현법을 찾아 이것을 적용해 볼 수 있다. 이 책은 그런 것들을 파이썬 예제와 함께 실습해 볼 수 있는 내용을 담고 있다.
최근에 발표자료를 몇 번 만들 일이 있었는데 고민이 많았다. 나는 디자이너는 아니지만 그럼에도 불구하여도 조금 더 내가 준비한 좋은 내용을 표현할 수 있는 알맞은 그릇이 없을까라는 생각을 했다. 이 책에서 제시하는 방법은 코드를 작성해야 한다는 점에서 허들은 있지만 개발자들에게는 굉장히 유용할 것 같다.
"데이터 드리븐 리포트"는 데이터 분석의 실무적 적용에 중점을 둔 책으로, 실무에서 데이터 분석에 고민하는 모든 이들을 위한 귀중한 자료이다. 이상석 저자는 이 책을 통해 데이터를 기반으로 한 의사결정의 필요성을 강조하며, 실제 비즈니스 상황에서 데이터를 효율적으로 활용하는 방법을 제시한다. 이 책은 단순히 데이터 분석의 이론적인 측면을 넘어서, 실무자들이 데이터 분석을 통해 의사결정을 내리고 이해관계자들을 설득하는 데 필요한 실질적인 지침을 제공한다.
저자는 상사나 고객을 설득하기 위해서는 데이터에 기반하여 소통해야 한다고 강조한다. 이 책에서는 방대한 데이터 속에서 핵심 인사이트를 찾아내고 그 결과를 명확하게 전달하는 방법을 상세하게 설명한다. 데이터 분석의 궁극적인 목적을 이해관계자를 설득하여 효율적인 의사결정을 내리는 것으로 정의하며, 이를 위한 구체적인 방법론을 제시한다.
실무자들이 직면하는 다양한 문제 상황을 고려하여, 데이터 유형별로 적절한 분석 기법을 선택하는 방법을 안내하는 이 책은, 데이터 분석가가 아닌 일반 실무자들도 쉽게 이해하고 적용할 수 있는 실질적인 지식을 제공한다. 예를 들어, 행복에 영향을 미치는 변수 분석, 회사의 중장기 인력구조 예측 등의 다양한 실습 사례를 통해 실무자들이 실제 업무에 적용할 수 있는 데이터 분석의 접근 방식을 배울 수 있다.
데이터 기반의 의사소통 기술에도 중점을 두고 있는 이 책은, 데이터 드리븐 보고의 절차와 실전 사례, 커뮤니케이션 방법에 대한 체크리스트를 제공하여 실무자들이 데이터를 통해 보다 설득력 있는 보고를 할 수 있도록 지원한다. 데이터 분석 결과를 비즈니스에 성공적으로 적용한 여러 사례를 통해 구체적인 학습 경험을 제공하며, 실무자들은 데이터 분석 사고의 폭을 넓히고 복잡한 데이터 분석 결과를 의사결정자에게 설득력 있게 전달하는 방법을 배울 수 있다.