상세정보
상세정보

통계학을 떠받치는 일곱 기둥 이야기

통계는 어떻게 과학이 되었는가?

지은이 |   스티븐 스티글러
옮긴이 |   김정아
발행일 |   2016-12-28
페이지 |   224가격 |   15,000원
ISBN |   978-89-6540-155-1
분야 |   통계학
dddddd

통계학을 떠받치는 일곱 기둥 이야기

통계는 어떻게 과학이 되었는가?

지은이 |   스티븐 스티글러
옮긴이 |   김정아
발행일 |   2016-12-28
페이지 |   224
가격 |   15,000원
ISBN |   978-89-6540-155-1
분야 |   통계학
ddd
ddd
역사를 읽는 방법은 여러 가지다. 시대순으로 읽기도 하고 지역별로 구분 지어 읽기도 하고 특정 주제로 묶어서 읽기도 한다. 《통계학의 역사》에서 천문학과 측지학, 사회과학, 유전학 분야마다 통계학이 어떻게 발전했는지를 다뤘던 저자는 이 책에서 통계학을 통계학답게 하는 요소별로 역사를 살펴본다. 따라서 전작이 통계학의 응용 분야에 중심을 둔 것이라면, 이 책은 통계학 근간에 중심을 둔다. 저자가 보기에 오늘날 통계학이라는 학문의 집을 떠받치는 일곱 기둥은 자료 집계, 정보 측정, 가능도, 상호 비교, 회귀, 설계, 잔차이다. 이와 함께 일곱 기둥을 세운 여러 조력자가 어떤 과정을 거쳐 이 기둥들을 세웠는지를 대표 사례를 통해 보여준다.
통계하면 골치 아픈 수식이 떠오르고 역사 하면 벽돌처럼 두툼한 책이 떠오른다. 하지만, 제목만큼이나 다루는 수식도 줄이고 내용을 압축해 통계학 역사의 뼈대를 간추렸다. 길지 않은 분량으로도 통계학의 기본 줄기를 소개함과 동시에 앞으로 들어설 또 다른 기둥, 여덟째 기둥을 암시한다.


[출판사 리뷰]

통계학에 과학으로서의 독특함을 부여하는 것은 무엇일까? 저자 스티븐 스티글러(Stephen Stigler)는 통계학에 대해 수학이나 컴퓨터 과학과 관련은 있으나 차이 또한 있는 과학 분야인 일곱 가지 기본 아이디어를 소개한다.
평균으로 대표되는 가장 기본적인 아이디어인 자료 집계(Aggregation)조차도 직관적이 아니다. 이 방법은 관찰의 개별성이라는 정보를 버림으로써 정보를 얻도록 한다. 스티글러의 두 번째 기둥인 정보 측정(Information Measurement)은 모든 관찰이 다 똑같이 중요한 것은 아니라는 사실을 이용하여 '빅데이터'의 중요성에 의문을 제기한다. 데이터 집합의 정보 총합은 관찰 수의 절댓값이 아닌 제곱근에만 비례할 때가 더 많다는 것이다. 세 번째 아이디어는 확률을 이용하여 추론을 바로잡는 가능도(Likelihood)이다. 통계 비교는 외적 준거에 따라 수행될 필요는 없다는 원칙이 네 번째인 상호 비교(Intercomparison)이다. 다섯 번째 기둥인 회귀(Regression)는 역설("평균적으로 키가 큰 부모는 부모보다 키가 더 작은 자식을 놓는다. 평균적으로 키가 큰 자식은 키가 더 작은 부모를 가진다.")인 동시에 베이즈 추론과 인과 관계 추론 등 분석의 기본이다. 여섯 번째 개념은 철저한 랜덤화를 이용한 결합적 접근법의 장점을 이용하여 실험 설계(Experimental Design)의 중요성을 강조한다. 일곱 번째 아이디어는 나머지, 즉 잔차(Residual)로, 원인이 알려진 효과를 제외하면 복잡한 현상도 간단해질 수 있는데 이렇게 하여 남은 현상을 더 쉽게 설명하려는 것이다.
이 책은 통계에 관심이 있는 사람이나 전문적으로 통계를 다루는 사람 모두에게 매력적인 도서로, 통계 과학을 종합적이고 독창적으로 설명한다.
시작하며
1 자료 집계: 표와 평균에서 최소 제곱법까지
2 정보 측정: 정보 측정과 변화율
3 가능도: 확률 척도의 보정
4 상호 비교: 표본 내 변동을 표준으로
5 회귀: 다변량 분석, 베이즈 추론, 인과 관계 추론
6 설계: 실험 계획과 랜덤화의 역할
7 잔차: 과학 논리, 모형 비교, 진단 표시
결론
스티븐 스티글러

미네소타 칼턴 칼리지를 거쳐 캘리포니아 대학에서 통계학 박사학위를 받았다. 시카고 대학 통계학과 교수이자 국제통계협회 회장을 맡고 있다. 1960년대 후반부터 통계학의 여러 분야에 걸쳐 연구논문을 발표했으며 가장 관심을 둔 분야는 통계학의 역사다.


김정아

전산 통계를 공부하고 품질 및 경영혁신 일을 하다, 하고 싶은 일을 찾아 번역에 뛰어들었다. 사전과 자료를 뒤지는 일이 때로 벅차지만, 뚜벅뚜벅 가다 보면 언젠가는 자연스러운 우리말을 뽑아내는 번역가가 되리라 믿는다. 사람과 역사에 관심이 많고, 글밥 아카데미 수료 뒤 바른번역 소속 번역가로 활동하고 있다.
"원더풀! 저자인 스티글러가 과거 2세기 동안의 통계학 역사를 통해 그 나름으로 다듬은 일곱 개의 기둥은 놀라운 통찰력을 제공한다."
- 하워드 웨이너(Howard Wainer), 《사이언스》

"결코 직관적이지 않았던 과거에 대한 생생한 이야기는 우리로 하여금 빅데이터의 효과에 의문을 제기하도록 한다. 왕에게 측정을 맡기지 말고 컴퓨터에 판단도 맡기지 마라."
- 조너선 키츠(Jonathon Keats), 《뉴 사이언티스트》

"통계에는 우리 삶의 모든 부분에 관계된 핵심 아이디어가 들어 있다. 저자는 이를 끄집어 내어 숨을 불어 넣고 있다."
- 퍼시 디아코니스(Persi Diaconis), 스탠퍼드대학

"과학적 사고에서 가장 어려운 부분은 해당 분야의 기저에 무엇이 있는가이다. 저자는 엄청난 영향력이 있는 통계학의 숨겨진 사실에 빛을 비추고 이를 조사한다."
- 브래들리 애프론(Bradley Efron), 스탠퍼드대학

"과거 여러 세기를 거쳐 정제된 통계 연구에 기발함을 더한 이 책은 데이터를 분석하고자 하는 모두에게 대접하는 일곱 가지 코스 요리다. 빅데이터든 그렇지 않든 상관없이 말이다."
- 샤오리 멍(Xiao-Li Meng), 하버드대학

역사를 읽는 방법은 여러 가지다. 시대순으로 읽기도 하고 지역별로 구분 지어 읽기도 하고 특정 주제로 묶어서 읽기도 한다. 《통계학의 역사》에서 천문학과 측지학, 사회과학, 유전학 분야마다 통계학이 어떻게 발전했는지를 다뤘던 저자는 이 책에서 통계학을 통계학답게 하는 요소별로 역사를 살펴본다. 따라서 전작이 통계학의 응용 분야에 중심을 둔 것이라면, 이 책은 통계학 근간에 중심을 둔다. 저자가 보기에 오늘날 통계학이라는 학문의 집을 떠받치는 일곱 기둥은 자료 집계, 정보 측정, 가능도, 상호 비교, 회귀, 설계, 잔차이다. 이와 함께 일곱 기둥을 세운 여러 조력자가 어떤 과정을 거쳐 이 기둥들을 세웠는지를 대표 사례를 통해 보여준다.
통계하면 골치 아픈 수식이 떠오르고 역사 하면 벽돌처럼 두툼한 책이 떠오른다. 하지만, 제목만큼이나 다루는 수식도 줄이고 내용을 압축해 통계학 역사의 뼈대를 간추렸다. 길지 않은 분량으로도 통계학의 기본 줄기를 소개함과 동시에 앞으로 들어설 또 다른 기둥, 여덟째 기둥을 암시한다.


[출판사 리뷰]

통계학에 과학으로서의 독특함을 부여하는 것은 무엇일까? 저자 스티븐 스티글러(Stephen Stigler)는 통계학에 대해 수학이나 컴퓨터 과학과 관련은 있으나 차이 또한 있는 과학 분야인 일곱 가지 기본 아이디어를 소개한다.
평균으로 대표되는 가장 기본적인 아이디어인 자료 집계(Aggregation)조차도 직관적이 아니다. 이 방법은 관찰의 개별성이라는 정보를 버림으로써 정보를 얻도록 한다. 스티글러의 두 번째 기둥인 정보 측정(Information Measurement)은 모든 관찰이 다 똑같이 중요한 것은 아니라는 사실을 이용하여 '빅데이터'의 중요성에 의문을 제기한다. 데이터 집합의 정보 총합은 관찰 수의 절댓값이 아닌 제곱근에만 비례할 때가 더 많다는 것이다. 세 번째 아이디어는 확률을 이용하여 추론을 바로잡는 가능도(Likelihood)이다. 통계 비교는 외적 준거에 따라 수행될 필요는 없다는 원칙이 네 번째인 상호 비교(Intercomparison)이다. 다섯 번째 기둥인 회귀(Regression)는 역설("평균적으로 키가 큰 부모는 부모보다 키가 더 작은 자식을 놓는다. 평균적으로 키가 큰 자식은 키가 더 작은 부모를 가진다.")인 동시에 베이즈 추론과 인과 관계 추론 등 분석의 기본이다. 여섯 번째 개념은 철저한 랜덤화를 이용한 결합적 접근법의 장점을 이용하여 실험 설계(Experimental Design)의 중요성을 강조한다. 일곱 번째 아이디어는 나머지, 즉 잔차(Residual)로, 원인이 알려진 효과를 제외하면 복잡한 현상도 간단해질 수 있는데 이렇게 하여 남은 현상을 더 쉽게 설명하려는 것이다.
이 책은 통계에 관심이 있는 사람이나 전문적으로 통계를 다루는 사람 모두에게 매력적인 도서로, 통계 과학을 종합적이고 독창적으로 설명한다.