세이버메트릭스

최근 수정 시각:

분류

sabermetrics.[1]

1. 개요2. 상세3. 말말말4. 유명한 세이버메트리션5. 세이버메트릭스 관련 사이트6. 관련항목

1. 개요[편집]

야구사회과학게임 이론통계학적 방법론을 적극 도입하여 기존 야구 기록의 부실한 부분을 보완하고, 선수의 가치를 비롯한 '야구의 본질'에 대해 좀더 학문적이고 깊이있는 접근을 시도하는 방법론. 기존 주먹구구식 선수 평가론을 전면 부정하고, 야구선수에 대해 좀 더 객관적인 평가를 하기 위해 창안된 이론이다.

어원은 SABR(The Society for American Baseball Research. 미국야구연구협회) + metrics/metrician. 초기에 SABR라는 모임을 중심으로 형성되었기에 이런 이름으로 부른다. 이름에서 알 수 있듯이 세이버메트리션들은 여러 가지 수리적 방법론을 동원해 야구라는 스포츠를 '분자 단위로 분해'하는 것을 일삼는 사람들이다.[2]

2. 상세[편집]

The system of keeping batting averages needs a complete overhauling. At present this system merely gives the comparative number of times a player makes a hit without paying any attention to the importance of that hit. Home runs and scratch singles are all bulged together on the same footing, when everybody knows that one is vastly more important than the other. The result is that the records are grossly misleading.
타율을 중요시하는 관점은 완전히 손 볼 필요가 있다. 현재의 시스템은 단지 타자가 안타를 만들어내는 상대적인 빈도만 제공해줄 뿐, 그 안타의 의미와 가치에는 전혀 관심을 기울이지 않는다. 홈런 하나와 행운의 안타 하나는 똑같이 값이 매겨져있지만, 누구나 하나가 다른 하나에 비해 훨씬 더 중요하다는 사실을 알고 있다. 결과적으로 그 스탯은 사람들이 매우 오해하게 만드는 셈이다.

ㅡ F.C. 레인(Ferdinand Cole Lane). 1915년. 원문, 번역본


흔히 빌 제임스가 최초의 세이버메트릭스로 평가받지만, 현재는 F.C. 레인이 최초의 세이버메트리션으로 간주되기도 한다. 그래서 미국야구연구협회는 2012년 레인에게 '헨리 채드윅상(Henry Chadwick Award)'을 수여하기도 했다.[3]

빌 제임스[4]는 "세이버메트릭스는 야구를 객관적으로 이해하려는 시도이다"라고 정의한 바 있다. 이러한 주장을 하는 사람들을 세이버메트리션(sabermetrician)이라고 한다. 속된 말로 야구기록 덕후. 1990년대 이후의 현대 야구는 이들과 떼어놓고 생각할 수 없다. 다만 평범한 사람들이나 가볍게 야구를 즐기는 이들한테는 그저 할 일 더럽게 없는 잉여집단일 뿐(...). 게다가 2000년대 들어서는 세이버매트릭스의 기록 계산법이 절대 진리라고 밀어붙이는 일종의 선민사상을 가진 세이버매트릭스들과 이를 부정하려는 전통야구관을 가진 야구팬들 때문에 인터넷에서는 세이버매트릭스 진영과 반세이버매트릭스 진영과의 충돌이 수시로 일어나고 있다.

일반적으로 빌 제임스의 Baseball Abstract 시리즈를 세이버메트릭스의 시초로 취급하지만 실제 시초는 1916년 F.C 레인이 '5센트, 10센트, 25 센트, 50 센트를 같은 선상에 두고 비교하는 것이 과연 옳을까?'라는 의문을 시작으로 62경기의 실황 중계를 바탕으로 단타는 0.457점, 2루타는 0.786점, 3루타는 1.15점, 홈런은 1.55점의 가치를 가진다는 것을 밝혀냈다는 것을 야구 통계학 즉, 세이버메트릭스의 시초로 둔다. 라이브볼 시대도 아닌 데드볼 시대 때 타율은 가치없는 지표이며 볼넷과 장타가 중요하다는 매우 앞선 생각을 가진 사람이었다. 그리고 1944년 브루클린 다져스에서 그 당시 단장이였던 브랜치 리키는 야구 역사상 최초로 통계학자인 앨런 로스를 고용해 첫 흑인 선수인 재키 로빈슨을 중심타선에 새우도록 만들었다. 재키 로빈슨이 뛰는 것에 대해 극심한 반대를 한 그 당시 다져스 최고의 딕시 워커를 트레이드를 시키기까지 했다.

전에 있던 문서에서는 1970년대까지 클래식 스탯만 쓰였으며 세부지표는 거의 안쓰였다 했지만 1944년 브루클린 다져스가 먼저 통계를 사용하기 시작했으며 이 세이버메트릭스라는 단어만 없었을 뿐이지 야구 분석학이라는 세이버메트릭스의 기반이 되는 학문은 1950년대 초부터 각광받기 시작했다. 1954년 <LIFE> 잡지에 위에서 말한 다져스 단장인 브랜치 리키는 로스에 이론에 따른 현대 세이버메트릭스의 기초가 되는 출루율과 장타율 개념을 10페이지가 넘는 장문의 글에 개시했다. 그리고 조지 린지가 F.C 레인의 이론을 약간 수정한 '득점 기대치' 이론이[5] 나오면서 본격적으로 세이버메트릭스가 시작되었다 볼 수 있다. 언쇼 쿡은 <확률야구>라는 논문에서 야구 작전과 선수 평가에 확률론을 처음으로 접목시켰으며 세이버메트릭스의 기본이 되는 플레이 인덱스를 만들었다. 그의 논문을 본 저명한 작가 프랭크 디포드가 스포츠 일러스트레이트에서 '지금까지의 야구는 틀렸다'라고 할만큼 큰 파장을 불러들어왔다. 그리고 볼티모어 오리올스에 1969년 얼 위버가 감독으로 취임하면서 통계에 비중을 많이 두었는데 이시기 오리올스가 통계를 바탕으로 AL 동부를 완전히 독식하면서 다른 팀들도 야구 통계학에 관심을 갔기 시작했다. 그러다 1970년대 들어 빌 제임스를 비롯한 일군 선구자들이 나타나 수학적, 통계학적 방법론을 도입한 새로운 기록 및 통계를 제시하게 되었고, 당시 금융업과 결합하여 급격히 성장하고 있던 미국 통계학계의 야구팬들이 이에 열광하면서 이러한 새로운 통계적 접근이 더욱 발전하게 된다.

이들이 도입한 개념 중 비교적 직관적인 OPS, WHIP와 같은 초보적인 스탯 개념들[6] 은 이제 KBO 야구 중계에서도 흔히 들을 수 있을 정도로 일반화되었다. 하지만 아직 해외에 비해 많이 뒤쳐져 있는데 해외 세이버 메트릭스에서도 유명무실한 타율이나 평균자책점, WHIP나 가지고 판단하는 것을 보면, 더 많은 기록 일지를 보급하여야 하지만, 스탯티즈 사태 이후 망했어요

이들의 통계학적 접근방식은, 과거에는 매우 풍부한 경험을 지닌 현장 야구인 일부만이 어렴풋이 이해하고 있던 야구의 그윽한 경지를 수치화하여 일반인들도 쉽게 접해 이해할 수 있도록 만들었다는 데 가장 큰 의의가 있다. 선수도, 코치도, 기자도 아닌, 그야말로 '단지 야구와 수학이 좋았을 뿐'인 일반인들의 연구가 실제 야구판에 영향을 미쳤다는 점도 높이 평가할 만 하다.

이들의 기여로 인해 바뀐 대표적인 관행이 바로 선수들의 연봉협상. 이전에는 주먹구구식으로 구단이 책정한 고과가 협상의 기본자료였다면, 지금의 연봉협상은 서로가 객관적인 통계수치를 들이대는 법정싸움[7] 비슷한 것으로 바뀌었다. 물론 KBO의 연봉협상은 지금도 주먹구구다

지금의 세이버메트리션들은, 모든 플레이 하나하나의 상황을 최대한 객관적이고도 정확히 남겨 세밀한 분석이 가능하도록 하는 데 집중하고 있다. 이에 따라서 필연적으로 세이버메트릭스의 학문화와 전문화가 진행되었는데, 그 부작용으로 야구에 어지간히 관심이 많은 팬들도 이해하지 못하는 어려운 개념과 수학적/통계학적 모델링이 동원되고 있다.[8] 그러다 보니 세이버메트릭스를 접할 수 있는 기회가 늘어난 것에 비해, 일반 야구팬들이 마주하는 심리적인 장벽은 높아졌다고 할 수 있다.

그러나 일반적으로 올드 스쿨, 즉 애매하고 중의적인 흐름을 중요시하는 야구 해설식 분석[9]보다는 세이버메트릭스의 과학적인 접근이 훨씬 더 야구 세계의 진리에 가까워진 경우가 많다. 흔히 통계의 허상을 들이대며 세이버메트릭스를 비판하는 사람들이 있는데, '세이버메트릭스=통계'도 아닐 뿐더러[10] 그런 식으로 통계를 까는 사람들이 가장 허술한 통계인 타율을 신뢰하는 경우가 많다는 점에서 적합하지 못하다.[11]

머니볼의 유행으로 오클랜드 어슬레틱스빌리 빈 스타일을 전형적인 세이버메트리션으로 오해하는 경우가 있는데, 이들은 단지 '일정선 이하의 금액을 어떻게 효과적으로 투자할지'를 결정하기 위해 세이버메트릭스를 응용했을 뿐, 이들의 소위 머니볼 스타일이 세이버메트릭스의 전부는 아니다. 더불어 빌리 빈의 오른팔이자 전형적인 세이버메트리션인 폴 디포데스타가 LA 다저스 단장 노릇을 하면서 구단을 말아먹은 뒤로는, 일선에서는 세이버메트릭스와 전통적인 스카우트 기법을 적절히 섞어 합리적인 운영을 하는 쪽으로 진화하고 있다. 물론 이 빌리 빈 스타일을 통해 스몰마켓의 운영 해법을 찾았다는 점은 의미가 있다.

그리고 빌 제임스와 보로스 매크래컨 등 세이버메트리션들을 대거 기용하고 테오 엡스타인이라는 젊은 단장을 기용한 보스턴 레드삭스가 2000년대 중후반 두 차례 우승을 거머쥐면서[12][13] 세이버메트릭스의 위상은 추락하기는 커녕 오히려 점점 높아지고 있다.

다만 타격은 OPS, wOBA 같은 간단한 편에 속하면서도 신뢰성이 있는 데이터를 만들었지만, 피칭에 대해서는 DIPS, FIP 등이 많이 누적되었다고 해도 타격에 비하면 부족하며, 특히나 수비에 관한 간단한 데이터는 만드는 데 애를 먹고 있다. 기본적으로 수비에 대한 데이타 산출부터 문제인데다, 일반적으로 알려진 수비율도 공을 전혀 건드리지 않으면 그만이고,[14] 빌 제임스가 개발한 레인지 팩터같은 데이터들도 다 장단점이 극명해 변수가 잦은 수비를 비교해 주긴 무리가 따른다.[15] 깊이 들어가면 ZR, UZR, +/-와 같은 지표가 있지만 이 쪽은 애호가가 아닌 일반 야구팬이 직관적으로 접근하기는 어려운 편이다. 게다가 일정 수준이 넘어가면 대개의 사이트들은 돈 내고 보라는 식으로 진입장벽을 만들어놓기 때문에 일반 팬들과의 단절감은 심화된다.

위에서 언급했듯 세이버메트릭스를 야구경기보다 통계, 숫자에 집착한다며 비판하는 경우가 있는데, 세이버메트릭스의 핵심은 어떠한 스탯이 선수의 실질적 가치에 가까운 스탯인가를 찾는 것이다. 다시말해 상대적으로 부정확한 스탯인 타율/다승이 아닌 wOBA/WAR를 보는 게 더 좋다는 것이지, 야구를 보지말고 스탯만 뒤지자는 것이 아니다. 또한 세이버메트릭션들이 통계를 이용한 숫자놀음을 많이 하는것도 어디까지나 그 선수의 객관적인 평가를 위한 것일 뿐이다. 가장 좋은 것은 숫자놀음이 아닌 선수의 플레이 그 자체를 보고 선수를 정확히 평가하는 것이지만, 그런 경지에 도달한 사람은 현장의 야구인 중에서도 역대급으로 꼽히는 소수의 몇명 뿐이다. 따라서 차선책으로 통계를 통한 논리적, 합리적 분석을 추구할 수 밖에 없는 것이다.

오히려 통계의 허점에 대해서는 세이버메트리션 쪽에서 더 많이 언급하고 있다. 세이버메트릭스에 대한 비판 가운데 많은 수를 차지하는 것이 세이버 스탯에 대한 충분한 이해가 없이 그저 본인의 상식과 다르다는 것을 근거로 이루어지는 형태인데, 세이버메트릭스에서 주로 사용하는 스탯들과 그 스탯을 만들어낸 원리와 공식도 재대로 알아보지도 않고 까는것은 비판이 아닌 비난일 뿐이다. 정작 선수들과 선출 야구인들은 세이버메트릭스를 아는 경우 자체가 적은데다 설명을 들어도 '뭐 그딴 쓸데없는...'이라는 반응을 보인다. 무엇보다 유명한 세이버메트리션 대부분이 비선출이다. 인생을 야구에 바친 야구 전문인들 입장에선 자기들 가지고 수치놀음 하는 이상한 사람들로 보일 뿐.

일반적인 야구팬들 사이에서 언급되는 대표적인 오해의 예로 '타선은 OPS 순으로 나열해야 한다' 같은 것이 있는데, 그 내용 자체도 세이버메트리션 쪽의 의견과는 다르며,[16] 애초에 세이버메트릭스에서는 타순을 중요하게 다루지도 않는데, 연구 결과 효율적인 타선 배치로 인한 이득이 일반적인 통념보다 훨씬 낮게 나타나기 때문이다. 가장 효율적인 타선 조정으로 얻는 점수는 시즌을 통틀어도 5점 미만이다. 결국 이 논제는 세이버메트릭스에 대한 오해중 하나.

일반적인 야구팬들, 하다못해 세이버메트릭스에 대한 이해가 없던 세이버메트릭스 도입 초창기의 스카우터들도 갖고 있던 오해 중 하나는, 세이버메트릭스가 제시하는 이상적인 선수의 상이 하나 뿐이라는 것이다. 대충 그들이 가지고 있던 생각은 '세이버메트릭스가 생각하는 이상적인 타자는 딱 하나인데 2할 중 후반대의 그다지 높지 않은 타율, .360~.380 수준의 높은 출루율, .420~.460 수준의 적당한 장타율의 재미없는 선수가 그것이다' 라는 것. 세이버메트릭스에 대한 반감을 가지고 있던 스카우터들은 세이버메트리션과의 대담을 나누는 자리에 나와서 '너네들 방법으로 뽑는 선수는 다 똑같을 거다. 우리는 슈퍼스타를 뽑아낼 수 있지만, 이제 야구는 다 재미없어지고 똑같은 애들만 뽑게 될거다' 라는 늬앙스로 비꼬기도 했다. 물론 이건 세이버메트릭스를 모르기 때문에 나온 촌극이자 무시. 오히려 세이버메트릭스는 이전에 무시받던 유형의 선수에게도 중요한 가치가 있음을 알려주며, 더 다양한 선수들의 유형이 등장하게 만들었다. 일례로 2017년 7월 3일 기준, 코디 벨린저는 .262, .335 라는 낮은 타율과 출루율을 기록중이지만 미친듯한 홈런 퍼레이드로 .633의 장타율을 기록 중이다. 코리 시거는 벨린저만큼 홈런을 많이 치진 못하지만, 타/출/장이 거진 3/4/5 에 수렴하는 밸런스 잡힌 성적을 보여주고 있다. 다니엘 머피는 볼넷을 거의 얻지 못하며 출루율 따위는 개나 주라는 듯한 타석 접근법을 보여주고 있지만 .334 라는 미친듯이 높은 타율로 출루율 역시 .387 을 유지하고, .569 의 뛰어난 장타율을 보여주고 있다. 이 세 선수는 각각 일발 장타형 홈런 타자, 어줍잖은 밸런스 타자가 아닌 타출장 3/4/5 의 완벽한 밸런스 형 타자, 미친듯이 높은 타율과 꽤나 좋은 파워를 보유한 타자로 제각기 판이한 모습을 보여주고 있지만, 세이버메트릭스로 분석한 이들의 리그 평균 선수 대비 타석 효율은 각각 146%, 143%, 142% 로 매우 비슷하다.

세이버메트릭스가 선수 능력을 수치화하는데 유용한 도구인 것은 분명하지만, 세이버메트릭스를 지나치게 맹신하는 것도 지양해야 할 것이다. 예를 들어 세이버메트릭스의 아버지 빌 제임스는 2017년 한국언론과의 인터뷰에서 데이터로 사람을 평가한다는 것은 매우 어려운 일이며, 세이버메트릭스를 이용한 선수 평가 역시 틀릴 수도 있다는 것을 인정해야 한다고 말하였다. 기사 링크 물론 어디까지나 세이버메트릭스만으로 평가하기 어렵다는 뜻이고, 현장에서 수집한 정보 등의 다른 정보와 합쳐지면 평가하기 상당히 좋아지며, 최소한 타율이나 타점, 승이나 평균자책점만 보고 평가하는 것보다는 비교할 수조차 없을 정도로 신뢰도가 높다는 것은 변하지 않는다.

자세한 것은 야구의 기록 계산법 참조.

3. 말말말[편집]

만약 우표에 관심이 있는 사람들이 우표 수집을 하고, 몸집이 큰 사람들이 스모를 좋아한다면, 통계를 좋아하고 시시콜콜한 정보에 관심 있는 사람들은 야구에 끌릴 것이다.


스티븐 제이 굴드


내가 각 숫자들에 접근하는 방식은 기계공이 멍키스패너를 들고 일을 시작하는 것과 크게 다르지 않다. 내가 시작하는 것은 늘 내 눈으로 직접 목격하거나 그 곳에 있었던 사람들의 목격담을 듣는 것이 가능한 경기들부터이다. 그리고는 스스로에게 묻는다. 이것은 진실인가? 그것을 증명할 수 있는가? 측정이 가능한가? 이것은 내 기계 전체 구조와 어떻게 들어맞는가? 그리고는 이에 대한 해답을 얻기 위해 각각의 기록들을 파고든다. (중략) 오늘도 야구는 수많은 기록들을 만들어내고, 사람들은 그에 대해 무척 많은 것을 이야기하고, 논쟁하거나 생각한다. 그런데도 왜 사람들은 그 자료들을 이용하지 않고 있는 것일까? 또는 왜 아무도 이런저런 자료들을 앞에 놓고 그것을 '증명해볼 것'을 요구하지 않는 것일까?


빌 제임스, 1979 Baseball Abstract 중


데이터는 신비로운 마법도 절대적 진리도 아니다. 대신 "당신 야구 얼마나 해봤는데?" 라고 묻지도 않는다. 그것은 편견 없는 소통의 언어이며 협력의 플랫폼이다.


신동윤 한국야구학회 데이터분과장.


세이버매트릭스라는 건 확률이잖아요? 그래서 믿을수가 없어요.


안경현 SBS Sports 야구 해설위원.[17]

4. 유명한 세이버메트리션[편집]

4.1. KBO 리그[편집]

  • FreeRedbird : 한국 굴지의 세이버메트리션. 세이버메트릭스 항목은 스탯과 이론들을 소개하는 글 위주로 포스팅된다. 세이버메트릭스는 알고싶은데 영어는 자신없는 사람들의 필수 코스. 블로그

  • 故 박기철 ('스포츠투아이' 전무. 출처[18])

  • 이동현 : 스탯티즈 운영자. 필명으로 스탯티즈라는 이름을 쓴 적도 있다.

  • 최민규 : 일간스포츠 기자로 한국 1세대 세이버메트리션 중 한 명. pc통신 시대부터 세이버이론을 펼쳤으며 인터넷 사이트 후추닷컴에서 기자를 시작한 이래로 스포츠 2.0에서 세이버메트리션 관련 칼럼을 연재하기도 했다.

  • 정재승 : 카이스트 교수. 과학 콘서트의 저자로 유명하며, 대중적으로는 가장 인지도가 높은 과학자로 손꼽히는 인물. 세이버메트릭스 계에서는 4할타자가 나올 확률에 대해 연구한 최초의 소셜 네트워크 연구인 백인천 프로젝트를 처음으로 기획한 것으로 유명해졌다. 이 백인천 프로젝트 참가자들을 중심으로 한국야구학회가 성립되었고 첫 회장으로 추대되기도 했다.

  • 비즈볼프로젝트 : 유의미한 스포츠 컨텐츠의 지속적 생산을 목표로 하는 스포츠 리서치 팀. 기존에는 다른 여러 스포츠를 함께 아울렀으나 현재는 야구에 아무래도 무게 중심이 쏠리고 있다. 자체 팟캐스트인 트루볼쇼는 네이버 스포츠 라디오에도 올라오고 있다. 프로젝트 내 멤버들도 야구학회에 자주 참석할 뿐 아니라 자체 컨퍼런스도 개최하고 있다.홈페이지 야구팀이 야구공작소로 분리된 이후 사실상 농구사이트로 탈바꿈한 것은 비밀.

  • 야구공작소 : 비즈볼프로젝트의 야구팀 구성원들이 독립하여 만든 사이트다. 2017년 현재 엠스플뉴스와 일간스포츠를 통해 기사가 송고되고 있고 네이버 라디오 야자수를 방송중이다.

  • 토아일당 Baseball-in-Play.com : 구글에서 검색되는 세이버메트릭스 이론과 개념 정리글 중 이 사람이 쓴 것이 꽤 된다. 개인블로그 뿐 아니라 KBreport, 비즈볼프로젝트, 야구학회 등에서도 활동한다. MLB가 아니라 KBO리그의 데이터를 바탕으로 한 분석이 많은 것이 특징이다. 블로그 페이스북

  • 썩빡꾸 : 한국 최고의 세이버 메트리션 겸 래퍼. 세이버메트릭스에서 주로 타자의 스탯을 가지고 여러 가지 글들을 보여준다. 팬그래프에서 새롭게 제시되는 이론들을 재밌게 소개해준다. 홈페이지

  • Buer : 한국 유일의 의학도 겸 세이버 메트리션. Pecota Projection 에 대해서 이해하고 싶다면 한 번 방문해 보자. 블로그

4.2. 메이저 리그 베이스볼[편집]

  • 네이트 실버(Nate Silver) : 통계학자, PECOTA(페코타) 프로젝션의 창시자 스포츠 중심 포털 '파이브서티에이트(FiveThirtyEight)' 창립자.(출처) 시대의 천재(genius)[19][20]

  • 클레이 데이븐포트(Clay Davenport) : 통계학자, 야구 통계 사이트 '베이스볼 프로스펙터스(Baseball Prospectus)' 설립자이자 Claydavenport.com 의 운영자 출처 KBO선수의 MLB 활약상을 예측하는 Davenport Translation도 볼 수 있다.

  • 빌 제임스(Bill James) : 일명 세이버메트릭스의 아버지.

  • 보러스 매크래컨(Voros McCracken) : BABIPDIPS(FIP) 이론의 최초 발표자.

  • 키스 올버먼(Keith Olbermann)[21] : 방송인, ESPN2 스포츠정보프로그램 '올버먼(Olbermann)' 앵커(2013~현재). 미국 SABR협회 정회원.

  • 키스 울너(Keith Woolner) : 세이버메트릭스의 핵심 그룹 중 하나인 베이스볼프로스펙터스의 필진이었고 2007년 그 즈음의 많은 세이버메트리션들이 그런 것 처럼 MLB구단 프런트 오피스로 들어간다. (클리블랜드 인디언스) 그는 선수평가지표인 VORP( Value Over Replacement Player)를 고안했는데, WAR 과 같은 지표에서 사용하는 대체레벨(replacement level) 개념이 여기에 바탕을 두고 있다.

  • 밥 코스타스(Bob Costas) : 방송인, MLB 네트워크 및 NBC 스포츠캐스터. 친구 올버맨[22]과 함께 SABR 정회원.

  • 톰 탱고(Tom Tango) : TangoTiger라는 닉네임으로 더 유명. 탱고는 세이버메트리션이란 명칭 대신 세이버리스트(Saberist)라 불러달라고 한다. 빌 제임스가 바흐 쯤 된다면, 톰 탱고는 모차르트이자 베토벤이다. wOBA를 비롯해서 WPA, FIP 등 2000년대 이후 가장 널리 사용되는 세이버메트릭스 지표 중 상당수가 그의 작품이다. 또한 탱고의 블로그는 세이버메트리션들의 토론의 장이기도 하다. 2016년에 하던 일을 그만두고 MLBAM으로 이직했다. 그동안도 야구 관련 일을 해오긴 했지만, 이사 문제 등으로 풀타임 제의는 고사해왔다. 이번에는 조건이 딱 맞아떨어졌다고. 이번 일을 맡은 기념으로 야덕 사이트 팬그래프의 수장 데이브 카메론과 톰 탱고의 이메일 인터뷰를 소개한 글인 (인터뷰)톰 탱고: MLB의 새로운 데이터 구루를 만나다도 그를 이해하는데 도움이 될 것이다.

  • 피트 파머(Pete Palmer) : 빌 제임스와 함께 초기 세이버메트릭스의 대표인물. SABR의 초기멤버이기도 하다.


참고로 이들을 포함한 수많은 세이버메트리션들은 상당수가 특정 구단이나 언론사 등에 고용되어 일하고 있다. 업계에서 세이버메트리션들이 가진 가치를 알아주기 시작하면서 덕업일치의 길이 열린 셈인데, 세간에 알려진 WAR 계산법이라던지 역사적 상수 계산법이라던지 등등을 아마추어의 정보력만으로 이들에 준하는 수준으로 섭렵하는 데에는 한계가 있음을 인정하는 것이 스스로의 정신건강에 이로울 것이다. 이들은 단순한 야덕이 아니라 빅리그 구단에게 고액의 페이를 받는, 학계에서 최고로 꼽히는 인재[23]들이다. 이들은 지금도 일개 아마추어 라이트팬들이 생각하지도 못하는 관점에서 DIPSWAR 같은 세이버메트릭스의 히트작들을 까내리며 뜯어고치고 있다. 까놓고 말해, 선수나 코칭스태프들이 부상 숨기고 팀내의 트러블 숨기는 것처럼 세이버메트릭스 업계에서도 영업기밀이 많다. 만약 이 글을 읽는 이가 새로운 발상을 떠올려서 인터넷에 게시했다면, 그리고 그것이 영어로 어째저째 괴수들의 눈과 귀에 들어갔다면, 흔한 천조국 야구팀의 정보요원들에게 납치되어 평생 직장을 얻을 수도 있다. 그 날이 올 거라 믿어 의심치 않는 덕후들은 타인에게 폐가 되지 않는 선에서 몸과 마음을 다하여 재능을 낭비해보자.

4.3. 일본프로야구[편집]

  • ever_17 : NPB Career WAR를 정리한 용자이다. NPB 세이버 스탯에 대한 이야기는 여기서 하자. 블로그

5. 세이버메트릭스 관련 사이트[편집]

5.1. KBO 리그[편집]

  • 스탯티즈 : 한국 세이버메트릭스 관련 사이트 중 가장 유명한 사이트. 2011년 박동희 스탯티즈 논란으로 문을 닫았으나 2015년 10월 다시 문을 열었다. KBO 관련 공개 기록사이트 중 최고 수준의 데이터를 자랑한다.

  • KBO 공식 기록실 : 과거에는 매우 형편없는 편이었으나 2015 시즌부터 그나마 타격 투구는 기록은 연도별 팀별로 공개 되었는데 수비는 2002년부터만 보여준다. 페이지 먹통 현상 등이 많고 인터페이스도 부실하다.

  • 레전드닷컴 : 프로스포츠 통계 전문 업체인 스포츠투아이에서 제공하는 사이트. 사이트운영주체가 프로야구 공식 데이터 제공업체이다 보니 상당히 상세하다. 나오는 정보는 KBO 공식 홈페이지와 거의 동일.

  • 다음 스포츠 : 정보제공을 포기한 네이버와 달리 각팀별 페이지와 선수별 페이지가 있어서 링크 타고 넘어가기 좋다. 현역 선수의 타격 투구 쪽만 간단히 보려면 매우 좋은 사이트. OPS, WHIP 를 볼 수 있다. 다만 사사구(볼넷+힛바이피치볼)란에 볼넷 개수를 적어 놓았다는 심각한 오류가 있다.

  • KBO 공식 안드로이드 앱 : KBO 공식 기록을 담당하는 스포츠 투아이에서 배포. 최초에는 유료앱이었지만 2013년 현재는 무료화. 투수에게 중요한 스탯인 피OPS를 찾아볼 수 있는 유일한 곳. 그리고 스포츠투아이에서 산출하는 war을 kbo앱을 통해 직접 확인할 수 있다.

  • 베이스볼 랩 : 이쪽은 역대 커리어나 역대 리그 통산 기록등을 정리해놓은 사이트. 현재 선수 기록들은 나와있지 않지만 리그별 투고타저 현황이라던지 양준혁의 통산 BABIP, WAR같은 통산 세부스탯들을 공개하고 있다. 참고로 운영진인 이현우는 엠엘비네이션의 운영진이기도 하다. 2015년 하반기부터 제대로 접속이 되지 않고 있다.

  • Ballgraphi : 야구 데이터 시각화 공작실. 2015년 열었으며 여러 야구통계를 그래프 형태로 보여준다. 업데이트가 매일 이루어지지 않는 것이 단점. 여기도 16년 어느 시점부터 접속이 제대로 안 된다.

  • MLB Nation : FreeRedbird 등의 세이버메트릭스 스탯에 대한 칼럼을 읽을 수 있다.

  • 베이스볼-인-플레이 : 다양한 세이버매트릭스 소개하고 "도루는 어느정도 가치가 있나?"같은 양질의 칼럼들이 올라온다. 그리고 2016년 기준 한국에서 유일하게 타구 지점을 일시적이나마 제공하고 있다.

  • 스트존 : KBO 문자중계 데이터를 정리해놓은 사이트. 매일 경기가 끝난 후 업데이트 된다. 2017년 현재 유일하게 스트라이크 존을 확인할 수 있는 사이트.

5.2. 메이저 리그 베이스볼[편집]

  • 베이스볼 레퍼런스 : MLB의 각종 역사와 기록을 가장 일목요연하게 확인할 수 있는 곳. 팬그래프나 Bp 등의 세이버메트릭스 사이트들처럼 통계학 등을 이용해 숨은 내면을 분석하기 보다는 실제 벌어진 '역사, 기록' 그 자체에 더욱 중점을 두는 편. 때문에 투수의 WAR를 (실제 벌어진) 실점, 즉 RA9를 보정한 스탯을 기반으로 측정한다. 역대 MVP, 사이 영 상 순위나 골드글러브, 행크 아론 상 등의 수상 기록, 심지어 역대 드래프트 순위, 출신 학교 등 '기록'이라는 측면에서는 어떤 사이트보다도 충실하다.

  • 팬그래프 : 위에 언급된 베이스볼 레퍼런스나 ESPN, 베이스볼 아메리카 등과 함께 덕후들이 좋아하는 곳. 특히 이 사이트에서는 비록 최근이라 옛날 정보가 부족하긴 하지만 투구 추적 시스템(Pitch F/X)도 도입되었기 때문에 세이버메트리션들 뿐만 아니라 투구 궤적이나 무브먼트 계산 등 여러가지로 야덕후 전반에 걸쳐 유익한 정보들을 많이 접할 수 있다. 또한 수비 데이터 중 가장 신뢰도가 높다고 평가받는 UZR 데이터를 무료로 공개하고 있다.

  • Baseball Prospectus : 최초의 세이버메트릭스 덕후 사이트 중 하나. 상기한 팬그래프나 레퍼런스보다도 더 매니악한 사이트로 여겨진다. VORP와 EqA의 개념을 처음으로 고안해 낸 곳이기도 하다. 2000년대 초반에 세이버메트릭스의 중심지 역할을 하였으나, 스탯의 계산법을 공개하는 경우가 드물고 공개하더라도 유료로 풀어버리는 등 폐쇄성이 문제가 되어 현재는 팬그래프에 완전히 밀려버렸다. 그후 칼럼진을 개편하고, cFIP, DRA 같은 스탯을 야심차게 내놓는 등 재역전을 노리는 중. 포수의 프레이밍 데이터를 제공하며, 이를 WAR에 반영하는 것이 특징.

  • Harball Times : 가장 활발한 토론이 이루어지는 미국 세이버메트릭스 사이트 중 하나. 읽어볼 만한 칼럼이 정말 많다.

  • The Book : 유명 세이버메트리션인 톰 탱고(Tom Tango)가 운영하는 세이버메트릭스 사이트로, 본좌들의 토론을 생생히 지켜볼 수 있다.


다만 해외 사이트들 중에는 연간 일정 금액을 결제해야 고급 정보를 열람할 수 있는 사이트들이 많이 있으니 이용에 있어 유의할 것.

5.3. 일본프로야구[편집]

  • 1.02 ESSENCE OF BASEBALL : 일본의 세이버메트릭스 사이트. 한국의 스포츠투아이와 비슷한 회사인 DELTA라는 스포츠기록전문 업체에서 운영하는 사이트로 2015년 11월에 오픈베타에 들어갔다. 수비 스탯인 UZR와 주루 UBR 데이터까지 공개된다는 점이 큰 장점. 정식 오픈 이후에는 유료제로 전환하여 무료회원은 규정타석/이닝 선수의 기록만 확인이 가능하다.

6. 관련항목[편집]

[1] matrix와 혼동하여 세이버트릭스라고 쓰는 경우가 많은데 metrics이므로 세이버트릭스가 옳은 표기이다.[2] 참고로 농구에도 비슷한 부류의 학파(...)가 있는데, 그 쪽은 APBR메트릭스라 부른다. APBR는 Association for Professional Basketball Research의 약자다. 세이버라는 독음과 달리 간단히 읽기에는 영 좋지 않은 약자다보니 그냥 APBR메트릭스라고만 부르는 모양.[3] 오늘날 통용되는 야구 기록법을 창안한 헨리 채드윅을 기념하여, 야구 연구에 기여한 인물을 대상으로 수여되는 상이다. 2009년에 제정되었다.[4] 흔히들 빌 제임스를 세이버메트릭스의 아버지라 부르지만 빌 제임스는 자기 자신을 세이버메트릭스의 아버지 또는 개척자라 말한 적은 없다. 그거 높은 평가를 받는 이유는 세이버메트릭스라는 용어를 제안했으며 대중성을 확보했기 때문이지, 세이버메트릭스를 처음 만들어서가 아니다. [5] 여기서는 단타 0.41점, 2루타 0.82점 ,3루타 1.06점, 홈런 1.42점[6] 이들은 엄밀히 말하자면 세이버메트릭스 스탯이 아니다.[7] 이는 사실 비유하는 말이지만, 연봉조정 등의 여러 절차나 MLB 사무국에 구단의 횡포를 제소하는 행동을 보면 정말로 법정싸움과 같은 모습이 되고 있다. 또한 MLB에서 활동하는 에이전트들은 대개가 로스쿨을 나와서 변호사 자격증을 갖고 있다. 대표적으로 스캇 보라스.[8] 어지간한 계량경제학이나 게임이론 수준까지 도달했다. 일부 수학자들은 이를 논문의 형태로 학계에 발표하기도 했다.[9] 하일성의 해설을 떠올려 보라. 편안하다고는 할 수 있어도 절대 정확하지는 않다.[10] 세이버메트리션들은 야구 기록 못지않게 야구 역사의 덕후이기도 하다. 일례로 위의 제임스의 경우 Historical Baseball Abstract라는 엄청나게 두꺼운 책에서 120년 간 MLB와 니그로리그를 역사서술의 방법으로 분석했다. 또한 미국의 SABR에서는 동양야구, 19세기 중반 야구, 유니폼의 역사, 야구선수 개개인의 biography 등 통계연구 이외에도 다양한 연구분과를 두고 있다.[11] 그리고 사실 세이버메트릭스를 신뢰하지 않는 사람들 중에는 단지 귀찮아서 세이버메트릭스의 주장을 받아들이지 않는 경우가 상당히 있다. WHIP이나 OPS 등의 단순한 스탯이 성공한 것을 고려하면 더더욱 가능성은 높다.[12] 세이버메트릭스의 성공이라고 하면 일반적으로 오클랜드만 떠올리는데, 오클랜드보다도 많은 영향을 받고 그 이상의 성공을 본게 보스턴이다. 세이버메트릭스에 호의적이던 존 헨리(금융가로서 선물전문가다) 구단주가 취임하면서 제임스를 구단으로 끌어 들였고, 빌리 빈을 거액을 들여 단장직 영입을 시도했으며, 이를 실패하자 엡스타인을 단장으로 임명했다.[13] 출루율의 가격이 오르자 수비를 강화하는 현재의 모습 등은 돈에 좀 더 여유가 있는 오클랜드의 그것과 유사한 상황. 헨리 구단주 이전 보스턴이 마초의 팀에 가까웠던 것을 고려하면 밤비노의 저주를 깬 것도 커트 실링의 레드삭스가 아니라 세이버메트릭스라고 봐도 좋을 정도였다.[14] 에러를 할 수 있는 가장 좋은 방법은 공을 잡을 수 있는 위치에서 공을 잡으려고 시도하는 것이라는 이야기까지 있다. 때문에 세이버메트릭스에서는 초기부터 에러를 클러치 히터로 표현되는 타점과 함께 극도로 불신하는 성향을 보인다.[15] 다만 팀 수비의 경우 DER(수비효율)을 통해 어느 정도 측정이 가능하다. 그런데 이 DER 역시 여러가지 계산법이 있어서 그 방법에 따라 결과가 제각각인 경우가 있다.[16] <The Book>에서 타석에 서는 횟수와 타석에 섰을 때의 상황을 종합해서 낸 결론에 따르면 1번과 2번, 4번이 가장 중요하며 3번과 5번이 그 뒤를 잇는다. 전체적인 타격 능력이 비슷한 경우 출루에 강점을 가진 선수일수록 앞쪽에 놓으면 좋다. 6~9번은 잘 치는 선수일수록 앞에 두면 된다.[17] 한 가지 간과해선 안 되는 사실이 있는데, 세이버메트릭스가 통계인 건 맞지만, 확률과 같은 수많은 데이터를 하나로 집계한 것이 통계이다. 즉, 통계를 내는데 각종 확률들이 통계 안에 들어간다는 것이다. 그리고 안경현은 세이버매트릭스가 고안해 낸 각종 야구의 기록 계산법을 객관적인 통계가 아닌 확률이라는 우연성으로 치부해 버리는 발언 때문에 세이버메트릭스와 이를 잘 이해하는 일부 야구팬들부터 무수한 비판을 받고 있다. 실제 안경현은 현대야구에 뒤쳐진 상당히 구시대적인 야구관을 가지고 있다.[18] 한국프로야구 1세대 세이버메트리션. 참고로, 언급된 기사에 의하면, NC 다이노스는 2014년초에 세이버메트릭스 전담 직원을 채용, 적극적으로 활용중. 같은 기사에서, NC의 라이벌 롯데 자이언츠도, 2013년 최하진 사장 취임과 동시에 '미래혁신TF팀'을 만들어 세이버메트릭스를 적극적으로 활용하려는 작업을 진행중.[19] 스포츠 바깥 영역에서도 놀라운 성과를 냈다. 2008년과 2012년의 미국 대통령 선거 선거인단 배정 예측에서 완벽에 가까운 적중률기록. 다만 2016년 선거 예측은 틀렸다[20] 또한 스포츠 중심 포털이라는 간판답게 파이브서티에이트에서 독자적으로 통계에 기반한 축구 칼럼을 쓰기도 했는데(네이트 실버 본인이 쓴 건 아니고, 소속 필진이 쓴), 몇몇 칼럼이 번역되어 국내 축덕들에게 상당한 관심을 끌기도 했다.[21] 정치 평론가로도 유명하다. 2003년부터 2011년까지 MSNBC에서 <Countdown with Keith Olbermann>이라는 뉴스 평론 프로그램을 본인의 이름을 걸고 진행했었다. 이때 상당히 강성이어서, 빌 오라일리 등으로 대표되는 폭스 뉴스와 대립각을 세웠고, 조지 워커 부시 정부와 08년 대선 당시 공화당 부통령 후보였던 세라 페일린은 올버만에게 두고두고 씹히는 안주거리였다. 유투브에서 검색만 해도 영상이 쏟아질 지경.[22] 올버맨과 코스타스는 1992년부터 1997년까지 ESPN의 레전드 심야 스포츠정보프로그램 'Sportscenter'를 함께 진행했다. 이후 지금도 숨겨왔던 나의 절친.[23] MBA 출신도 많고, 통계학, 컴퓨터 공학, 물리학 같은 이쪽 관련 학문의 석박사 학위를 가진 이들도 부지기수다. 월 스트리트실리콘 밸리에서도 이들을 두고 스카우트 경쟁을 할 정도.