易视角年终特刊-NBA数据发展史

2022年7月27日 by 没有评论

1946年11月1日,纽约尼克斯作客多伦多壮汉队,68比66取胜。这是一切的起点:NBA就此开始——虽然那时候,这联赛还叫做BAA。

那时节,万事草创,NBA一片荒芜。联盟只有十一支球队。没有专机,没有电视直播合同,没有球鞋广告,一个赛季打60场比赛。许多球队得和冰球队共用球场,场地湿滑,篮筐歪斜,球体不规则,甚至都不圆。所以也谈不到大屏幕和数据单。那个赛季,没人统计篮板球,没人统计抢断。盖帽、失误更是无从说起。列入统计的只有以下数据:

投篮出手;投篮命中;罚球出手,罚球命中;助攻;犯规——实际上,那个赛季11支NBA球队,只有三支统计了入场观众人数。就在那场著名的开天辟地创世战里,你只看得到一份手写的模糊的数据单:半场37比29,全场68比66,纽约全场犯规20次,多伦多16次。全场得分首席是多伦多的诺斯特兰德,18分。

你以为到了总决赛规格会高些吗?事实上,1947年总决赛,芝加哥对费城确实保留了每一场比赛的具体统计,但数据统计只算了得分、犯规、投中、罚中四项,没了。当然,还有一些零星的数据统计,比如1947年总决赛第一场,费城103投31中,同时芝加哥129投26中,等等……

1950-51季,一个伟大的变化:篮板球开始被统计了。当然,那时节,NBA依然没有电脑数据库,所以统计全靠手写+收集。但至少,雏形已经有了。

一般公认的是,50年代对助攻的统计有所偏颇。比如,七届助攻王鲍勃·库西职业生涯场均助攻,只有7.5次——要知道,他职业生涯后半段正赶上NBA数据大爆发,作为驾驭过凯尔特人单季场均122分的组织大师,他的助攻未免少了。但你可以这么理解:早年的数据统计比较保守,非要按照“接球后直接投篮得分,传球者才算助攻”的心思来统计,所以漏记了些,也是难免。

50到60年代,数据统计水平,依各球队参差不齐。比如吧,1959年总决赛,波士顿花园主场只统计了得分、投中球、罚球数和犯规,可是明尼阿波利斯湖人队主场就在第三场提供了投篮数、投中数、罚球数、罚中数、犯规数和得分数这相对完备的数据。但也有一些私人统计,比如1959年总决赛虽然没有官方列明,但私人统计却称拉塞尔四场比赛打了186分钟、连续三场篮板超过30个、连续四场都有20个开外的篮板球、贝勒四场比赛投篮合计102次,等等。

如果你对那时代的数据统计感兴趣,那么有一些私人数据可以作证。比如1959年张伯伦与拉塞尔相遇时,根据《SI》的临场报道:张伯伦开场第一球祭出擅长的翻身后仰,被拉塞尔一帽震飞。全场下来,一对一攻,张伯伦只投中四球。但是,张伯伦还是利用下快攻、前场篮板补进、罚球、顺下后接球扣篮,另拿到了30分,全场38分——这在官方数据单里,就是找不到的。

又比如,1967年总决赛,已经有了较完备的统计体系:精确到每个球员的投篮数、投中数、罚球数、罚中数、篮板球、助攻、犯规、得分,都有了周密分析。所以我们知道总决赛第一场瑟蒙德24分31篮板20投10中,里克·巴里43投15中37分8篮板7助攻,而对面张伯伦是8投6中16分33篮板10助攻。但另外有些细节数据值得玩味:比如,总决赛第四场,张伯伦10分27篮板8助攻,而且非官方统计声称他盖了15个帽。另一项非官方统计:当时巴里59个持球回合,只有11次传球。

1973-74季,张伯伦刚退役,NBA就开始统计盖帽数据。于是,拉塞尔和张伯伦那些“单场25次盖帽”、“职业生涯每场都有10次盖帽”,只剩下传说了。同一年,NBA开始统计抢断,杰里·韦斯特在他35岁那年留下了场均2.6抢断,也让人不得不考虑“如果从1960年就开始统计抢断,韦斯特会留下什么样的霸业?”1977-78季,NBA开始统计失误数,大卡车吉尔摩场均4.5失误单季366次失误居首。于是世界传扬的“张伯伦经常单场10失误,加上助攻盖帽得分篮板都凑上五双啦”也只能当笑线年代,三分球加入之后,数据统计基本成了型。

1986-87季开始,NBA每场比赛都有了完备的、准确的个人技术统计框,所以,很长一段时间里,新闻都爱用这字眼:

“自从1986-87赛季有统计以来,这是第N个球员单场打出扒拉扒拉扒拉以下数据……”

换句话说,NBA数据统计,自1951年成个模样,1973年基本完备,80年代成型,1986-87季完成细化。自那以来,NBA的统计正式进入了现代。你可以从官网、BBR等地方,随意找到历史数据。

一如中国人喜欢把评话小说武艺列高低似的,全世界人民也都热中于排高低、列座次,80年代数据完整化之后,伯德、魔术师的拥趸更加有了彼此互掐的论据。但那时节,行内人士对此很谨慎。比如,伟大的红衣主教早1986年就说过:

实际上,红衣主教秉持的是教父时代的哲学。他在60年代让凯尔特人统治世界时,球队里的经理、教练、球探、卡车司机甚至带球员情妇去堕胎,都归他老人家管。他那时节珍视拉塞尔,不是因为他每场能抓22.5篮板送出4.3助攻还有传说中每场两位数封盖,而是“这家伙确实能赢球”。实际上,很长一段时间,球员们都更在乎表现,而非数据。比如1961-62季,张伯伦打出场均50.4分25.7篮板的不朽传奇,但球员们却投票认可拉塞尔成为常规赛MVP。

80年代中期,随着电视转播的兴盛,媒体对NBA的渗透也日益加重,大量的数据引用成了媒体的新爱好。于是,“得分能手”、“强悍的防守者”、“快手”、“投篮大师”这些词汇,逐渐被“每场能得多少分”、“能完成多少个篮板+封盖”、“能完成多少次抢断”等话题覆盖了。

NBA刷数据的惯例古已有之。比如,NBA50大之一杰里·卢卡斯的原话:“威尔特(张伯伦)太在意各种纪录了:比如什么联盟助攻王啊,再比如刷新一次投篮命中率的记录啊。他每次都是刷完一个记录,然后再继续刷下一个。”比如,1978年的4月9日,“天行者”大卫·汤普森想要得分王,于是在常规赛最后一场第一节,砍了活塞32分,让张伯伦1962年3月2日百分之夜的单节31分为之褪色。当晚,他得了73分,直到2006年1月22日科比得81分之前,这是NBA单场第二记录。可是他得完73分的6小时后,他的对手圣安东尼奥马刺的乔治·格文,在对阵新奥尔良爵士的第二节,用他的绕指柔上篮单节得到33分,全场63分,最后挤掉汤普森,得到了1977-78季得分王。

但是到80年代,数据变得更容易了。1984-85季,公牛原来的首席得分手、被新生乔丹挤成二当家的奥兰多·伍尔里奇,就有个坏毛病:每场比赛完了,会去数据统计台要自己的数据看。90年代初,威尔金斯抗议自己进不了梦一队时,就拿自己的华丽得分数据说事。

更重要的是,对大多数球迷来说,他们面临这么个问题:他们没法看每场比赛,只好靠数据来分辨。而数据又是那么少,于是有了以下问题:

后人看数据,会很难理解:年轻时的斯蒂芬·马布里,一个年年场均8助攻以上的人,怎么会被叫做独狼?

后人看数据,会难以想像,布鲁斯·鲍文这个数据平淡无奇,抢断毫不华丽的家伙,防守却远比两届抢断王魔术师强大?

后人又不会明白,为什么杰森·科林斯这种每40分钟才盖一个帽、根本投不进球(一个大个子命中率41%)、每五分钟才抓得到一个篮板的长人,凭什么成为2003年网队的总决赛首发中锋?

后人又怎么能想像,阿马尔·斯塔德迈尔职业生涯场均1.4盖帽8.8篮板、KG在凯尔特人期间也就场均8篮板+1帽,但KG的防守和斯塔德迈尔,那就是水泥和泥水之别?

实际上,因为数据统计太单一了,所以,90年代四大中锋,总是动不动就齐刷刷24分11篮板3盖帽,可是光看数据,你又如何辨清大梦的摇摆、鲨鱼的蛮力、尤因的兔子跳中投和大卫·罗宾逊的面筐晃动风格如此不同?又比如,当2009-10季勒布朗·詹姆斯命中率50.3%三分率33%,科比·布莱恩特命中率46%三分率33%时,我们怎么能让人相信“2009-10季,勒布朗的突破和组织更剽悍,但科比的综合跳投依然比勒布朗出色”这个事实呢?

实际上,早在90年代,许多数据已经开始暗流涌动。球探们之间,各自有成型的数据库。比如,1998年总决赛前,《SI》披露过一份犹他爵士为乔丹做的统计:

就在前一年,迈阿密媒体也俨然泄露天机似的,说帕特·莱利雇有一批数据专员,他们统计乔丹如此之细,说乔丹的后仰跳投里“对手干扰到位情况下,命中率是46%;对手干扰不到位时,命中率是62%”。但类似数据,没有在公开媒体大规模出现过。

2003年,迈克尔·刘易斯先生出版了《金钱球》,里面大量形容了数据对体育运动的重要意义。同时,著名棒球作者比尔·詹姆斯、北卡前教练弗兰克·麦奎利等,都在做这方面的研究。也就在这年,82games网站出现,开始提供细致的一些细化数据。诸如一个球员完成进攻的方式(跳投、近距离进攻、罚球)、在场与否对球队的具体影响、关键时刻的表现,等等。

如今已上任灰熊篮球事务主管的霍林格老师,过去十六年一直在致力于篮球数据发掘。他手创了PER制度——即Player Efficiency Rating(球员效率水准),来统计一个球员的综合效率。虽然这个指标常被批评缺少防守、太过于偏爱投篮好的球员,但比起NBA原先推行过的EFF制度——简单粗暴的得分+篮板+助攻+盖帽+抢断-犯规-失误的算法——要靠谱得多。

随着霍林格先生在ESPN长期从事专栏写作和篮球研究的工作,数据热在网络上如火如荼。hoopdata网站更进一步,开始提供每个球员的投篮细节、传球去向等等。这有什么用呢?嗯,回到刚才“2009-10季,勒布朗的突破和组织更剽悍,但科比的综合跳投依然比勒布朗出色”的问题:

当我们打开投篮分布表,能够发现2009-10季勒布朗每场在篮圈附近的命中率达到73%,但是在3-9英尺的近距离,54%;10到15英尺的中距离投篮,32%;16到23英尺的长距离中投,40%。科比在篮筐周围的命中率只有59%,但在3到9英尺的近距离,46%;10到15英尺的中近距离投篮,50%;16到23英尺的长距离中投,41%。即,科比的中投比勒布朗更出色、投篮范围更大——至少在2009-10季是如此。

21世纪,细节化数据越来越多的被融入球队管理。比如,火箭的达雷尔·莫雷就是个数据狂,他有一套自己独立的数据体系来判断球员好坏,也就是这套体系,会把看似数据不出色的巴蒂尔描述成一个出色的团队球员。比球迷和经理更痴迷数据的,是遍布美国、给天才们塞名片的球探们。他们需要更多更完备的数据,以便更好的评估一个球员。

终于,Synergy Sports(点击查看何为Synergy)出现了。这机构早在1998年由凤凰城太阳前教练加里克·巴尔创立,如今已经扩展到NBA30支球队都使用其产品,来对球员进行细节描述。这可能是当下最细致但也最琐碎的球员数据评估机构了——所以,有些东西,真的只适合专业球探去研究,球迷也就只好看看算了。

你可以说,在80年代的统计数据下,许多东西无法展示。比如,卡尔·马龙晚年用面筐跳投拿下的25分10篮板和三年级时的强冲篮下卖肌肉25分10篮板有多大的不同;比如,迈克尔·乔丹1996年用背身后仰和面筐技巧拿下的30分和1987年用无球游走、上篮、扣篮、中近距离抛射拿到30分有何天差地别;比如,斯托克顿如何用传球拯救了一个又一个的东尼·马绍尔,他的单场9次助攻和凯文·约翰逊的单场9次助攻是多么不一样……但现在,我们也能够逐渐的用数据来说明细节。比如,1955年,你可能查到:“鲍勃·佩蒂本场得到26分18篮板3助攻。”在1985年,你可能看到“拉里·伯德本场上场42分钟25秒,21投11中三分球5投3中罚球11罚10中得到35分,抓到10个篮板包括2个前场篮板,送出5次助攻,失误4次,犯规3次,封盖1次抢断1次。”在2012年,你可以从一个数据网站看到:

“凯文·杜兰特本场上场42分钟25秒,21投11中其中6球来自队友助攻,21次出手中包括5记三分球、5记16-23尺中投、4记10到15尺中投、4记3到9尺中投、3次上篮;他的3次助攻有2次助攻了队友的三分球,另有一次助攻篮下。他的4次失误包括2次传球被断、1次运球被断和1次进攻犯规。”

“凯文·杜兰特本场上场42分钟25秒,具体分布为,第一节开场至结尾,第二节余9分1秒时上场至半场结束,第三节开场至结尾,第四节余9分34秒时上场至第四节结束。

合计出手21次,其中第一次出手空间坐标为:球场长207,宽8,高282。第二次出手空间坐标为XXX、XXX、XXX,第三次出手空间坐标为XXX、XXX、XXX……

为队友做掩护合计18次,包括6次原地对球掩护、8次无球掩护、4次假掩护……其中挡人有效7次,无效10次,犯规1次……

篮板球7个,其中前场篮板球2个,起跳抓到者6个,其中2个前场篮板都是起跳后抓到;第一个篮板球到手空间坐标为XXX、XXX、XXX……

合计拍球102下,其中运球过腰77下,运球在腰下25下,运球在膝高度8下……

合计跑动距离为XXX米,其中踱步距离为XXX米,半速跑动距离为XXX米,全速跑动距离为XXX米。加速弧线跑距离为……

到时候,你点开一条新闻评论、一个篮球论坛、一个专家圆桌会议,将听到的不再是“我不喜欢约翰·沃尔的原因是,他的投篮技巧还不过关,他的对球防守也还太倾向赌博”。

而将是:“如果你喜欢约翰·沃尔,那我得提醒你,他上一场的投篮选择如下:运球一步后投篮6次,未摆脱中投5次,其中4次在23英尺之外,具体分布请看图。而在他防守时,为了断球不惜4次让身体倾斜重心超过30度,他的防守前步与对手肩膀平行线次超过警戒线……”

谁知道呢?以霍林格老师这样的媒体数据魔王进入NBA球队管理层开始,2012年也许是数据真正参与NBA与篮球技战术发展的起点。

Leave a Comment

您的电子邮箱地址不会被公开。