#onf[超话]##ONF[超话]##金晓珍[超话]##HYOJIN# ✨#李昌润[超话]##E-TION# ✨#李昇俊[超话]##J-US# ✨#沈宰营[超话]##wyatt[超话]#✨#朴珉均[超话]##MK# ✨#水口裕斗[超话]##YUTO##U#
[211204 HanteoNews更新]
[日间排名:12月3日]#ONF(@ wm_on7off)的"#Goosebumps"第一名
#HanteoChart #ONF @ WM_ONOFF
查看全文hanteo news.com/ko/article/bot…
[211204 HanteoNews更新]
[日间排名:12月3日]#ONF(@ wm_on7off)的"#Goosebumps"第一名
#HanteoChart #ONF @ WM_ONOFF
查看全文hanteo news.com/ko/article/bot…
回答一个私信问题(见附图1),鉴于还有其他人也问过,所以详细发一条。
首先是关于事实的两个问题。
RAPTOR和其他以RAPM为基础的PM模型一样,都是用的多年份RAPM为回归目标,肯定不是单年份RAPM。
RAPTOR的boxscore成分要大于onoff,538认为相对来说onoff中的噪音要更多。
其次是关于对这个模型的评价。
这类使用了onoff数据的PM模型最大的优点是它们捕捉结果,以球员在场的最终效果为准,以此带来的好处是能涵盖那些“数据无法体现的作用”,但这个优点同时也带了一个致命缺点,就是他不具备可解释性。这也是为什么球队内部可能对这类数兴致了了。
所以我们来评价这类模型的时候也会有相同的困惑,假如某球员的数据和我们的主观感受差异很大,我们无法明确这其中的原因。很多人采取的方式就是“不符合我看法的数据就是离谱”。这种“离谱”的频率构成了我们对这类模型的评价。
我之前给出过一条关于各类一体化数据的算法差异和个人推荐度的微博(结论见附图2)。推荐度不等同于评价,但可以近似理解吧。我也声明过我可能不能清楚地解释为什么更推荐哪个,也不一定对。但是还是借此机会简单讲一些我的推荐逻辑。
对于一个数据模型的评价,我想主要是两种方式。
一是从方法而论,就是我们从模型采用的算法思路,使用的数据源来进行判断。
比如BPM基于多年份的RAPM进行回归计算得出了各项boxscore的权重系数,而上一代模型PER则带有更多的建模者“有依据的”个人判断。相对来说,我们会更相信前者代表着篮球的意志,具备算法思路上的先进性。
再比如LEBRON相对BPM采用了lineup和onoff数据,这当然会增加它在防守端的可信度。
但由于这些新兴的PM模型,无论是EPM还是RAPTOR,都有许多未公开的细节,所以从方法而论并不能完全回答我们的问题。
二是从结果而论,简单来讲,就是它给出的球员评价准不准。
这种方式中我们更常用的可能就是前面说的,和自己的主观判断是否吻合。我在考虑推荐度的时候尽量选择避免这种做法。因为如果我们只是遵从与是否符合自己的印象,那和不看这个数据的区别很大么?
但也可以是数据的事情让数据自己解决。比如把数据回代到当赛季的lineup数据中,看看结果和实际净胜分的误差。这种做法实际在建模决定一些参数时就会用到。到了评价阶段其实已经不能用了,建模者一定是已经拿出了误差最小的版本。更有建设性的做法是进行回溯性研究,比如把19-20赛季的结果按照20-21赛季的各队球员名单和出场时间进行模拟,计算一个基于数据模型的球队胜场和20-21赛季的实际情况进行比较。把这个误差作为评判模型准确性的指标。由于这类模型都带有一定的预测性质,所以这其实就是对模型是否达到设计初衷的考察,其结果也非常有说服力。
创建这些数据模型的专家之间进行了很多这种形式的讨论和评估,就结果来看RAPTOR显然逊于EPM和LEBRON,在不同细节的评估中优于或大体相当于BPM和PIPM的表现。
所以我不会把RAPTOR置于高于EPM和LEBRON的位置,但基于它的数据源和算法思路,我觉得它不应该低于BPM和PIPM。
另外一个有别于上述提到的所有方式的评估方式是参考那些值得信赖的数据专家的评价,比如EPM最近两年得到了很多专家的首肯,而新版RPM几乎沦落为没人看的数据。我在这里参考了这篇文章https://t.cn/A6Mwc6wI,Hoopshype采访了29名相关领域的媒体人士和球队分析人员,同样把RAPTOR置于高于BPM但低于EPM和LEBRON的位置。所以我想这是一个合适的评价。
首先是关于事实的两个问题。
RAPTOR和其他以RAPM为基础的PM模型一样,都是用的多年份RAPM为回归目标,肯定不是单年份RAPM。
RAPTOR的boxscore成分要大于onoff,538认为相对来说onoff中的噪音要更多。
其次是关于对这个模型的评价。
这类使用了onoff数据的PM模型最大的优点是它们捕捉结果,以球员在场的最终效果为准,以此带来的好处是能涵盖那些“数据无法体现的作用”,但这个优点同时也带了一个致命缺点,就是他不具备可解释性。这也是为什么球队内部可能对这类数兴致了了。
所以我们来评价这类模型的时候也会有相同的困惑,假如某球员的数据和我们的主观感受差异很大,我们无法明确这其中的原因。很多人采取的方式就是“不符合我看法的数据就是离谱”。这种“离谱”的频率构成了我们对这类模型的评价。
我之前给出过一条关于各类一体化数据的算法差异和个人推荐度的微博(结论见附图2)。推荐度不等同于评价,但可以近似理解吧。我也声明过我可能不能清楚地解释为什么更推荐哪个,也不一定对。但是还是借此机会简单讲一些我的推荐逻辑。
对于一个数据模型的评价,我想主要是两种方式。
一是从方法而论,就是我们从模型采用的算法思路,使用的数据源来进行判断。
比如BPM基于多年份的RAPM进行回归计算得出了各项boxscore的权重系数,而上一代模型PER则带有更多的建模者“有依据的”个人判断。相对来说,我们会更相信前者代表着篮球的意志,具备算法思路上的先进性。
再比如LEBRON相对BPM采用了lineup和onoff数据,这当然会增加它在防守端的可信度。
但由于这些新兴的PM模型,无论是EPM还是RAPTOR,都有许多未公开的细节,所以从方法而论并不能完全回答我们的问题。
二是从结果而论,简单来讲,就是它给出的球员评价准不准。
这种方式中我们更常用的可能就是前面说的,和自己的主观判断是否吻合。我在考虑推荐度的时候尽量选择避免这种做法。因为如果我们只是遵从与是否符合自己的印象,那和不看这个数据的区别很大么?
但也可以是数据的事情让数据自己解决。比如把数据回代到当赛季的lineup数据中,看看结果和实际净胜分的误差。这种做法实际在建模决定一些参数时就会用到。到了评价阶段其实已经不能用了,建模者一定是已经拿出了误差最小的版本。更有建设性的做法是进行回溯性研究,比如把19-20赛季的结果按照20-21赛季的各队球员名单和出场时间进行模拟,计算一个基于数据模型的球队胜场和20-21赛季的实际情况进行比较。把这个误差作为评判模型准确性的指标。由于这类模型都带有一定的预测性质,所以这其实就是对模型是否达到设计初衷的考察,其结果也非常有说服力。
创建这些数据模型的专家之间进行了很多这种形式的讨论和评估,就结果来看RAPTOR显然逊于EPM和LEBRON,在不同细节的评估中优于或大体相当于BPM和PIPM的表现。
所以我不会把RAPTOR置于高于EPM和LEBRON的位置,但基于它的数据源和算法思路,我觉得它不应该低于BPM和PIPM。
另外一个有别于上述提到的所有方式的评估方式是参考那些值得信赖的数据专家的评价,比如EPM最近两年得到了很多专家的首肯,而新版RPM几乎沦落为没人看的数据。我在这里参考了这篇文章https://t.cn/A6Mwc6wI,Hoopshype采访了29名相关领域的媒体人士和球队分析人员,同样把RAPTOR置于高于BPM但低于EPM和LEBRON的位置。所以我想这是一个合适的评价。
#onf[超话]##ONF[超话]##金晓珍[超话]##HYOJIN# ✨#李昌润[超话]##E-TION# ✨#李昇俊[超话]##J-US# ✨#沈宰营[超话]##wyatt[超话]#✨#朴珉均[超话]##MK# ✨#水口裕斗[超话]##YUTO##U#
[211129 FungoStudio更新]
正在渡过糟糕星期一的FUSE要加油啊 给大家再带来了几张照片星期三晚上8点 SuperFinger ONF初放❤️#ONF #太可爱了 #Goosebumps #小机灵
@ wm_on7off @ WM_ONOFF
@WM_ONF fighting
[211129 FungoStudio更新]
正在渡过糟糕星期一的FUSE要加油啊 给大家再带来了几张照片星期三晚上8点 SuperFinger ONF初放❤️#ONF #太可爱了 #Goosebumps #小机灵
@ wm_on7off @ WM_ONOFF
@WM_ONF fighting
✋热门推荐