虎牙直播
Icon header

足球数据确实很重要,但是……

    德甲



“基米希本场比赛传球/成功传球115/103,还有4次关键传球,是球队的攻防枢纽。

“基米希几乎没有帮助到球队的推进,简直是球队的进攻刹车片。” NBA直播

类似的分歧在足球讨论中并不罕见:一方依据数据得出判断,另一方则基于比赛观感给出结论。这种分歧并非偶然,而是触及到人类认识世界的两种基本方式——量化与质化。在社会科学中,量化研究依赖数字与统计,对现象进行抽象与归纳;质化研究则强调情境、过程与意义的理解。二者相辅相成,构成了我们认知世界的方式

其实,我们一直都在带着直觉,以质化的视角看待足球——教练员的经验往往是球队最为宝贵的财富,阅球无数的老球迷往往可以在不经意间嗅到球场上的危机。但现在,足球数据早已飞入寻常百姓家,为球迷们带来全新的观赛视角。以OPTA为代表的数据机构,正在不断地向我们呈现各式各样的数据与事实,帮助我们回顾过往并展望未来,更深入地了解球员表现。在这样的条件下,你可以轻轻松松地查看到各式各样的数据:无论是最基础的进球、助攻还是更加新潮的失误导致丢球与预期进球/助攻,甚至是即将到来的里程碑/被触发的尴尬纪录,都逃不出数据公司的手心。

目前的体育研究中,量化研究已经是不折不扣的核心驱动力。我们也需要承认,数据之于足球分析确实有着很多非常显著的优点:首先它直观易读,这使得我们可以在最短的时间内获得最多的有效信息;其次它似乎是客观科学的,数据体系本质上是一套可重复、可验证的标准化体系,许多结论可以在其中被验证与反推;最后,数据更是开辟了新的视角,让决策者拥有更全面的证据支撑。

从世纪之初的“仰望棒球”,再到如今的自成一派,足球数据分析正在大步走向新世代足球的舞台中央。然而,正是在这种看似理性的进步中,问题却开始显现。

数据并没有我们想象的那样完美

尽管数据体系日趋丰富完善,但其局限性同样不可忽视。

目前,足球数据类型越来越多,也越来越高维,但目前球迷与媒体机构能接触到的数据,大多都是事件型数据(如射门、传球、抢断等等)。而到了更多有关身体机能、生理指标的数据,俱乐部方抑或是数据公司并不愿将这一部分的黑箱打开,这也意味着,大多数人实际能接触到的数据其实非常有限。而哪怕得到了更多的、更高维度的数据,我们也无法通过数据去归纳一切元素与场景——数据无法量化球员们单个动作的质量、拼抢过程中的消耗,无球的跑动,也就更别提球员之间的联动、队伍的士气、球场内球迷们的助威加持、球场外的舆论等等更复杂的问题了。也难怪,当中国队攻破日本队球门时,穿裆过掉远藤航的谢文能、送出精妙直塞的韦世豪、完成最后一击的林良铭会被大家记住,但拉开居中防守球员的徐皓阳却几乎被所有人遗忘。

和大多数人的愿景一样,我自然希望数据分析体系可以不断迭代、趋向完美,但至少在可预见的未来内,数据分析之于足球,仍然会有着结构性的领域无法触及,这也是数据存在的本质性问题。这是因为从根本上看,足球比赛中的内容也远非个体行为的简单叠加,而是一个高度复杂的系统。22名球员在动态环境中持续互动,产生大量的、不能以线性方式计算的结果。在这种情况下,将比赛拆解为离散事件,必然会损失其整体性。

此外,抛开数据的“全面性”迷思,我们也要去探讨:数据是否真的具有绝对的客观性?

或许数据真的可以完全记录客观发生的事实,但很大程度上,数据是被我们去定义的:什么是“关键传球”?什么是“高强度跑”?什么是“成功压迫”?这些归根到底都是被相关人士主观判定、筛选、建构出来的,并非对现实的完全映射。因此,我们看到的数据是:

被挑选出来的数据

被认为更重要的数据

更显著的数据

而在足球场上另一边,也会存在:

被忽视掉的数据

被认为不那么重要的数据

更不起眼的数据

当然,数据统计上的“成功”并不一定能反映一个球员的真实情况,反之亦然——一个中场球员传球成功率高,反而可能是因为他无法送出破线传球,进而转向更为安全的处理;一个后卫解围数量很多,也有可能是因为他在对抗下没有办法更合理地处理球或控制球权;同样是1.0的XG,由5次0.2组成的1.0与20个0.05组成的1.0虽然有着“同样”的数值,但在实际的场面上与效果上却是天壤之别,更别提产生这些XG的进攻事件后,球队在不同的场景下的消耗与代价是什么。

让我们再引入这样的一个“场景”:2026赛季中超第四轮青岛海牛主场对阵河南队的比赛中,青岛海牛队的斯特兰德贝里5次对抗全部失败,但本场比赛中,他的一次“失败对抗”却造成了球队的成功转换——在斯特兰德贝里的压迫下,河南队中卫虽然赢得了对抗,但是他动作变形后顶出的二点球却被海牛队后排球员收下,海牛队在此之后立刻推动反击,最终攻入制胜球。在一些场景里,数据上被体现出的“对抗失败”或“失误”反而可能对于球队不是坏事。

所以,不难看出,当我们脱离具体场景去解读数据时,数据很有可能是有欺骗性的。或许,这也能够部分解释为什么人们会对0进球的世界杯冠军中锋吉鲁指指点点、为什么被纳格尔斯曼誉为“统计数据上最好”的德国左边后卫米特尔施泰特被纳格尔斯曼逐渐放弃,但后者还是继续相信多次“错失绝佳机会”的哈弗茨、为什么哲凯赖什在欧冠半决赛中仅仅获得5.9的评分却收获了好评、为什么在0-3惨败利物浦后,滕哈格可以拍着胸脯信誓旦旦地说“从XG上看,我们的丢球没那么多”……

正如足球评论员贺宇所指出:“足球里几乎没有可以完全重复的场景,每个攻防回合前后的累积影响是完全的非线性、混沌系统。用常见的notational analysis(符号分析,即通过构建一套符号系统进行量化分析),往往会得出大量与事实相反的结论;哪怕增加参考系、引入高阶数据,目前依然有‘盲人摸象’之感。”而运动表现科学家黄展煜也表示:“无法深刻进行‘情境化分析’,依旧是当前足球运动表现分析的痛点。传统分析仍倾向于基于还原论的标注方法,忽略情境信息的重要性,也缺乏对其进行系统化提取的能力。” 目前,数据可以有效描述比赛结果,但在解释其生成过程时,仍然不可避免地受到情境缺失的限制。

基于此,我们需要承认:足球数据本身具有极高的重要性,但在当前阶段仍不具备决定性意义。在肯定数据能够带来更多信息与全新视角的同时,也应明确——一切分析都应以“人”为核心,从具体场景出发,再回归到场景之中。因此,我们更需要反思的,不只是数据本身,而是我们究竟如何使用数据并帮助我们理解足球。 篮球直播

在数据的不完美后

我们自然可以责备数据、责备AI、责备技术,不过,这样做显然不可能触及问题的核心,而数据分析本身也从来都不是问题的根源。如果说数据本身的局限还只是技术问题,那么真正让问题变得尖锐的,是数据是如何被使用的。

在现代职业足球中,俱乐部越来越以“组织效率”和“投资回报”为导向运作。球员被视为资产,比赛被视为产品,而数据则成为连接两者的重要工具。当“效率”“回报”“可量化”成为主导原则时,那些难以被量化的内容——球员的牺牲、体系中的无形价值、比赛中的偶然性——便会被系统性忽视。此时此刻,数据已被完全嵌入进了一套以效率与回报为核心的制度逻辑之中。

可是,在足球场内,球员不是足球经理游戏里1-20的数值,不是对战游戏里各式各样的卡片,更不是战术板上毫无特点的棋子,他们是有血有肉、有独立想法的人。他们在比赛中对抗、拼抢、发挥技术,试图拼下每一场比赛。可是,当球员们从踏上球场的那一刻开始,便不得不面对消耗,而当消耗积累到一定程度,球员们就会技术变形、抽筋倒地甚至负伤离场。

而在球场外,我们需要考虑的东西就要更多了。更衣室内球员们有自己的斗争;球迷们希望球队不仅能赢,还要漂亮地赢;赞助商与品牌方期待一个接一个的绿茵英雄可以横空出世;管理层希望球队可以“良性”发展,实现盈利。多方的欲望正在以不合理的膨胀,尽如人意正变得越来越难。

不妨想象一下,你是2025年夏天的斯洛特。你带的队伍里还留有克洛普时代的遗产,你的球迷们也期望你延续着克洛普时代的风骨。上一个赛季,你做到了,尽管跑动数据有所下降,但你还是带队拿下了冠军。可是,悄然之间一年已过,你不得不面对这样的事实:萨拉赫、罗伯逊与范戴克又老一岁,而见证到你执教能力的高层又为你献上了一份大礼:维尔茨,一位看起来最有潜力、最受主流市场青睐的攻击型中场。虽然你没有带过他,但是他看起来似乎还不错:跑动数据突出、进攻数据亮眼,是个不错的球员。但维尔茨终究不能像他的前辈红箭三侠一般善于对抗、勤于肉搏、攻防一体,而红箭三侠的最后一位遗珠萨拉赫也已经到了33岁,不能再像自己年轻时一般参与比赛了。可是这两位确实有着非常大的曝光量,在一切接近完蛋之前,你不得不在阵容中给这两个人留出两个位置,但其他的位置,就需要做出巨大的牺牲。之后,球队斥巨资引进了凯尔凯兹、弗林蓬,希望这两位飞翼可以从后场带来更多的活力,但他们的状态不能持续,你甚至不惜将同样杰出且更具全面性的中场索博斯洛伊拉到了边后卫的位置上;维尔茨的作业环境需要突前的中锋,且这个中锋需要分担他的防守压力,于是球队又花了近两亿买入了埃基蒂克与伊萨克。但是,左边锋的位置还需要填补,你很清楚这个位置谁来担任最合适,他叫路易斯-迪亚斯,可因为俱乐部不愿意为他的童工合同再填一些报酬,他最终远走慕尼黑。就这样,你带着一份看似豪华,实则蹩脚的阵容,四大皆空,而球队花重金引进的伊萨克与埃基蒂克由于在短时间内吃到了过多的消耗分别遭遇了腓骨骨折与跟腱重伤。

几乎所有人都会指责斯洛特:不懂利用资源,手握一批数据表现出众的球星,却反而带不好这支球队。但那些球队的经营者或许始终没有真正明白,足球首先是一项“人的运动”,而不是管理层借助 Moneyball 模型,邀请数据分析师用 AI 和算法简单“跑一遍”,就能得出最优解的模型计算。

或许,他们从一开始就未曾认真思考,如何以“人”为本去理解和运作足球。而这一点,也并非毫无征兆——清湖资本下的切尔西在每个夏窗都会对阵容的大规模重组;欧超联赛一度逼近现实;球员赛程不断被压缩与拉长;为了拓展商业空间,美加墨世界杯甚至引入强制补水时间。这些变化背后,共同指向一种趋势:经营球队正越来越被视为一次投资行为,而有血有肉的球员,也在无形中被转化为可被管理与交易的资产。从这样的“类金融”视角出发,强调数据分析,似乎也就变得顺理成章。

至于数据分析本身,其重要性毋庸置疑。但当它可以被用来遮蔽某些问题并助推某些非体育性的目的时,它的重要性反而不再是问题的关键。真正值得警惕的,是当资本试图以自身逻辑取代足球规律时,它所侵蚀的,不只是这项运动本身,也包括其赖以存在的价值基础。而我们能做的,或许只能像切尔西球迷会一般,吟诗几首。

当足球被不断转化为可以计算与控制的对象时,我们或许获得了更多答案,却也可能正在失去那些让足球值得被观看的理由——

如果一切都可以被计算,足球之于我们还那么重要吗?


上一篇:暂无

下一篇:暂无