NFL: Pythagoriaanse Verwachting & Terugblik

De Pythagoriaanse Verwachting
Stats. Elke Amerikaanse sport heeft zijn specifieke stats, en commentatoren en fans smullen ervan als nergens anders. In geen enkele andere sport zit het meer ingebakken dan in honkbal, dus het mag niet verwonderen dat mijn favoriete stat daar geboren is: De Pythagoriaanse Verwachting.

Elk jaar maak ik daar een post over voor de NFL-fans in ons eigen topic. Het is een beetje voer voor gevorderden, en er zullen vast en zeker nog andere artikels komen die toegankelijker zijn. Maar omdat het zo actueel is, wilde ik het toch niet laten liggen.

Maar misschien is een eerste artikel over de NFL wel een mooi moment om nog eens even scherp te stellen wat die wiskundige schone precies inhoudt:

Het is een formule die aangeeft hoeveel wedstrijden je team had “moeten” winnen volgens de Points For en Points Against gedurende een seizoen. Als je dat getal dan vergelijkt met de echte wins en losses, zie je hoeveel geluk of pech je team heeft gehad. En als je dàt weet, weet je ook hoe herhaalbaar het resultaat is.

Op zich is het een heel simpele formule:
knipsel1.jpg


Je ziet meteen waarom de formule 'pythagoriaans' genoemd wordt: Die stelling kennen we allemaal nog als c² = a² + b². De getallen na de komma in de machten zijn later toegevoegd om een juister resultaat te krijgen.

Wat is een goede score?
De bedoeling is om uit de breuk een getal zo dicht mogelijk bij 1 te krijgen, wat een win ratio van 100% zou zijn. En dan maal 16 voor het aantal wedstrijden. Als je de formule invult, zie je snel dat er eigenlijk twee manieren zijn om tot dat resultaat te komen:
  • Als je de tegenstander niet laat scoren, heb je 0 Points Against. Dan deel je Poinst For door Points For, en kom je op 1. Een shutdown defense.
  • Je kunt ook zo veel scoren in een seizoen dat de Points Against irrelevant worden. De Falcons-in-2016-methode (of de Saints-sinds-2005).

Of natuurlijk een beetje van de twee. De formule houdt dus rekening met de defense en de offense. Het mooie is dus dat alles erin vervat zit: Een slechte quaterback, een goeie defense, turnovers… Zonder dat er eentje zo hard overheerst dat de formule onbruikbaar wordt. QBR is een mooie stat, maar heeft grote gaten, niet in het minst dat het wedstrijdresultaat plots veel minder belangrijk wordt dan nutteloze completions. Dat is hier niet. Het aansluiten bij de werkelijkheid is wat ze zo mooi maakt.

Vooral het "te verwachten" aantal wins is daarbij een heel goeie indicator. Football Outsiders gebruikt de metric al heel lang. En als je naar het "te verwachten" aantal wins kijkt van teams, heeft dat aantal van 1988 tot 2004 11 van de 16 Super Bowl-winnaars correct voorspeld.

De gaten
Zijn er dan geen nadelen? Uiteraard wel. Strength of schedule is een gapend gat hierin. Net als garbage time points. Teams die een nieuwe QB of HC/OC hebben, zullen ook meestal onderpresteren. Wie een nieuwe superster draft, kan het jaar ervoor dan wel overgepresteerd hebben, maar dan zal misschien toch de weerbots uitblijven.

Terugkijken op de voorspellingen
De sappigste, en veruit plezantste, toepassing van de formule is wel voorspellingen maken. En nu je weet wat er allemaal achter zit, kunnen we die van vorig jaar eindelijk onder de loep nemen! Vanaf nu laten we de wiskunde varen en gaan we vol voor de Madame Soleil-kant van het geheel. Geef me je handen en sluit de ogen. Dit waren de voorspellingen voor 2020:

Pyth2020.JPG


Het is wel grappig om vooral de sprong van de Buccaneers zo duidelijk te zien. Het jaar ervoor hadden ze 5 wedstrijden gewonnen, wat 2 wedstrijden minder was dan je zou kunnen verwachten met hun puntentotaal. De formule gaf ook aan dat de Ravens er opnieuw zouden staan, hoewel dat zeker in het begin van het jaar toch betwijfeld werd. Alleen jammer dat de 9ers en Giants zo zwaar geraakt zijn door blessures.

De Packers had ik vorig jaar getipt als voornaamste ‘winnaar’ van de tabel, omdat zij net een nieuwe HC hadden en een nieuw systeem. Voor de Jets gold het omgekeerde: Die te verwachten verbetering kon je op voorhand al uitsluiten omdat Gase de coach ging blijven.

En wie vorig jaar goed heeft gekeken -mij is het ontgaan- had de playoff run van Trubisky zien aankomen. Het team dat in 2019 de playoffs niet haalde met 12-4, zou volgens deze tabel niet zo'n grote terugval kennen. En hoewel die er wel was, zaten ze nu wel in de playoffs. Net.

In het rood staan de overpresteerders van het jaar ervoor, van wie je een terugval kon verwachten. Opnieuw een correcte voorspelling voor de Rams, die hebben er 3 minder gewonnen dit jaar. Bij de Saints zat het er wel stevig naast, die bleken toch nog beter te kunnen! De Bills kwamen daarentegen heel onverwacht uit de hoek. Die hadden al maar 6 wins, en dat was dan nog te veel volgens de formule. Bleek toch anders uit te pakken.

Volgende keer is het tijd om veel te vroege voorspellingen te maken. Dan lichten we de tabel van 2021 toe en trekken we verrassende conclusies over dit jaar en volgend jaar.

Welk team heeft jullie het meest verrast dit jaar? En hoe hebben jullie het bizarre covidseizoen beleefd?

Bronnen:
https://www.footballoutsiders.com/stat-analysis/2017/presenting-adjusted-pythagorean-theorem
Bill Barnwell bij ESPN doet het ook elk jaar: https://www.espn.com/nfl/story/_/id...improve-2020-why-cowboys-lions-win-more-games
 
Laatst bewerkt:
Terug
Bovenaan