Wir haben schon ewig kein herausragendes Spiel mehr ausgezeichnet, auch weil wir eigentlich keine Prädikate mehr vergeben. Hitster verdient aber eine Ausnahme, denn seit knapp zwei Jahren düsen wir von einer Hitsterrunde zur nächsten. Wir lauschten den originalen Klängen, groovten zu den Guilty Pleasures nach und summten zu den Summer Hits. Einmal wagten wir uns sogar an die Schlagerparade. Schmerzlich vermissen wir aber die Opern- und Konzert-Edition. Vermutlich wird dies aber nie erscheinen. Jetzt spielen wir aktuell die Soundtrackerweiterung sowie die BR1-Variante.
Wir spielen Hitster ausschließlich kooperativ. Ein Lied wird gescannt. Ein Lied wird diskutiert. Ein Lied wird einsortiert. Erinnerungen werden ausgetauscht und ein weiteres Lied wird ins Rennen geschickt. Unser bisheriger Rekord ist, wenn ich mich recht entsinne, so um die 60 richtig sortierten Hits. Das war aber eine extreme Ausnahme in einer großen generationenübergreifenden, musikaffinen Gruppe. Typischerweise liegen gute Ergebnisse zwischen 20 und 30, wie zum Beispiel hier:
Kürzlich – um ehrlich zu sein, schon vor einiger Zeit – wunderte ich mich während einer Hitster Session, ob es eine praktische Grenze für Highscore gibt. Das Problem sah zunächst einfach aus: Wenn immer mehr Lieder ausliegen, gibt es kaum noch größere Lücken. Also führen auch kleine Fehler zum Verlust eines Chips. Es gilt also, „nur“ die Entwicklung der Jahresverteilung zu studieren.
Viele Wochen, viele beschmierte Notizblätter und einige Python-Scripts später kam ich endlich zu einem, zumindest für mich, plausibel klingendem Ergebnis. Das Schöne an ihm ist, dass er auch einfach klingt und ich deshalb die komplizierten Details weglassen kann. Das zugrundeliegende Modell ist rudimentär und ich mache mehr als eine haarsträubende Annahme. Für grobe Abschätzungen sollte das Ergebnis aber gut genug sein.
Ernsthafte Turnierspielende knacken Hitster natürlich mit einer Brute-Force Strategie: Einfach die Muster aller QR-Codes und deren zugehörigen Jahreszahlen auswendig lernen und schon lässt es sich ewig hitstern.
Wer darauf keine Lust hat, könnte versuchen, einfach blind Tipps zu geben. Das funktioniert jedoch unerwartet schlecht. Nehmen wir an, es liegen schon einige wenige Jahreskarten aus. Dann entspricht die Wahrscheinlichkeit, einen Hit zufällig richtig zuzuordnen, grob der Größe seiner zugehörigen Lücke zwischen dem nächsten jüngeren und vorherigen älter ausliegendem Hit:
P(auf Lücke wird getippt) = Lückenbreite/Anzahl in Hitster enthaltenen Jahre
Hier braucht es eine erste Annahme über Hitster: Die meisten enthaltenen Hits liegen zwischen 1960 und 2020, also in einem 60-Jahres-Intervall. Innerhalb dieser 60 Jahre gehe ich von einer Gleichverteilung der Hits aus, sonst wird die Situation sehr unübersichtlich. Ich verfolgte einige Zeit die Annahme, dass die Intervallbreite der konkreten Ausgabe einen bedeutenden Einfluss auf die Ratestatistik hat. In den jüngsten Überlegungen fällt sie aber nicht mehr sonderlich ins Gewicht.
In welcher Lücke ein Hit liegt, ist zunächst zufällig. Aus der Gleichverteilungsannahme folgt, dass die Wahrscheinlichkeit wieder proportional zur Lückenbreite ist:
P(Hit liegt in Lücke) = Lückenbreite/Anzahl in Hitster enthaltenen Jahre.
Die beiden Wahrscheinlichkeiten, dass ein Hit in einer Lücke liegt, sowie die, dass blind auf eine Lücke geraten wird, sind also gleich.
Damit das Glücksraten erfolgreich ist, muss sowohl der Hit als auch der Tipp die gleiche Lücke haben. Vergleichbar ist dies mit der Aufgabe, die gleiche Zahl zu würfeln, die ein anderer Würfel zufällig vorgibt, d. h. wie wahrscheinlich ist es, einen Pasch zu würfeln? Oder: Die Wahrscheinlichkeiten werden pro Lücke multipliziert und dann addiert:
P(glücklich raten) = ∑(P(Lücke)P(Lücke)=∑Lückenbreite2/Anzahl in Hitster enthaltenen Jahre2
Es gibt einen offensichtlich besseren Rateansatz: Immer die breiteste Lücke nehmen. Dann gilt es nur noch die Wahrscheinlichkeit zu betrachten, wann ein Hit in dieser größten Lücke liegt:
P(größte Lücke) = Breite der größten Lücke / Anzahl in Hitster enthaltenen Jahre
Es lässt sich einfach einsehen, dass P(größte Lücke) ≥ P(glücklich Raten) gilt.
Jetzt kann ein Hit aber auch ein schon zu einem offen liegenden Jahr gehören. Dann gelten beide zugehörigen Lücken als richtiger Tipp, was im Grunde bedeutet, dass sich zwei Lücken zu einer „Superlücke“ zusammenfassen lassen.
Sehr erfolgreiche Gruppen kommen irgendwann in die Situation, dass viele Jahre mit Hits belegt sind. Dann gibt es nur noch die Situation der Superlücke und es gibt etwa so viele Lücken wie Jahre. Unter Vernachlässigung der Ränder ist dann die Chance fürs Raten:
P(alles ist voll) = 2/(infrage kommende Jahre)
Nun ist es bei Hitster so, dass Lieder immer in eine Lücke zwischen zwei Jahren gelegt werden, das Ergebnis aber auch richtig ist, wenn der Hit einem den Rand bildendes Jahr entspricht. Bei fast allen Überlegungen ist dies egal oder ein unbedeutender Effekt, vereinzelt ist dies aber auch wesentlich, wie im eben diskutierten Fall. Im Weiteren diskutiere ich die Ränder nur, wenn es sich lohnt. Vielleicht haben Sie sich bei den bisherigen Abbildungen schon gewundert, ob alles mit rechten Dingen zugeht. Wenn Sie in Gedanken fürs Raten jedes Jahr immer in eine „erste“ und „zweite“ Hälfte zerlegen, dann sollte beinahe ein gleiches Ergebnis herauskommen.
Zurück zu unserer erfahrenen Gruppe, die sich mal bei einem Lied nicht so ganz sicher ist und es zum Beispiel nur auf 20 Jahre genau eingrenzen kann („Nach 2000“). Dann ist die Chance, die richtige Lücke zu raten, gerade nur noch 2/20 = 1/10 oder 10 %. Deshalb wird es selbst für clevere Musizierende irgendwann knifflig. Damit ist es aber auch interessant zu wissen, wie schnell sich der Tisch mit unterschiedlichen Jahren füllt.
Oder anders ausgedrückt: Wie viele Lücken L(n) gibt es, wenn n-Lieder ausliegen. Beide Zahlen sind wieder in etwa gleich. Nehmen wir zunächst an, dass immer richtig geraten wird. Dann entwickelt sich bei einem festen Intervall B die Lückenzahl L(n) in n Jahren:
L(0) = 1,
L(1) = 1 + (B-1)/B = 1 + (1 – 1/B)
(denn nur mit einer Chance von 1/B wird das ausliegende Jahr noch einmal ausgelegt)
L(2) = L(1) + (B-L(1))/B = 1 + (1-1/B) + (1-1/B)2
…
L(n) = L(n-1) + (B-L(n-1))/B
Die Lösung dieser Differenzengleichung ist
L(n) = ∑i (1-1/B)i.
Etwas fahrlässig lässt sich (1-1/B)i = 1-i/B nähern (für „kleinere i“). Dann ist:
L(n) = n – n(n+1)/(2B) (für nicht zu große n).
Wenn n in die Größenordnung von B kommt – erstaunlicherweise bricht dort die Näherung noch nicht vollständig zusammen – ergibt sich für Lückenzahl:
L(B) = B-(B+1)/2 = B/2 – 1/2.
Jedes zweite Jahr ist also nun schon besetzt. So gut die Näherung für die ersten Iterationen ist, so schlecht wird sie für das für den Highscore relevante Ende:
Und jetzt kommt der Clou: Mittels der Lückenzahl lässt sich auch eine effektive mittlere Lückenbreite Bl(n) = B/L(n) +1 definieren. (Da jedes ausliegende Lied für zwei Lücken zählt, wird noch eine 1 addiert, was bei kleiner werdenden Lücken relevant ist.)
Die Annahme ist dabei, dass alle Lücken etwa gleich groß sind. Wenn jetzt eine Spielendengruppe eine typische Rateabweichung R hat – d. h. meistens liegt sie um höchstens + oder – R Jahre daneben – dann rät sie etwa mit
P = Bl(n)/(2R)
die richtige Lücke.
Daumenregel: Wenn Hits auf +/-5 genau eingeordnet werden können, ist die Chance, ein Lied richtig zu legen etwa 10% der mittleren Lückenbreite. Wenn also schon B Jahre besetzt sind, wird Bl(B) etwa 3 und damit P = 30% für R=5.
Jetzt ist es an der Zeit, die Tokens zu betrachten. Nach fünf Fehlern ist das Spiel schon beendet, da jeder Fehler einen Tokenverlust mit sich bringt. Doch es gibt Tokens zurück, wenn Titel und Interpret richtig genannt werden. Wenn dies mit einer Quote Q gelingt, verändern sich die Anzahl der Tokens mit:
T(n+1) = T(n) + QP -(1-P) = n(QP-(1-P))
Oder auch: ΔT = T(n+1) – T(n) = -(1-P)+QP = (Q+1)P-1
Wenn P sich nicht mehr groß ändert, wird die Tokenabflussrate auch konstant.
Bei P = 1/3 der Daumenregel ändert sich T mit Q/3 – 2/3. Um also länger noch länger im Spiel zu bleiben müssen bei mindestens zwei von drei Liedern Titel & Interpret richtig benannt werden.
Dies ist aber noch nicht das Ende der Überlegungen, denn die Entwicklung der Lücken hängt auch von der Wahrscheinlichkeit P(n) ab, ein Lied richtig zuzuordnen. Aber nur wenn das neue Bild in eine Lücke kommt:
Die Differenzengleichung wird dadurch leider etwas unübersichtlich, da sie nun gekoppelt ist. P(n) hängt von L(n) ab und umgekehrt auch L(n) von P(n):
L(n) = L(n-1) + P(n)(B-L(n-1))/B = P(n)+L(n-1)(1-P(n)/B)
Zudem geht in P(n) natürlich die Rateabweichung R ein. Diese ersetze ich im Weiteren durch die Standabweichung der Normalverteilung. D. h.: R = 1 bedeutet, dass mit 67 % Wahrscheinlichkeit das Lied auf +/-1 Jahre exakt geraten wird. Bei R=2 liegen 67 % innerhalb von +/-2 Jahren etc.
Ein Ansatz ist damit:
P(n) = ɸ(Bl(n)/(2R)) – ɸ(-Bl(n)/(2R)) = 2ɸ(Bl(n)/(2R)) – 1
(ɸ ist die Verteilungsfunktion der Normalverteilung).
Dieser Ansatz ignoriert noch die Superlücken, die mit L(n)/B im späteren Spielverlauf wahrscheinlicher werden. Für diese gilt für die Breite der relevanten Lücke 2B-1 und somit:
P(n) = (1-L(n)/B)(2ɸ(Bl(n)/(2R)) – 1)+(L(n)/B)*(2*ɸ((2*Bl(n)-1)/(2R)) – 1)
P(n) gibt an, mit welcher Wahrscheinlichkeit das Lied „innerhalb“ der richtigen Lücke geraten wird.
Ob die Annahme einer symmetrischen Normalverteilung wirklich sinnvoll ist, bezweifle ich etwas. Oft ist es möglich, eine obere Grenze fürs Erscheinungsjahr anzugeben („dazu haben wir im Studium getanzt …“). Mir fällt aber momentan kein besserer Ansatz ein, der nicht deutlich mehr Parameter erfordert.
Jetzt fehlen nur noch die Siegpunkte, also die Gesamtzahl der richtig einsortierten Hits H(n). Die lässt sich aber einfach konstruieren, da sie sich jede Runde mit der Wahrscheinlichkeit P(n) um 1 erhöht:
H(n) = H(n-1) + P(n) = ∑iP(i)
Damit ist ein Modell beinahe vollständig, das die Entwicklung der Tokenzahl in Abhängigkeit einer Fehlerrate R und einer Lied-Interpret-Identifikations-Quote Q beschreibt:
P(n) = (1-L(n)/B)(2ɸ(Bl(n)/(2R)) – 1)+(L(n)/B)*(2*ɸ((2*Bl(n)-1)/(2R)) – 1)
Bl(n) = 1 + B/L(n)
L(n) = P(n)+L(n-1)(1-P(n)/B)
T(n) = n((Q+1)P(n)-1)
H(n) = H(n-1) + P(n)
Beim eingangs abgebildeten Spiel hatten wir am Ende 25 Hits aus 22 Jahren ausliegen und eine Breite von 66 Jahren. Etwa fünf Songs konnten wir komplett richtig zuordnen, was einer Quote von etwa 1⁄4 sowie um die n=35 Iterationen entspricht. Damit spielte unsere Gruppe mit einer Standardabweichung von etwa 3,5 Jahren. Ich denke, dies sind sowohl plausible als auch typische Werte.
Die Modellrechnung passt erstaunlich gut zur realen Spiel – fast schon zu gut. Ich habe den Vergleich erst angestellt, nachdem das Modell stand.
Ergebnisse irgendwo zwischen 20 und 30 scheinen mit Blick auf die Ergebnisse von ein paar Modellrechnungen, regelmäßig gut erreichbar zu sein. Um 50 und mehr zu erreichen, braucht es nicht nur etwas mehr Glück, sondern auch Mitspielende, die sowohl die Quote als auch die Rategenauigkeit deutlich erhöhen. Um 100 und mehr Hits zu schaffen, ist wohl eine Quote deutlich über 1/2 und eine Standardabweichung von weniger als drei Jahren notwendig.
Oder die Gruppe einigt sich darauf, das Limit von maximal fünf Tokens zu ignorieren. Dann ist es möglich, in den ersten Runden einen größeren Vorrat an Tokens einzulagern und später davon zu zehren.
Frage an den Leser oder die Leserin, die bis hierher durchgehalten hat: Was sind eure Highscores und Erfahrungen?
Mein bisheriger Highscore liegt bei 99 Karten, erzielt mit der Basis-Ausgabe. Wir starteten mit ca. 8 Personen und waren am Ende noch ca. 5 Personen. Die Spieldauer lag bei ca. 4,5-5 Stunden. Wir haben mit einem Maximum von 5 Chips gespielt. Es gab nur dann 1 verlorenen Token zurück, wenn Titel + Interpret + Jahreszahl richtig waren.
Das zweithöchste Resultat lag ungefähr bei 78 (genau weiß ich es nicht mehr), ebenfalls mit der Basis-Edition. Mit der Summer Party liegt mein Rekord bisher bei 54, erreicht mit 6 Personen.
Unser bestes Ergebnis (Basisspiel+Summer Hits + Guilty Pleasures) von 43 erzielten wir in der Partie mit euch.
Im reinen Familienkreis (2 Kinder 9 und 6) erzielen wir im Durchschnitt 15 Punkte mit den besten Punkten bei 22, 25, 29 . Wobei wir da bei den Karten nicht von einer Gleichverteilung ausgehen können, da unsere Tochter als Djane immer mal bewusst jüngere Titel zieht. Die Jahre vor 1980 sind dann überproportional unterrepräsentiert.