In den vorhergehenden Beitraegen in dieser Reihe habe ich im Wesentlichen ueber Ketten von ein und demselben Resultat eines Muenzwurfes geschrieben.
Ist ja auch aeuszerst spannend, denn so intuitiv weisz man ja, dass Kopf oder Zahl nicht viel øfter als drei oder vier mal hintereinander kommen sollte.
Aber wie ausfuehrlich untersucht taeuscht diese Intuition gewaltig, selbst innerhalb von Versuchsparametern, welche praktisch durchfuehrbar sind. Bspw. als Mathelehrer oder fuer ein Kasino.
Diese Kopf- oder Zahlketten waren eine intellektuelle Herausforderung, und somit ein Quell groszer Freude, fuer mich. Deswegen habe ich es hier so ausfuerhlich behandelt, weil ich euch, meine lieben Leserinnen und Leser, gerne an meiner Freude teilhaben lassen wollte. Aber der urspruengliche Ausløser meiner Ueberlegungen zu diesem Thema war etwas ganz anderes.
Wie ich im ersten Artikel dieser Miniserie schrieb, interessierte ich mich urspruenglich dafuer, wie viel øfter ich bspw. Kopf werfe, wenn ich eine Muenze so und so oft werfe.
Es interessierte mich also eigentlich der „Ueberschuss“. Oder anders: Hat eine faire Muenze eine „natuerliche Tendenz“ ein Ungleichgewicht auszugleichen.
Wiederum rein intuitiv fuehlt man, dass dem so ist. Allein schon der Ausdruck „faire Muenze“ traegt viel dazu bei.
Wie es nun aber wirklich aussieht behandle ich in diesem Beitrag.
Zur Erinnerung: ich machte (im Wesentlichen) jeweils 1000 Experimente mit jeweils 10, 100, 1.000, usw. fairen Muenzwuerfen pro Experiment. Diese Experimente wiederholte ich, mit einer unfairen Muenze.
Nun schaute ich am Ende jedes Experiments, wie viel øfter Kopf bzw. Zahl geworfen wurde.
Am Beispiel der 1000 Experimente mit jeweils 10 Wuerfen pro Experiment ist dies dargestellt, im linken Bild dieser Abbildung:
Auf den ersten Blick (und auch wenn man das naeher untersucht) ist der Durchschnittswert fuer den „Ueberschuss“ eines Resultats gleich Null. Das Wesensmerkmal einer fairen Muenze eben.
Im Fall der 10 Wuerfe pro Experiment kann natuerlich Kopf nicht haeufiger als „10 mal øfter als Zahl“ auftreten und umgekehrt.
Fuehre ich mehr Wuerfe pro Experiment durch, erhøht sich diese Grenze und es werden høhere „Ueberschuesse“ erreicht, aber der Durchschnittswert fuer den „Ueberschuss“ bleibt gleich.
Dies ist im rechten Bild der Abbildung dargestellt.
Schauen wir uns etwas naeher an, wie die Ueberschussverteilung aussieht, fuer die 1000 Experimente mit jeweils 10 Millionen Wuerfen pro Experiment:
Im linken Bild legte ich ueber die (grauen) Punkte, welche wiederum den Ueberschuss eines Reslutats pro Experiment darstellen, einen Boxplot. Das kleine Viereck innerhalb der Box ist der Mittelwert und dieser ist leicht verschoben gegenueber der Nullinie mit einem Wert von 65. Alle anderen Werte betrachtend, kann dies weiterhin getrost als „auf der Nulllinie liegend“ angesehen werden.
Innerhalb der Box befinden sich 50 % aller Ueberschusswerte. Die gleiche Ausdehnung der Box, sowohl nach Oben als auch nach Unten (von der Nulllinie gesehen), ist wiederum Ausdruck der „Fairness“ der Muenze.
Innerhalb der Antennen befinden sich 98 % aller Ueberschusswerte und die extremsten Ausreiszer sind durch die Kreuze gekennzeichnet.
Wie schon bei der Fibonaccifolge, erstellte ich ein Histogramm der Ueberschusswerte und passte dieses mittels einer Normalverteilung an. Da dieses Bild im Wesentlichen die gleiche Information (nur detaillierter) enthaelt wie der Boxplot, gehe ich nicht weiter darauf ein. Ich zeige das hier eigentlich nur, weil ich so grosze Freude daran hatte, das Histogramm zu erstellen und anzupassen und die erwaehnten Erkenntnisse aus dem Boxplot mittels einer anderen Methode bestaetigt zu sehen. Und auszerdem sieht es schick aus; in mehrfacher Hinsicht.
Nun das Gleiche zur unfairen Muenze.
Wie im linken Bild zu sehen, unterscheidet sich der „Ueberschuss“ bei einer kleinen Anzahl Wuerfe pro Experiment (wieder 10 im linken Bild) nicht wesentlich von der fairen Muenze. Wenn man genauer Hinschaut, so kønnte man eine leichte Verschiebung zu einem absoluten Kopf-Ueberschuss vermuten.
Diese Vermutung wird bestaetigt, wenn man diese Untersuchung fuer Experimente mit mehr Wuerfen pro Experiment gegeneinander auftraegt, wie im rechten Bild der Abbildung geschehen.
Wie zu erwarten bildet sich ein absoluter Ueberschuss an Kopf-Wuerfen heraus und dieser Ueberschuss wird grøszer, je mehr Wuerfe pro Experiment stattfinden.
Wird die Verteilung um den Mittelwert betrachtet, so erhaelt man die gleiche Gaussverteilung wie oben am Beispiel der fairen Muenze bereits gezeigt. Im ersten Moment mag dies verwirren, aber die Unfairness dieser Muenze steckt in der absoluten Verschiebung. Wie sehr es im den Mittelwert streut, unterliegt den „regulaeren“ statistischen Gesetzen.
Ich halte somit fest, dass ueber viele Experimente gesehen, beim Wurf einer fairen Muenze im Mittel genau so oft Kopf wie Zahl erscheint. Bei einer unfairen Muenze hingegen (deutlich) øfter Kopf, abhaengig von der Anzahl der Wuerfe.
Toll wa! Das Dumme ist nur, dass man im Kasino nicht ganz viele Experimente macht, sondern nur eins. Und auch wenn es unwahrscheinlich ist, so kønnte rein statistisch gesehen, dies ausgerechnet jenes Experiment sein, welches einen extremen Ueberschuss produziert. Bei einer fairen Muenze ist es dann eine 50/50 Chance dass man auf das richtige Resultat setzt.
Deswegen schaute ich mir mal an, wie sich der maximale Ueberschusswert (bei jeweils 1000 Experimenten) entwickelt, in Abhaengigkeit von der Anzahl der Wuerfe pro Experiment:
Bei der fairen Muenze (schwarze Punkte) kønnen die etremsten Werte entweder durch einen Zahl- oder durch einen Kopfueberschuss zustande kommen. Dies wird hier nicht unterschieden.
Die Entwicklung des extremsten Ueberschusswertes ist in doppeltlogarithmischer Darstellung linear.
Linearitaet in doppeltlogarithmische Darstellung bedeutet, dass der Anstieg des Wertes des Extremwertes extrem langsam vonstatten geht. Als ob sich das Universum gegen extreme Ungleichgewichte straeubt.
Fuer den absoluten Wert des extremsten Ueberschusswertes bei den unfairen Muenzwuerfen (rote Vierecke) gilt dies natuerlich nicht derart allgemein. Zunaechst einmal ist zu wiederholen, dass es sich hierbei nur um Kopfueberschuesse handelt (mglw. abgesehen von Experimenten mit nur 10 Wuerfen pro Experiment).
Die insgesamt høheren Werten kommen natuerlich durch die absoluten Verschiebung der Ueberschusswerte zustande.
Wird der Mittelwert der absoluten Verschiebung hingegen von den Werten des extremsten Ueberschusswerte abgezogen (blaue Diamanten), so zeigt sich das gleiche Bild wie bei der fairen Muenze.
Wenn man sich die Werte der extremen Ueberschusswerte anschaut, so sind diese aber mitnichten klein. In den von mir durchgefuehrten Experimenten, fiel ein Resultat auch mal mehr als 60.000 mal øfter als das andere Resultat. Zugegeben, das war bei den Experimenten mit 1 Milliarde Wuerfe pro Experiment.
Dennoch, die Lektion aus dieser kleinen Uebung ist die Folgende: Wenn ich gewinnen will, sollte ich schummeln. Denn sowas wie Glueck gibt es nicht. „Pech“ hingegen schon. Das ist naemlich wissenschaftlich ausgedrueckt: „Unwahrscheinlichkeit“ und die katastrofalen Folgen von Unwahrscheinlichkeit zeigte ich in diesem Beitrag.