Archive for Januar, 2023

Schwupps … so schnell macht sich _noch_ eine neue Miniserie auf.
Der Grund ist, dass ich im letzten Jahr angefangen habe ein paar Buecher (und viele Comics) nochmal zu lesen, deren erste Lektuere 10, 15 oder gar (mehr als) 20 Jahre zurueck liegt.
Bei den Buechern lese ich nur solche nochmal, die einen herausragenden Eindruck hinterlassen haben. Oder wo ich das Gefuehl habe, dass ich die nochmal lesen sollte, weil ich die beim ersten Mal mlgw. nicht so richtig verstanden habe und sich das irgendwie wichtig anfuehlt. Bei den Comics lese ich alles nochmal. Nicht weil die so gut sind (obwohl viele es durchaus sind), sondern aus nostalgischen Gruenden.
Man beachte den Gebrauch des Plurals, woraus die Miniserie folgt.

Beim nochmaligen Lesen mache ich mir natuerlich Gedanken und wenn die es meiner Meinung nach wert sind aufgeschrieben zu werden, dann wird daraus ein kurzer Artikel … bzw. bei den Comics møchte ich gerne Cover zeigen … und dann denke ich mir dazu eben auch noch Text aus.

Los geht’s mit dem ganz fantastischen (ein wiederkehrendes Thema) Die Hyperion-Gesaenge von Dan Simmons. Die gesamte Serie umfasst vier Buecher (und ein paar Kurzgeschichten), aber ich meine damit nur die ersten Beiden, welche ich in einer Gesamtausgabe habe:

Ich las die Buecher zum ersten Mal nach meinem Studium (aber bevor es nach Norwegen ging) und habe sie „verschlungen“ und als definitiv (und zu Recht) zu den wichtigen Buechern des Sci-Fi-Genres zu zaehlenden empfunden; Letzteres wird ein zweites, wiederkehrendes Thema in dieser Miniserie.

Kurioserweise ist dieses Gefuehl, dass ich etwas Ueberragendes gelesen habe, so ziemlich das Einzige was ich noch von dem Buch wusste. Von der Story wusste ich im Wesentlichen nur noch, dass ein paar Reisende zu irgendwelchen Ruinen unterwegs sind … dies ist dann ein Drittes wiederkehrendes Thema — dass ich den Inhalt der gelesenen Buecher vergessen habe (das ist aber mitnichten schlimm, denn dadurch kann ich das alles nochmal als (fast) neu erleben … toll wa).
Beim zweiten Lesen wurde dieses Gefuehl zum Glueck bestaetigt.

Die Hyperion-Gesaenge erschienen um 1990 und standen damit an einem Scheidepunkt der Sci-Fi. Die meisten „alten Meister“ hatten seit Jahren nix mehr produziert, welches in der Bedeutung ihren frueheren Werken auch nur nahe kam. Klar, dank William Gibson gab es seit ein paar Jahren Cyberpunk, aber das war nun auch schon etabliert. Gesehen aus dem Jahre 2023 gab es 1990 aber „neue“ (oder auch „moderne“ oder „zeitgenøssische“) Sci-Fi a la Ted Chiang, Liu Cixin oder (bedingt) China Mieville natuerlich noch nicht (bzw. steckte deren Entstehung erst in den ganz fruehen Anfaengen und war laengst noch nicht abzusehen). Nun wollte man aber dennoch etwas haben was den Sci-Fi-Epen besagter „alter Meister“ entspricht … und dann kamen (durchaus unerwartet) diese zwei Buecher und „belebten“ die (man kønnte sagen: „eher traditionelle“) Sci-Fi wieder :) .

Die Buecher sind natuerlich so toll, weil die Geschichte(n) spannend sind. Das liegt aber nicht nur an dem Erzaehlten an sich, sondern auch wie diese sich zusammenfuegen und die Charaktere darin agieren. Hinzu kommt all das Gesagte mit Bezug auf das „Hintergrunduniversum“.
Im ersten Teil (eigtl. im ersten Buch, aber die sind bei mir ja zu einer Ausgabe zusammengefasst, weswegen ich „erster Teil“ sage) gibt es zwar gewaltige Brueche in den Geschichten besagter Charaktere (zum Teil wird das Genre komplett veraendert, wenn auch innerhalb der Sci-Fi bleibend), aber der „Fluss“ ist ganz hervorragend und traegt gewaltig zur „Tollheit“ bei. Dies sowohl intern (also innerhalb besagter Geschichten) als auch extern (also das Hintergrunduniversum betreffend).
Und dann ist da noch die Sprache … also das „wie es geschrieben ist“. Manche Autoren haben es echt drauf und zumindest in diesem Buch zaehlt Dan Simmons zu diesen Autoren; auch in der dtsch. Uebersetzung.

Lang Rede kurzer Sinn: wer sich fuer Sci-Fi interessiert sollte es unbedingt lesen; fuer Leute dich sich nicht fuer Sci-Fi interessieren ist es immer noch lohnenswert, eben weil es so gut ist (insb. der erste Teil).

Die Fortsetzung(en) habe ich nicht als so herausragend in Erinnerung und deswegen auch (erstmal) nicht vor nochmal zu lesen.

Beim letzten Mal landete ich bei dieser Tabelle, welche abgeschaetzte Zahlen enthaelt bezueglich wieviele Menschen in Norwegen in 2020 an gegebenen Krebsarten erkrankt (bzw. gestorben sind). Ich vertraue der Abschaetzung nicht nur deswegen, weil das von einer (meiner Meinung nach) vertrauenswuerdigen Quelle kommt, sondern weil ich das rueckwaerts gerechnet und mit echten Zahlen aus frueheren Jahren verglichen habe. Fuer Norwegen sind die Abschaetzungen plausibel, ich kann das nicht fuer andere Laender sagen, wuerde aber ohne Bauchschmerzen das Vertrauen auf diese erweitern.

Ebenso: im Weiteren (nicht nur hier, sondern auch in folgenden Artikeln) kuemmere ich mich nur um 50 % der Bevølkerung (die Maenner), nur um die norwegischen Zahlen und bespreche nur die Zahlen fuer 2020 (wichtig fuer wenn das hier in 20 Jahren jemand liest und die Tabelle die Werte fuer 2040 enthaelt).
Die Frauen lasse ich auszen vor, weil ich ein Mann bin und die ganze Sache hier ja ueberhaupt erst mit einer ganz konkreten Frage mich betreffend los ging. Die Unterscheidung ist wichtig, denn die Zahlen sind (leicht, aber signifikant) unterschiedlich fuer Maenner und Frauen. Nicht nur kann eine Frau keinen Prostatakrebs bekommen, sondern ist bspw. die Chance dass ein Mann Magenkrebs bekommt doppelt so hoch.
Dass ich Norwegen nehme ist weniger eindeutig, habe ich doch einen signifikaten Teil meines Lebens in Dtschl. verbracht. Allerdings unterscheiden sich die Zahlen zwischen diesen beiden Laendern nicht all zu stark.

Wieauchimmer, in der oben erwaehnten Tabelle bin ich nicht so richtig an den krebsspezifischen, totalen Zahlen interessiert. Ich will also nicht wissen wieviele Leute (einen bestimmten) Krebs bekommen haben, sondern vielmher wie viele von 100.000 zufaellig ausgewaehlten Menschen dieses Schicksal ereilte. Das ist (in ganz kurz) die Crude Rate. Ueber alle norwegischen Maenner aller Altersgruppen betrachtet sind das 688. Das ist aber irrefuehrend und ich erklaere an einem Beispiel warum.
Fuer das Beispiel stelle man man den Altersschieber zunaechst zwischen 0 und 49 (Jahre). Man erhalt 1289 Krebsfaelle. Nun stelle man den Schieber zwischen 50 und 85+ (Jahre) und erhaelt 17.573 Krebserkrankungen. Das statistischen Zentralbuero Norwegens hilft mir mit diesem Artikel (Figur 5) weiter, bezueglich der Anzahl der Maenner in diesen Gruppen. In 2020 befanden sich der ersten Gruppe 1,752,661 Maenner und in der zweiten Gruppe 932,412 Maenner. Mit entsprechenden, altersgruppenspezifischen Crude Rates von ca. 74 und fast 1900. (Achtung: die Zahlen in der Tabelle weichen etwas ab, weil dort das Wachstum der Bevølkerung etwas ander abgeschaetzt wurde. Die Abweichungen bewegen sich im Rahmen von ca. 2 %, ein erwart- und verschmerzbarer Fehler.)

Die letzten beiden Zahlen sind betraechtlich anders als die obige Crude Rate von 688. Das ist natuerlich voll logisch, Krebs ist auf Gesamtbevølkerungsniveau gesehen im Wesentlichen eine Alterskrankheit. Das erklaert nicht nur mein (verstaerktes) Interesse an dem Thema sondern auch warum die Crude Rate so viel kleiner fuer die juengeren und so viel grøszer fuer die aelteren Maenner ist.
Die zweite Altergruppe ist immer noch viel zu unspezifisch in meiner ganz spezifischen Situation, denn ich bin zur Zeit des Schreibens dieser Artikel 42 Jahre. Deswegen werde ich in spaeteren Artikeln 5-Jahres-Altersintervalle betrachten und mit den altersspezifischen Crude Rates arbeiten.

Ein letztes Achtung: die Crude Rate ist die _jaehrliche_ Chance an (einem gegebenen Krebs) zu erkranken, wenn man sich in einer gegebenen Altersgruppe befindet. Das ist beim kumulativen Risiko wichtig und deswegen komme ich darauf nochmal zurueck, wenn ich die naeher betrachte.

Fuer heute soll das reichen. Beim naechsten Mal gehe ich kurz auf die altersstandardisierte Rate (ASR) ein und warum da im Tabellenkopf ein „World“ hinter steht.

Beim letzten Mal zeigte ich, dass sich die linklevelabhaengigen, individuellen Verteilungen der Selbstreferenzen bei doppellogarithmischer Darstellung mittels linearer Funktionen beschreiben lassen und dass der Anstieg der dazugehørenden (Regressions)Geraden zu nimmt. Nun wird es total spannend, denn ich werte heute die linklevelabhaengigen Parameter dieser linearen Funktionen aus.

Aber zunaechst zur Erinnerung: in den Diagrammen des letzten Beitrags stellte ich den Logarithmus eines Funktionswertes f(x) in Abhaengigkeit vom Logarithmus der Argumente x dar und erhalte eine Gerade. Die Formel fuer die Gerade sieht also so aus …

… mit dem Anstieg A und dem absoluten Glied B. Letzteres ist im Wesentlichen dafuer verantwortlich, wie grosz das Integral unter der Kurve wird, da dieser Parameter besagte Kurve nach oben oder unten schiebt.
Obige Gleichung ist aequivalent zu einem maechtigen Gesetz …

… und deswegen entspricht der Anstieg der Geraden in der doppellogarithmischen Darstellung dem Exponenten des Potenzgesetzes. Cool wa!

Soweit zur Wiederholung … nun schauen wir uns mal die Linklevelabhaengigkeit der Regressionsparameter in diesem høchst spannenden Diagramm an:

URST Cool wa! Jetzt hab ich schon zwei voll krasse Ergebnisse (hier ist das Erste) die ich so nicht erwartet haette. Krass deswegen, weil das hier auf zugrundeliegende Mechanismen hinweist, die ganz natuerlich in diesem Netzwerk entstanden sind. Aber genug der Schwaermerei darob solch schøner Resultate ich sollte erstmal sagen warum das so urst cool ist.

Sowohl die Linklevelabhaengigkeit des Ansteigs als auch des absoluten Glieds lassen sich am besten mittels einer Exponentialfunktion beschreiben. Diese hat im ersten Fall eine Zerfallskonstante von -7.76 und im zweiten Fall von +7.67 … … … Wait! What? … *nochmal kontrollier* … .oO(ja, das stimmt alles).

Die Wahl einer Exponentialfunktion zur Beschreibung der Daten kann natuerlich diskutiert werden. Aber weil ich nicht die geringste Ahnung habe, was oben erwaehnte Mechanismen sein kønnten, gehe ich erstmal von einfachen Dingen aus, was in diesem Fall zur Wahl einer Exponentialfunktion fuehrte.
Das sich das Vorzeichen zwischen den beiden Werte aendert liegt in der Natur der Sache. Der absolute Wert des Anstiegs der Geraden wird ja grøszer. Deswegen muss die Zerfallskonstante negativ sein, denn der Exponent eines exponentiellen Zerfalls enthaelt von sich aus ein Minus eins und das muss kompensiert werden. Das aendert nix an dem Gesagten. Wuerde man die Daten des einen Parameters an der Abzsisse spiegeln, waere das Vorzeichen beider Exponenten gleich.

Beide Zerfallskonstanten liegen (vom Vorzeichen abgesehen) total nah beieinander. Das weist darauf hin, dass die Linklevelabhaengigkeit beider Grøszen ein und dem selben Mechanismus zu Grunde liegen.

Es hatte einen Grund, warum ich beim letzten Mal dies schrieb:

[…] wenn die Werte der Datenpunkte der Grafen durch die Anzahl aller Wikipediaseiten geteilt wird, so erhaelt man die Wahrscheinlichkeit wie oft eine Seite so und so viele Zitate […] pro Linklevel erhaelt.
Das Integral ueber alle Daten und alle Linklevel ergibt […] die durchschnittliche Wahrscheinlichkeit ueberhaupt eine Selbstreferenz zu erhalten.

Wenn man in diesem Bild bleibt, so ist das absolute Glied obiger linearer Gleichung ein Ausdruck dessen was in dem zweiten Satz des Zitats steht. Je weiter fortgeschritten man im Linknetzwerk einer Seite ist, desto unwahrscheinlicher ist es eine Selbstreferenz zu erhalten … siehe der kleiner werdende Flaecheninhalt unter den beim letzten Mal gezeigten Grafen.
Ist es sinnvoll, dass diese Grøsze exponentiell abnimmt … mhmm … mein Bauchgefuehl sagt mir: durchaus.

Die Zunahme des (Betrags des) Anstiegs der Regressionsgeraden besagter Grafen sagt im Wesentlichen das Folgende aus: je weiter fortgeschritten man im Linknetzwerk einer Seite ist, desto unwahrscheinlicher ist es _mehr_ als eine Selbstreferenz zu erhalten.
Ist es sinnvoll, dass diese Grøsze exponentiell abnimmt … mhmm … mein Bauchgefuehl sagt mir auch hierbei: durchaus.

In beiden Faellen kommt das „durchaus“ meines Bauchgefuehls daher, dass høhere Linklevel bedeuten, dass sich die dort auftretenden Seiten thematisch mehr und mehr von der Ursprungsseite entfernen. Warum sollte Selbige also zitiert werden? Und diese Entfernung vom Ursprungsthema ist eben wirklich urst schnell … da kann ich auf den allererste Beitrag dieser Maxiserie verweisen, in dem ich erwaehne, dass es nur drei Schritte zwischen Trondheim und Kevin Bacon gibt … ich wuesste wirklich nicht, was diese beiden miteinander zu tun haben kønnten.
Wieauchimmer, dieser „Abstand“ nimmt im Bild des Linklevels zwar schrittweise (also linear) zu, aber der „thematische (!) Abstand“ dann wohl exponentiell. Das „urst schnell“ von weiter oben drueckt sich in dem hohen absoluten Wert der Zerfallskonstante aus … ein Exponent von (fast) 8 ist gigantisch! Mir ist kein einziges Naturgesetz mit einem so hohen Exponenten bekannt.

Eine weitere „Veranschaulichung“ des Gesagten sind die vielen Gespraeche, wo man „vom Hundertsten ins Tausendste kommt“ … weil es sich hierbei um einen Sprung um eine Grøszenordnung handelt, kann dieses Sprichwort durchaus als ein Ausdurck obiger Zustaende gesehen werden.
Somit entspricht die Zerfallskonstante dieser Parameter also in etwa wie stark sich die Themen der Seiten auf einem Linklevel vom Thema der Ursprungsseite entfernen. Das ist voll cool (!!!) denn damit gibt es einen mathematischen Ausdruck fuer ein sprachlich / psychologisch / soziales Phaenomen. Ich haette nicht gedacht, dass ich das ganz konkret und quantifizierbar in den Daten finden wuerde.

Das soll genug sein fuer heute. Zum Abschluss sei nur noch das Folgende erwaehnt: die Fehlerbalken der einzelnen Punkte kommen aus den Fehlern der Regressionsparameter (wie beim vorletzten Mal erwaehnt). Der Fehlerbereich der exponentiellen Funktion ist davon natuerlich unabhaengig.

Nachtrag:
Im obigen Bild ist mir ein Fehler unterlaufen. Das ist aber nicht so schlimm und aendert gar nichts an dem was ich schrieb und es handelt sich dabei um das Folgende. In der Formel am Anfang benutze ich den Logarithmus zur Basis 10. Dies deswegen, weil Diagramme wie beim letzten Mal logarithmische Skalen zur Basis 10 benutzen. Die Werte fuer das hier dargestellte Diagramm berechnete ich aber mit dem natuerlichen Logarithmus.
Fuer den Anstieg macht das ueberhaupt keinen Unterschied, der ist der Selbe, egal welche Basis man benutzt. Aber das absolute Glied ist bei Letzterem selbstverstaendlich grøszer als wenn die Basis 10 benutzt werden wuerde. Genaugenommen um einen (konstanten!) Faktor 2.30258 grøszer, welcher natuerlich das Reziproke des Logarithmus zur Basis 10 der Eulerschen Zahl ist. Mathematisch folgt das zwangslaeufig, denn letztlich muessen beide Formen die selben Daten beschreiben. Zur Kontrolle habe ich dennoch nochmals alle linearen Regressionen ausgefuehrt und kann sagen, dass dieser Faktor „experimentell“ bestaetigt wird … bis auf ein paar wenige Werte am Anfang und am Ende fuer die das aber plusminus innerhalb vertretbarer Grenzen auch gilt.
Weil es sich hierbei um einen konstanten Faktor handelt bleibt dann auch die Zerfallskonstante der Anpassung der Werte fuer B die Gleiche. Mit den gegebenen Datenpunkte erhalte ich einen Wert fuer Selbige von +7.22. Die Diskrepanz ergibt sich sich durch die „paar wenige[n] Werte am Anfang und am Ende“. Wenn ich diese kuenstlich „begradige“ so verschwindet die Diskrepanz ohne dass sich an der Position der Punkte im Diagramm grosz was aendert.
Mit den gegebenen Daten (und insb. aller Limitierungen die diese mit sich bringen) kann ich deswegen trotz des (relativ geringen) Unterschieds der Werte (welchen ich getrost in den so oft erwaehnten „10%-Fehler“ packen kann) weiterhin ohne schlechtes Gewissen vertreten, dass die Zerfallskonstanten fuer A und B im Wesentlichen gleich sind.

Nach dem letzten Beitrag kann ich heute ohne viel Aufhebens gleich zu den Daten kommen:

Whoa! … (wie so oft) passiert ja ganz schøn viel hier … darum der Reihe nach. Wir sehen die selben Diagramme wie beim letzten Mal, nur fuer høhere Linklevel, mit den Regressionsgeraden welche den linearen Teil der jeweiligen, linklevelspezifischen Daten gut (genug) beschreiben.

Im linken, oberen Bild sehen wir die Daten fuer LL2 bis LL9 (kurze Anmerkung: die Daten fuer LL2 und LL3 sind sich so aehnlich, dass sich Erstere hinter Letzteren „verstecken“; entsprechend sind diese zwei Regressionsgeraden auch so aehnlich, dass ich hier sage, dass diese gleich sind). Wie beim letzten Mal bereits erwaehnt, nimmt die „Signalstaerke“  mit zunehmendem Linklevel ab. Das ist aber etwas, was wir schon aus dem allerersten Diagramm zu den Selbstreferenzen wissen.
Nichtsdestotrotz scheinen die Regressionsgeraden hier alle parallel zu liegen. Die Betonung liegt auf „scheinen“, denn dies ist nicht der Fall. Das sieht man aber in diesem Diagramm nicht so gut, weil der Unterschied in den Anstiegen nicht sehr grosz ist.

Besser ist dies im rechten oberen Bild zu sehen, in dem die Daten von LL10 bis LL19 dargestellt sind. Weil die Datenpunkte dichter beisammen liegen erkennt man viel besser, dass Betrag des Anstiegs der Regressionsgeraden zu nimmt mit høheren Linkleveln.

Im linken unteren Bild sieht man den Uebergang in das Regime in dem die Datenlage nicht mehr gut genug ist. Bis LL22 getraue ich mich noch die Daten mittels linearer Regressions zu analysieren. Danach ginge das prinzipiell auch noch, aber da habe ich dann allermeistens nur noch zwei Datenpunkte (oder noch spaeter nur noch einen) pro Linklevel und durch zwei Punkte kann man eine eindeutige Gerade legen. Die Parameter dieser Gerade sind dann aber auch komplett abhaengig von der Position besagter Punkte im Diagramm. Da ich mich hier ohnehin nur noch kurz ueber dem „Rauschen“ befinde wuerden besagte Parameter dann auch (mehr oder weniger) wild streuen und es waere wenig sinnvoll diese zu interpretieren. Eben dieses „wilde streuen“ wird ja zum Teil massiv „geglaettet“ durch lineare Regression.

Wieauchimmer, im rechten unteren Bild ist dann definitiv der „Endzustand“ erreicht, der das eben Beschriebene eindeutig klar macht.

Ich zeige die Diagramme vor allem aus Transparenzgruenden damit ihr, meine lieben Leserinnen und Leser, sieht wie das „in Echt“ aussieht und wo die beim naechsten Mal besprochenen Sachen eigtl. herkommen.

Zum Abschluss sei das Folgende gesagt (denn es ist wichtig zum Verstaendnis der Daten beim naechsten Mal): wenn die Werte der Datenpunkte der Grafen durch die Anzahl aller Wikipediaseiten geteilt wird, so erhaelt man die Wahrscheinlichkeit wie oft eine Seite so und so viele Zitate (z.b. 23) pro Linklevel erhaelt.
Das Integral ueber alle derart normierten Daten und alle Linklevel ergibt die rechte Kurve des ganz am Anfang der Besprechung der Selbstreferenzen gezeigten Bildes — die durchschnittliche Wahrscheinlichkeit ueberhaupt eine Selbstreferenz zu erhalten.

Beim naechsten Mal komme ich zum eigentlich Spannenden: der nun schon so oft erwaehnten Regressionsgeraden. Urspruenglich war das hier mit drin, aber die Ergebnisse sind so toll, dass diese einen eigenenBeitrag verdient haben.

Øhm … æhm … wegen des Themas einer anderen, z.Z. laufenden Miniserie, ist es mir fast ein bisschen unangenehm, dass das heutige Argument auch um Krebs geht und wie wir (indivudell und als Gesellschaft) den nicht als Teil des Kørpers wahrhaben wollen und wie das dann auf das hinaus laeuft, um was es mir mit dieser Serie geht … aber eben nur fast und deswegen schreib ich mal drauflos.
Ich gebe zu, dass mir das hier dargelegte Argument selbst nicht ganz ausgegoren vorkommt … aber ich komm nicht weiter mit meinen Gedanken und im groszen und Ganzen halte ich das durchaus fuer in das Thema passend … selbst wenn mir nicht komplett klar ist wie oder wo es passt.

Wieauchimmer, wenn man Krebs hat, dann wird im Allgemeinen gesagt, dass man gegen den „kaempft“. Dies auf eine Art und Weise, die definitiv NICHT das Immunsystem meint (wie bspw. bei der Grippe). Geht ja auch gar nicht, denn dieses funktioniert ja gerade nicht gegen den Krebs.

Wie aber kann man gegen sich selber kaempfen? … Kaempfen beinhaltet doch, dass man etwas besiegen kann … aber man besiegt sich ja nicht selbst, wenn man vom Krebs geheilt wird.

In meiner kleinen Welt, die nur wenig beruehrt ist von einer echten Ausbildung in der Psyche des Menschen, kann ich mir das nur so vorstellen, dass der Krebs vom Selbst exkludiert wird. Diese Teile werden nicht als zum Selbst gehørend wahr genommen und deswegen kann man die „besiegen“.
Das einzige Mal, dass ich eine andere Darstellung las war im Buch „Døden, skal vi danse?“ (dtsch.: „Tod, ich bitte zum Tanz“) des Arztes Per Fugelli. Dieser hat sich viele Jahre seines Lebens mit dem Tod und wie wir (individuell und als Gesellschaft) damit umgehen auf professioneller Ebene beschaeftigt. Letztlich fuehrte es dazu, dass er seinen Krebs zwar weiterhin psychologisch „abspaltet“ aber dennoch als Teil von sich selbst wahr nimmt, den er eben gerade NICHT durch einen Kampf los wird.

Worum es mir im grøszeren Zusammenhang nun geht ist der folgende Sachverhalt. Krebszellen sind uns viel aehnlicher als ein Kind es jemals sein kønnte. Erstere werden als „nicht meine und das sollen auch nicht meine sein“ angesehen obwohl diese Teil des eigenen Kørpers sind, mit nur ein paar veraenderten Genen (meist noch nicht mal komplett veraendert, so weit ich das verstanden habe). Bei Kindern hingegen wird im Allgemeinen von Eltern oft genug das angenommen, was im Titel dieser Miniserie steht und das obwohl 50 % des Genoms von wem ganz Anderem sind.

Das ist natuerlich ein Widerspruch, es sei denn, dass es gar nicht um die Gene geht. Aber die Gene sind das Einzige, was ein Kind physisch von den Eltern „hat“ (auch wenn superhoher Stress (bspw. durch Misshandlungen durch besagte Eltern) auch nach der Geburt (via DNA-Methylierung) noch die DNA veraendern kann … der  Einfachheit halber lasse ich solche Effekte bei meinen Betrachtungen auszen vor). Wenn es nun aber nicht um die Gene geht, dann lande ich entweder wieder bei dem beim letzten Mal Gesagten (Machtausuebung) oder, dass das ganze Konzept ein unertraeglicher Unsinn ist.

Das muss reichen fuer heute … alles was ich noch dazu schreiben kønnte, waere gedankliches vor und zurueck bewegen. Das mache ich zwar oft genug, lasse es aber an der Stelle sein und hoffe, dass ihr, meine lieben Leserinnen und Leser schon so’n Gefuehl dafuer habt, was ich sagen will.

Beim letzten Mal zeigte ich zum Abschluss zwei repraesentative Verteilung der Selbstreferenzen pro Linklevel. Ich wollte damit darauf hinaus, dass diese Verteilungen sich ueber viele Linklevel nach einem maechtigen Gesetz verhalten. Bevor ich darauf beim naechsten Mal zurueck komme und das Ganze systematisch betrachte, møchte ich zunaechst mithilfe dieses Diagramms …

… auf zwei Sachen eingehen.

Die erste sind die wenigen Ausnahmen vom oben Gesagten. Naja, eigentlich sind es viele, aber die allermeisten der vielen Ausnahmen kønnen alle unter einer Kategorie zusammengefasst werden (und diese Kategorie liegt auch noch in der Natur der Sache) und deswegen zaehlen die alle zusammen nur als eine Ausnahme … aber vielleicht sollte ich einfach nur erklaeren.

In dem Diagramm sehen wir die Verteilungen der Selbstzitate fuer LL0 (schwarze Punkte), LL1 (rote Quadrate) und LL9 (blaue Diamanten). Wie immer bei diesen Verteilungen zaehlte ich (in diesem Fall) wieviele Seiten es gab (Ordinate), die auf dem gegebenen Linklevel so viele Selbstreferenzen erhielten, wie auf der Abzsisse angezeigt.
Nicht gezeigt sind die Punkte fuer null Selbstreferenzen; die sind naemlich im Wesentlichen fuer alles weitere unwichtig und lassen sich ohnehin nicht gut bei einer logarithmischen Achse darstellen..

Der erste Ausnahmefall ist LL0. Dort sollte es ueberhaupt keine Selbstreferenzen geben (man ist ja noch keinen Schritt im Linknetzwerk voran geschritten). Wir wissen von frueher, dass der eine Punkt mit einem Wert von ca. 80k durch Artefakte zustande kommt.

Kurioserweise erlaubt mir dieses Artefakt den zweiten Ausnahmefall zu erklaeren, denn genau so sieht das auch aus, wenn man sehr weit im Linknetzwerk vorangeschritten ist. Dort liegt der Grund aber darin, dass dann die Chance fuer eine Selbstreferenz URST winzig ist. Entsprechend klein wird die „Signalstaerke“ und die Werte auf der Abzsisse liegen dann nur noch bei 1 (oder vielleicht mal 2) … also ich habe nur noch bei einer Selbstzitierung (und bei null) ein Signal.
Worauf ich hinaus will ist das Folgende: beim naechsten Mal interessiert mich der Anstieg der Verteilung in der doppellogarithmischen Darstellung (welcher dem Exponenten des Potenzgesetzes entspricht). Diesen erhalte ich durch lineare Regression; aber lineare Regression bei Werten die im Wesentlichen „Rauschen“ sind ist nicht sinnvoll.
Deswegen wuerde ich obige Aussage nur unter starkem Vorbehalt fuer als gueltig auf hohen Linkleveln ansehen. Vermutlich ja, aber die Daten geben das einfach nicht her.

Die dritte Ausnahme ist die Verteilung zu LL1, diese verhaelt sich naemlich eindeutig nicht nach einem Potenzgesetz, denn selbst mit beiden Augen zudruecken kann ich die Daten da nicht mit einer linearen Funktion (bei doppellogarithmischer Darstellung) beschreiben. Das gilt bedingt mglw. auch fuer die Verteilungen bei LL2 und LL3, bei Letzteren kann ich aber auch mit gutem Gewissen eine Gerade durch relevante Abschnitte der Daten legen, die gilt halt nur nicht bei all zu kleinen Linkleveln.
Was passiert hier? Nun ja, das ist einfach zu erklaeren: von gaaaanz frueher wissen wir dass jede Ursprungsseite im Durchschnitt 30 (neue) Seiten auf LL1 hat. Ja, auch von frueher wissen wir, dass es auch (Ursprungs)Seiten gibt, die deutlich mehr (oder weniger) als diese 30 Seiten auf LL1 haben. Aber nach unten bin ich ohnehin begrenzt (weniger als null geht nicht) und nach oben liegt die Grenze bei so ca. 1000 Seiten … das ist zwar deutlich mehr, aber davon gibt es nur sehr wenige.

Wieauchimmer, von jeder Seite auf LL1 kann die Ursprungsseite nur eine Selbstreferenz bekommen. Das limitiert wie weit eine Seite auf der Abszisse „reichen kann“; wenn ich nur 30 Seiten auf LL1 habe, dann kann ich keine 31 Selbstreferenzen bekommen.
Ebenso sollte dies indirekt zu einer Ueberhøhung des Signals gegenueber einer Geraden (und damit einer konvexen Kruemmung der Daten) fuehren. Indirekt deswegen, weil das natuerlich nicht der Mechanismus ist, der zu besagter Ueberhøhung des Signals fuehrt. Vielmehr ist es so, dass ja gerade auf LL1 sicherlich viele Seiten auf die Ursprungsseite zurueck verweisen, einfach weil das thematisch sehr oft nahe liegt. Ich habe also ohnehin schon ein høheres Signal und das „draengelt“ sich, durch ersteren Mechanismus, dann auch noch alles bei kleinen Werten auf der Abszisse.

So, genug zu den Ausnahmen.

Wichtiger fuer’s naechste Mal ist eigentlich alles zu LL9. Da ist naemlich eine der oben erwaehnten Regressionsgeraden drin (die dicke orange Linie). Die sieht schick aus, nicht wahr; so richtig schøn mitten durch den (bei doppellogarithmischer Darstellung) linearen Teil der Daten.
Und hier liegt der Hase im Pfeffer! Denn ich habe ja rechts davon auch noch Daten … aber das sind nur ganz wenige, einzelne Seiten, die so viele Selbstreferenzen erhalten … und diese „passen“ ja offensichtlich nicht zu dem worauf ich hinaus will mit dem linearen Teil. Aber die wuerden natuerlich bei einer linearen Regression ueber alle Daten mit einebzogen werden und zu einer Gerade fuehren, die ueberhaupt nicht mehr „gut passt“.
Waehrend des Studiums  habe ich gelernt das zu ignorieren und das Lineal an den linearen Teil so anzulegen, dass die Linie richtig liegt und die Daten gut (genug) beschreibt … vulgo: schick aussieht … wenn ich den Anstieg und das absolute Glied einfach ablese (ohne was formal zu berechnen).
Und genau das habe ich fuer alle (relevanten) Verteilungen gemacht. Ich habe vom Ende (und wenn nøtig auch vom Anfang) so lange Punkte weggeschnitten, bis die Regressionsgerade schick aussah. Wie oben geschrieben, ist das kein schummeln, sondern wurde von Physikern schon immer so gemacht. Auszerdem ist das Potenzgesetz ohnehin nicht ueberall gueltig und der Bereich der Gueltigkeit ergibt sich daraus wo die Gerade die Daten gut beschreibt. Dennoch wollte ich den Prozess mal erwaehnt haben, denn letztlich habe ich die Geraden durch linere Regression erhalten.

Und damit bin ich dann auch bei der letzten Sache … dem orange-durchsichtigen Band um die dicke Linie. Bei der linearen Regression erhaelt man fuer die Parameter der Geraden einen „Fehler“ … vulgo: die plus/minus Werte … und das orange Band kennzeichnet diesen Bereich. Die Regressionsgerade kønnte also irgendwie liegen, solange es innerhalb dieses Bandes ist. Die wahrscheinlichste Gerade ist die eingezeichnete.
Beim naechsten Mal lasse ich die Baender weg, aber ich komme nochmal auf den „Fehler“ des Anstiegs zurueck. Deswegen wollte ich das hier mal erwaehnt haben.

So, das war jetzt viel mehr als ich urspruenglich dachte. Im naechsten Beitrag wird’s voll interessant :)

Beim letzten Mal endete ich mit einem Verweis auf das „Global Cancer Observatory„. Ich musste ein bisschen Zeit auf dieser Seite verbringen um zu verstehen, wie die Daten aufgebaut sind. Deswegen denke ich, dass es recht nuetzlich ist, wenn ich an dieser Stelle kurz darauf eingehe. Dann kønnt ihr, meine lieben Leserinnen und Leser, bei Interesse gleich zu den relevanten Dingen vorstoszen und spart euch diese Arbeit.
Ich befuerchte allerdings, dass das hier Geschriebene eher eher als spaeter obsolet sein wird. Im Netz veraendert sich schlieszlich immer alles und selbst wenn es die Seite in ein paar Jahren noch gibt, so wird die bestimmt anders aussehen; sei’s drum.

Wenn man den obigen Link klickt, wird man mit mehreren Wahlmøglichkeiten konfrontiert. „Cancer over time“ ist durchaus interessant (und da habe ich mich zunaechst am meisten aufgehalten), aber ich bin natuerlich an der aktuellen Situation interessiert. Deswegen geht es mit „Cancer Today“ (Direktlink) weiter. Weil ich nur an norwegischen Zahlen interessiert bin, ist es nicht so schlimm, dass die Angaben dort  abgeschaetzt sind, denn in den nordischen Laendern ist es seit vielen Jahren obligatorisch Krebs an die entsprechenden Stellen zu melden.

Wieauchimmer, bei „Cancer Today“ wird man dann mit mehreren Wahlmøglichkeiten konfrontiert. Das was sich dahinter befindet ist an allen Faellen von groszem intellektuellen Interesse.
Ganz besonders informativ fand ich die Auftragung der laenderspezifischen, (jeweils altersstandardisierten) (Gesamt)Mortalitaet aufgrund von Krebs ueber dem (Gesamt)Vorkommen von Krebs. Das verhaelt sich alles wie schon besprochen, aber man muss das genauer anschauen um es zu erkennen. Laender wo es wenige Aerzte gibt haben NICHT weniger Krebsfaelle, da wird das nur nicht erkannt/gemeldet. Bzw. haben die vermutlich doch weniger Krebsfaelle, weil die Leute dort frueh an anderen Sachen sterben. In Laendern wo jeder Zugang zu einem Arzt hat werden mehr Krebsfaelle erkannt und gemeldet, aber wenn das Gesundheitssystem dort nicht soooo super gut ist, dann sterben die Leute da auch oft an Krebs (aber nicht so oft an anderen Sachen). In den reichen Laendern gibt es genau so viele Faelle, aber deutlich weniger Leute sterben daran. Auszerdem muss man bei der Darstellung auch immer im Hinterkopf haben, wie viele alte Menschen es in den Laendern gibt (im wesentlichen wieder eine arm/reich Dichotomie, aber nicht nur). Und dann sind da noch Australien und Neuseeland mit den allermeisten Krebsfaellen, die aber zu groszen Teilen durch Hautkrebs zustande kommen; und die Frueherkennung scheint dort sehr gut zu funktionieren, denn die Mortalitaet steigt nicht an.
Das ist ein tolles Diagramm, weil es sooo viel Information enthaelt und all dies kann man auf der linken Seite noch geschlechter- und krebsspezifisch aufteilen … ich gebe aber zu, dass sich die Informationsfuelle eigentlich erst mit genuegend Hintergrundwissen ergibt … allerdings ist das ja oft der Fall.

Aber ich schwoff ab, denn eigentlich bin ich ja an den altersspezifischen rohen Zahlen interessiert und deshalb verschlug es mich am Ende zu den „Tables„.
Auf der linken Seite waehlt man (von unten anfangend) das Land (Population), die Altersgruppe, das Geschlecht und ob man die Anzahl der (abgeschaetzten) Krebsfaelle oder die (abgeschaetzte) Mortalitaet sehen will.

Um die Stimmung bei diesem Thema wieder ein bisschen aufzumuntern, empfehle ich bei den letzten beiden mal hin und her zu wechseln. Zumindest fuer Norwegen (und vermutlich fuer die meisten reichen, westlichen Laender) gibt das naemlich wieder ein hoffnungsfrohes Bild. (Von Ausnahmen abgesehen) stirbt nur ca. 1/3 der Leute an Krebs.

In der Tabelle sieht man auch die Begriffe „Uncertainty Intervall“, „Crude Rate“, „ASR (World)“ und „Cumulative risk“. Weil das abgeschaetzte Zahlen sind, gibt Ersteres fuer alle praktischen Belange an, weit die Zahlen daneben liegen kønnen. Die anderen drei Begriffe erklaere ich ein anderes Mal.

Zum Abschluss noch ein Achtung: Altergruppen sind ueblicherweise (meistens? oft?) 5-Jahres-Intervalle (wenn ich das richtig verstanden habe), der „Slider“ erlaubt als Minimum aber nur 15-Jahres-Intervalle. Ueber die „Drop-Down“-Menues kønnen kuerze Intervalle gewaehlt werden.

Vor einer ganzen Weile zeigte ich die Verteilung der Maxima der einzelnen Verteilungen der Selbstreferenzen. Aus einer Unstimmigkeit im allerersten Balken entwickelte ich in den letzten Artikeln in dieser Maxiserie das Konzept der (Wissens-)Archipele. Letzteres ist abgeschlossen und ich gehe nur nochmal ganz kurz auf die Verteilung der Maxima ein. Genauer interessieren mich die sieben „Ausreiszer“, die erst sehr spaet in ihrem Linknetzwerk zitiert werden.

Das war relativ einfach heraus zu bekommen und die erste Seite (jeweils einmal zitiert auf LL26 und LL27) gehørt zu Alpheus Harding. Mhmm … ja, viel weiter weisz ich dazu jetzt nicht zu sagen.
Auf LL30 erhalten zwei Seiten ihre erste und einzige Zitierung: Estádio Luís Pereira und 1962 NCAA University Division baseball rankings. Weitere von diesen relativ obskuren Seiten, von denen mein „Favorit“ immer noch die bereits erwaehnte Bacon, Ohio ist.
Ebenso auf LL30 zum ersten Mal zitiert wird William E. Livingston. Zunaechst kønnte man denken, dass es sich dabei im eine Person wie Alpheus Harding handelt. Interessant genug fuer einen eigenen Wikipediaeintrag, aber nicht bedeutend genug um einen „grøszeren Eindruck“ in der Weltgeschichte hinterlasse zu haben. Dieser erste Eindruck taeuscht aber, denn William E. Livingston erhaelt weitere Zitate auf LL31, LL32, LL33, LL36, LL37, LL39, LL40, LL45 und LL50. Das kann nicht an seinen Kindern liegen, denn die werden nicht naementlich erwaehnt, ich nehme also an, dass die keine eigenen Wikipediaeintraege haben. An seiner Rolle als Offizieller der Stadt Lowell, Massachusetts kann es eigtl. auch nicht liegen. Diese wird naemlich sofort zitiert und alles was mehr oder weniger direkt damit in Verbindung steht sollte zu relativ fruehen Zitierungen fuehren. Mit dem was ich bisher ueber das Wikipedialinknetzwerk ausgewertet habe laeszt sich dies nicht løsen. Ich hoffe ich denke an diesen Mann, wenn ich so weit gekommen bin, dass ich es prinzipiell aufklaeren kønnte.

Als naechses folgt auf LL35 und LL37 Estádio Juca Ribeiro. Aha! … … … Øhm … ja … ich nehme an die Zitierungen erfolgen im Zusammenhang mit Fuszball.
Fuer die letzten zwei, ganz weit am Ende haengenden, Seiten Mitsubishi Yowa Sugamo Ground (zitiert auf LL39) und Caius Novac gilt das bestimmt auch.

Vielmehr weisz ich dazu nicht zu sagen. Ich wollte nur mal schauen und hier steckt nix weiter drin was man lernen kønnte. Das liegt aber in der Natur singulaerer Ausreiszer.

… … …

… … …

… … …

Themenwechsel zu einem anderen losen Ende: die individuellen Verteilung(en) der Selbstreferenzen pro Linklevel steht noch aus

Zur Erinnerung: bei den totalen Links dachte ich zunaechst begeistert, dass sich dahinter was Cooles und Interessantes verbirgt, gestand am Ende dann aber doch ein, dass ich mich etwas verrant hatte. Das Selbe bei den neuen Links konnte ich kurz abhandeln.

Ich erwaehne das, weil ich nochmals kurz auf die Verteilung der Anzahl der Links pro Seite auf LL0 (ob totale oder neue macht dabei keinen erwaehnenswerten Unterschied) zurueckkommen muss. Ganz spezifisch auf die Tatsaeche, dass diese Verteilung ueber ca. vier Grøszenordnungen (auf der Ordinate) einem maechtigen Gesetz zu folgen scheint. Das ist an und fuer sich nicht weiter verwunderlich, da viele Prozesse in der Natur Potenzgesetzen folgen.
Wichtig ist nun, dass dies auf høheren Linkleveln nicht mehr (oder nur noch sehr bedingt mit Augen zukneifen) gilt. Der Grund ist, weil dann ja auch die vielen Urpsrungsseiten die mit wenigen Links starteten so weit in ihrem Linknetzwerk gekommen sind, sodass immer irgendwie eine Seite mit vielen Links dabei ist. Das verschmiert also.

Nach dieser Wiederholung von bereits Bekannten war ich zunaechst ueberrascht, dass Letzteres nicht fuer die Selbstreferenzen gilt. In diesem Diagramm …

… sind zwei representative individuelle Verteilungen gezeigt. Um sinnvoll mehrere derartige Datensaetze darzustellen habe ich aus den bekannten Balkendiagrammen diesmal Punktdiagramme gemacht. Der Informationsinhalt ist natuerlich der Gleiche.

Wir sehen: egal ob LL2 oder LL10, so folgen die individuellen Verteilungen maechtigen Gesetzen.
Als ich etwas laenger darueber nachgedacht hatte, kam ich zu dem Schluss, dass ich eigentlich gar nicht ueberrascht sein musste. Denn auch wenn fuer die Verteilungen der (totalen/neuen) Links der oben erwaehnte „verschmierende Prozess“ einsetzt, so sind die Selbstreferenzen davon unabhaengig.
Klar, auf den ersten Linkleveln treten zunaechst mehr Selbstreferenzen auf, einfach weil mehr Seiten zur Verfuegung stehen. Das Integral unter der Kurve wird also grøszer und grøszere Werte auf der Abszisse werden „besetzt“. Ebenso klar ist, dass diese beiden Charakteristiken fuer høhere Linklevel abnehmen muessen (eben weil dann wieder weniger Seiten zur Verfuegung stehen). Und das sieht man in den beiden Kurven des Diagramms. Aber mir faellt kein Prozess ein, der zu Abweichungen vom Potenzgesetz fuehren kønnte.

Oder anders: die Verteilung der Grøsze der Einschlagskrater auf Mimas verhaelt sich ja schlieszlich auch nach dem gleichen maechtigen Gesetz wie die selbe Verteilung gemessen an Lady Luna. Es spielt ueberhaupt keine Rolle, dass Letztere einen ca. zehn Mal so groszen Radius hat im Vergleich zu Ersterem. Der Erdmond hat mit einer fast 100 Mal grøszeren Oberflaeche eine entsprechend høhere Anzahl an Kratern, das Signal welches besagte Verteilung ausmacht ist also grøszer … aber das verhaelt sich nach dem selben Potenzgesetz und insb. ist auch der Anstieg der Kurve fuer beide Verteilungen gleich.

Ich erwaehne den Anstieg deshalb, weil ich damit zu einer urst spannenden Sache ueberleiten kann. JA, egal wie hoch das Linklevel ist, die Verteilungen verhalten sich immer nach einem Potenzgesetz. ABER der Anstieg aendert sich.
Das waere aber zu viel des Guten fuer diesen einen Artikel und deswegen komme ich darauf beim naechsten Mal zurueck :) .

Beim letzten Mal erwaehnte ich, das ich

[…] mich daran machte, die wirklichen, altersspezifischen Zahlen zu finden […].

Das stellte sich aber zunaechst als gar nicht so leicht heraus. Der Grund liegt darin, dass in allgemeineren Publikationen bzgl. der Auswirkungen von Krebs diese Zahlen relativ wenig von Interesse sind. Es ist klar, dass ueber 60-jaehrige viel øfter Krebs bekommen als unter 60-jaehrige. Eine Gesellschaft hat aber mehr von Letzteren als von Ersteren. Das ist bei solchen Artikeln in Betracht gezogen und drueckt sich darin aus, dass alle Zahlen „per 100-tausend (Einwohner)“ sind.
Der Artikel von Ugai, T., et al ist bereits eine Ausnahme, weil darin bereits eine altersspezifische Unterscheidung vollzogen wird. Aber mit „juenger oder aelter als 50 Jahre“ ist besagte Unterscheidung sehr grob und ich wollte das feinkørniger haben.

Andererseits sind solche Zahlen sind auch voll informativ, wie der Artikel „Global Cancer Statistics 2020: GLOBOCAN Estimates of Incidence and Mortality Worldwide for 36 Cancers in 185 Countries“ von Hyuna Sung et al. in CA: A Cancer Journal for Clinicians, 71, 2021, pp. 209–249 zeigt.
Ehrlich, das ist total lohnenswert sich die Grafiken dort mal anzuschauen! Denn wenn man drueber nachdenkt, dann ist es ein voll gute Sache, dass heutzutage ((nicht nur) in den reichen Laendern) die Leute haeufiger an Krebs sterben. Das bedeutet naemlich, dass unheimlich viele vermeidbare Todesursachen verhindert werden. Heutzutage sterben ((nicht nur) in den reichen Laendern) weniger Leute an Infektionskrankheiten, verseuchter Umwelt, bei (Arbeits)Unfaellen etc. pp. Und nur _weil_ wir ((nicht nur) in den reichen Laendern) aelter werden kann Krebs ueberhaupt die Todesursache sein.
(Anmerkung: ich habe das „((nicht nur) in den reichen Laendern)“ rein gepackt um deutlich zu machen, dass sich dieser Fortschritt vor allem auf die „westliche“ Welt bezieht, ABER dass es auch in anderen Teilen der Erde besser geworden ist).

Hinzu kommen diese beiden Zahlen aus dem Artikel, welche wirklich nur positiv interpretiert werden kønnen:
– 19.3 Millionen gemeldete Krebsfaelle (weltweit, 2020)
– 9.9 Millionen gemeldete Krebstote (weltweit, 2020)

Wait! What?! Selbst wenn man SEHR pessimistisch ist und annimmt, dass nur 1/4 der Menschheit fuer diese Statistik in Betracht gezogen wird (auch wenn da „weltweit“ steht), weil der Rest in Gebieten wohnt wo kein Arzt hin kommt, dann bedeutet die erste Zahl, dass die Chance Krebs zu bekommen bei weniger als einem Prozent liegt!
Und die zweite Zahl bedeutet, dass heutzutage 50 Prozent der Leute den Krebs ueberleben! … WOW! … Ich sagte bereits frueher, dass man sich nicht all zu sehr den Kopf zerbrechen muss ueber Krebs.

Auch wenn das voll interessant ist, so war es nicht, was ich suchte. Irgendwann fand ich einen fast 1600 Seiten langen Report mit dem Titel „Cancer Incidence in Five Continents Vol. XI“ (direkt zum PDF) von der International Agency for Research on Cancer. Hurra! Denn hier fand ich endlich laender- und krebsspezifische Zahlen.
Und wieder ist die Chance Krebs zu bekommen fuer mich, der ich in Norwegen (S. 869) wohne, mit ca. 1.3 Prozent ziemlich klein. (Anmerkung: diese Zahl bestaetigt indirekt, dass mglw. weltweit tatsaechlich nur 1/4 aller Krebsfaelle registriert werden, denn fuer Norwegen kann angenommen werden, dass so ziemlich alle Einwohner Zugang zu einem Arzt haben.)

Aber das war immer noch nicht was ich suchte, denn auch wenn die durchschnittliche Wahrscheinlichkeit so klein ist, so liegt die kumulative Wahrscheinlichkeit ueber das ganze Leben bei ungefaehr 40-50 Prozent und ich wollte wissen wie das in meiner Altersgruppe aussieht. Doch dann, spaet Abends, fand ich endlich (wieder) von der International Agency for Research on Cancer eine Datenbank mit dem Titel „Global Cancer Observatory„.

Was fuer Datenschatz! … Damit transformierte ich vom (Daten)Jaeger zum (Daten)Sammler … und damit geht es beim naechsten Mal weiter.

Ich hatte bereits mehrfach erwaehnt, dass Minecraft Turing-komplett ist und Minecraft-Computer sind ja nix neues mehr. Im Wesentlichen geschieht dort das Gleiche wie beim Magic Beispiel vom letzten Mal: (Spiel)Elemente werden in einer bestimmten Reihenfolge angewendet und dies kann dann uminterpretiert werden als Elemente und Instruktionen der Turingmaschine. Bei Minecraft ist das nur viel intuitiver als bei Magic, weil man ja schon mit technischem (Spiel)Elementen anfaengt.
Letzteres ist der Grund, warum ich Minecraft in dieser Serie eigentlich nicht behandeln wollte.

Nun stolperte ich aber darueber, dass jemand einen Minecraft-Computer gebaut hat, in dem Minecraft selbst laeuft. Cool wa! Der Computer im verlinkten Video ist ein Upgrade von dem Modell was hier etwas detaillierter vorgestellt wird (mit noch mehr Programmbeispielen).

Das ist eigentlich immer noch nicht wert fuer diese Serie. Ich bringe es hier, weil ich mehrmals sagte, dass fuer eine gegebene Turingmaschine eine konkrete Uebersetzung eines Programms sehr komplex sein kann und die Bearbeitung von aequivalenten Programmenschritten mitunter sehr viele Einzelschritte in der Turingmaschine benøtigt und damit sehr lange dauert. Hier geht es schnell genug, dass man das zeigen kann. Aber die Implementierung lief bei 10-tausendfacher Geschwindigkeit (und die Videos sind nochmals schneller abgespielt), denn andernfalls …

[…] it would run at a frame every few days

Weil dies das Gesagte so schøn illustriert, war Minecraft dann doch einen kurzen Beitrag wert.

Ach ja, der Titel kommt daher, weil die Leute daran arbeiten, dass auch DOOM auf diesem Computer laeuft. Wenn das fertig ist, ich drueber stolper und mich dran erinnere, dann werde ich das hier auch erwaehnen.