Archive for the ‘Allgemein’ Category

Beim letzten Mal argumentierte ich, dass man sich keine unnøtigen (!) Sorgen machen sollte, vor Krebsarten, nur weil man von denen schon mal gehørt hat. Das Argument war nicht, dass man sich ueberhaupt nicht mehr drum kuemmern soll. Vielmehr wollte ich darauf hinaus, dass man die nur menschliche Reaktion des Gruebelns anbetracht des Themas „herunterskalieren“ kann, angesichts der tatsaechlichen Daten. Das ist alles kein Hexenwerk.

Heute møchte ich auf einen weiteren Aspekt hinaus, der uns auch unnøtige (!) Sorge bereitet: weil man nunmal eine alternde, (hochfunktionelle) Ansammlung von Zellen (vulgo: ein Mensch) ist, kann man grundsaetzlich nix dagegen tun Krebs zu bekommen! Unter der Einschraenkung, dass Frauen bspw. keinen Prostatakrebs bekommen kønnen … aber ungefaehr jeder 100ste Brustkrebs tritt bei Maennern und selbst Nichtraucher erkranken an Lungenkrebs.

Worauf ich hinaus will ist, dass wir das nicht kontrollieren kønnen und das ist ein anderer Aspekt der oft zu unnøtigen Aengsten fuehrt und dass man sich Gedanken macht.
Als Gegenbeispiel møge der Straszenverkehr dienen. Der Erfolg jeder Autofahrt (oder auch jeden Spaziergangs in der Stadt) ist davon abhaengig, dass hunderte, ja tausende zufaellige Sachen passieren oder nicht passieren. Die meisten davon liegen auszerhalb meines „Wirkungsbereichs“, die passieren also auch ohne, dass ich das beeinflussen kønnte. Aber weil man ja selber am Steuer sitzt, hat man den Eindruck, dass alles unter (persønlicher) Kontrolle ist und macht sich deswegen keine unnøtigen Gedanken darueber.

Meine Hoffnung ist, dass es meinem inneren Frieden diesbezueglich hilft wenn ich mir dieser Prozesse bewusst bin. JA, Krebs kann man nunmal ohne eigenes „Verschulden“ bekommen (leider), aber daran aendert sich nix wenn ich drueber grueble und mir Sorgen mache.

Beim naechsten Mal dann zwei Ausnahmen von dieser Regel.

Vor einer Weile entdeckte ich, dass die individuellen Verteilungen der Selbstreferenzen pro Linklevel maechtigen Gesetzen unterliegen. Das brachte mich auf die Idee mit der Simulation. Dafuer musste ich aber herausfinden, wie sich das System entwickelt. Dies wiederum vollbrachte ich mit einer Untersuchung der Abhaengigkeit der Anzahl der Selbstreferenzen auf einem Linklevel von der Anzahl der Selbstreferenzen auf dem Linklevel davor.
Ersteres hatte ich sowohl fuer die Anzahl aller, als auch die Anzahl neuer Links pro Linklevel getan und da kam eigtl. nix bei raus. Die Idee Letzters mal zu machen kam mir damals erst gar nicht. Das hole ich heute nach.

Zum Glueck muss ich nicht mehr erklaeren was ich hier eigentlich mache und kann sofort ohne viel Aufhebens repraesentative Kurven bzgl. der Anzahl der totalen Links zeigen:

WOW! … Das war meine erste Reaktion als ich das sah. Denn ich hatte obiges Nullergebniss, dass bei den (einfachen) individuellen Verteilungen nicht viel bei rum kam, noch im Hinterkopf. Aber dann praesentiert sich mir hier pløtzlich eine so wunderschøne Abhaengigkeit.

Das ist zwar nicht linear und die Entwicklung des Systems „macht ’ne Kurve und kehrt zurueck“, aber in der doppellogarithmischen Darstellung sieht das aus wie’n Ausschnitt aus ’ner Ellipse und Orbits sind mathematisch in geschlossener Form behandelbar. Das wuerde das Ganze nur etwas komplizierter machen, denn Orbits sind … ich sag jetzt mal im generellen Sinne … zeitabhaengig.
Oder anders: bei den Selbstreferenzen konnte ich einfach sagen, dass die Selbstreferenzen auf dem naechsten Linklevel NUR von den Selbstreferenzen auf dem jetzigen Linklevel abhaengen, aber nicht vom Linklevel selber. Das ist beim Orbit nicht mehr der Fall, denn solche sind keine bijektiven Abbildungen mehr sondern nur noch surjektive Abbildungen. Bei der Entwicklung muss man sich also „merken“ ob man auf dem oberen „Ast“ oder (schon) auf dem unteren „Ast“ ist, denn wenn ein Punkt sich noch auf Ersterem befindet, so soll dieser nicht einfach „runter springen“ sondern schøn „um die Kurve rumgehen“.

Aber Achtung, das ist keine wirkliche Ellipse, denn bei spaeteren Linkleveln verhaelt sich das auch bei linearen Achsen linear:

Aber selbst dann kønnte man das mathematisch noch als Bézier Kurve darstellen.

Bei den neuen Links ist das im Wesentlichen das Gleiche:

Die Skala reicht natuerlich nicht so weit und die neuen Links laufen den totalen Links „voraus“. Letzteres sieht man in der linearen Darstellung an den schwarzen Punkte fuer die neuen Links von LL2 zu LL3. Diese erreichen und ueberschreiten das Maximum bereits, waehrend das bei den totalen Links von LL2 zu LL3 noch nicht der Fall ist.
Aber das war zu erwarten und dieses Phaenomen des „Vorauseilens“ ist uns schon bei der Anzahl der neuen Links pro Linklevel im Vergleich zur Anzahl der totalen Links pro Linklevel ueber den Weg gelaufen, wo Erstere das Maximum eher erreichten als Letztere.

Lange Rede kurzer Sinn, auch die Entwicklung dieser beiden Grøszen kann man mathematisch beschreiben und dann prinzipiell mit nur einer Messung des Anfangszustands besagte Entwicklung des Systems berechnen. Das spare ich mir aber, denn ich habe da keine Lust mehr drauf.

Ach so, Aussteiger der totalen Links habe ich bereits gruendlich untersucht (und das Ergebniss kann auf neue Links uebertragen werden) und Ketten von neuen oder totalen Links kønnen per definitionem nicht reaktiviert werden.

Wir bleiben bei den Genen und heute wird’s voll spannend, denn es geht um Mutationen. Aber dafuer muss ich etwas ausholen.

Aminosaeuren sind unentbehrlich (vor allem in Form von Proteinen) fuer das Funktionieren der Zelle, des Kørpers und des Geistes (Letzteres weil diese bspw. beim Transport von Neurotransmittern eine wichtige Rolle spielen). Die DNA (also der einzige physische Teil den die Kinder von den Eltern haben) kodiert all die fuer’s Menschenleben notwendigen Aminosaeuren.
So wie ein Byte sich (heutzutage) aus acht Bits zusammensetzt, so setzt sich eine Aminosaeure (sehr vereinfacht gesagt) aus jeweils drei Nukleotiden zusammen. Letztere sind die allgemein bekannten „Buchstaben“ (oder eben Bits) der DNA; Adenin (A), Cytosin (C), Guanin (G) und Thymin (T).

Das als Grundlage. Um weiter zu kommen nehme ich das Beispiel Serin — eine Aminosaeure die bei geistigen Funktionen eine wichige Rolle spielt. Diese setzt sich aus den Nukleotiden T-C-T zusammen … oder T-C-C … oder T-C-A … oder T-C-G. Anders als bei Bytes in der Informationstechnik kann man die „Bits“ einer Aminosaeure (bedingt!) austauschen und erhaelt trotzdem die gleiche Aminosaeure mit der selben Funktion! Das sind sogenannte neutrale Mutationen.
Das Ist natuerlich urst toll, denn das macht die Biologie verdammt robust.

Wann immer die DNA reproduziert wird, kann so ein „Bitflip“ stattfinden. Das ist natuerlich ganz wichtig bzgl. der Meiose (die hier ja auch schonmal Thema war), welche die Keimzellen zum Resultat hat, denn diese uebetragen ja die „elterliche DNA“ zum Kind.
Dank dieser Bitflips ist es nun aber nicht mehr die 100%-gleiche DNA wie die Eltern sie haben. Ihr, meine lieben Leserinnen und Leser, kønnt sicher erahnen worauf ich hinaus will.

Bei neutralen Mutationen kønnte man sich natuerlich damit rausreden, dass es bei dem „elterlichen Teil den leibliche Kinder weitertragen“ um den Phaenotyp geht. Also dass schlussendlich der Ausdruck des Genotyp entscheident ist; Serin ist Serin, egal wie es aufgebaut ist.
Hier kann man nun aehnliche Gedankengaenge (a.k.a. „Salamitaktik“) anwenden wie beim letzten Mal um die Absurditaet dieses Konzepts darzustellen. Bei einem Bitflip, insb. da die Funktion erhalten bleibt, geh ich mit besagtem Konzept mit. Aber was ist mit 100 Bitflips oder Tausenden? Das hørt sich nach viel an, aber das kann selbst bei eineiige Zwillinge nach der Geburt auftreten … *hust* … und im hiesigen Zusammenhang akkumulieren sich solche Veraenderungen auch ueber die Generationen.

Wieauchimmer, die Herangehensweise mit den Bitflips wird im naechsten Schritt erweitert zu Aminosaeuren welche dann DOCH anders sind, die aber auch keine Aenderung des Phaenotyps zur Folge haben, wenn diese sich in nichtkodierenden Abschnitten der DNA befinden. Und dann noch einen Schritt zu Mutationen die den Phaenotyp dann doch veraendern, man das aber nicht merkt. Und dann Mutationen wo man das doch merkt, das aber nicht wichtig ist (bspw. eine andere Augenfarbe) … usw. usf.
All diese Mutationen … da bleibt am Ende nicht viel uebrig von dem was die Eltern (oder Ururur…groszeltern) ausmacht(e) (egal ob Geno- oder Phaenotyp). Auszer natuerlich, dass diese Menschen sind (oder waren). Und letztlich stellt wieder die Frage ab wann dieser „Weiterggetragene Teil“ nicht mehr da ist und wo der hin ist.

Das Konzept um das diese ganze Miniserie geht, kann also nicht darin liegen, dass die Kinder die DNA der Eltern weitertragen (denn das tun sie nicht). Das fuehrt dann wieder zum Schluss, dass besagtes Konzept aufgegeben werden muss … oder dass es sich dabei eigentlich um etwas anderes handelt. In dem (geistig, gesellschaftlich, sozialem) postmodernem Fundment auf welchem ich versuche mich zurecht zu finden ist das durchaus zulaessig. Aber dann befindet man sich auszerhalb dessen mit dem ein aeuszeres, rationales, objektives Universum beschrieben werden kann.

Das soll genug sein fuer heute. Ich hoffe, dass ich’s halbwegs geschafft habe, diesen spezifischen Punkt rueber zu bringen. Beim naechsten Mal geht es um einen anderen, nicht minder spannenden, genetischen Aspekt.

Es ist wohl zur Gewhohnheit innerhalb dieser Maxiserie geworden, (meist zum Abschluss) zu schauen um was fuer Seiten es sich bei den extremen Ausreiszern handelt. Das ist eigentlich eine schøne Tradition und ich behalte das bei :). Heute ergeben sich Ausreiszer aus zwei Grafen.

Die Ersten sind die Seiten die zu den fuenf Punkten am Ende der Kurve der Anzahl der ausgestiegenen Seiten pro Linklevel fuehren. Alle diese haben mindestens bis LL4 hunderte von Selbstzitate, zwei sogar zum Teil mehrere Tausend. Ebenso haben diese eine ununterbrochene Kette von Selbstreferenzen bis zum gegebenen „Ausstieg“. Aber die Kette besteht zum allergrøszten Teil ab ca. LL10 nur noch aus Einsen (mit ein paar Zweien dazwischen).

Wieauchimmer, los geht’s mit Campinas, eine Stadt in Brazilien … wait! what? … das riecht doch schon wieder verdaechtig nach Fuszballkram … welche auf LL50 aussteigt. Gefolgt von Associação Portuguesa de Desportos … ICH WUSSTE ES! … einem brasilianischen Fuszballklubb auf LL60.
Auf LL66 begegnet uns ein alter (und bereits ausfuehrlich besprochener) Bekannter: der São Paulo FC.
Diesem schlieszen sich auf LL67 mit Campeonato Paulista eine brasilianische Fuszballliga, mit Sociedade Esportiva Palmeiras, Santos FC und Sport Club Corinthians Paulista vier brasilianische Sportklubbs (die am am meisten wg. ihrer Fuszballaktivitaeten bekannt sind) und die (brasilianische! … das scheint heute das zugrundeliegende Thema zu sein) Stadt São Paulo an.
Die laengste Seite, mit einer unnunterbrochenen Kette an Selbstreferenzen bis LL68 ist … *enttaeuschter trommelwirbel denn irgendwie ahnt man bereits dass das auch wieder dem Fuszball zugehørig sein wird* … Exhibition game. … Oh warte mal. Das gibt’s ja auch fuer andere Sportarten … Hurra!

Zum Zweiten schaute ich mir mal an welche Seiten in den Heatmaps des letzten Beitrag zu den høchsten Punkten fuehren; also reaktivierte Linkketten die 25 oder mehr (zusammenhaengenden) Linklevel haben. Eine kleine Warnung: es geht weiter mit Fuszball.

Im „Verhalten“ sind diese Seiten aehnlich wie die Obigen. Nur im langen Schwanz der Kette wo immer nur einzelne Selbstzitate auftreten gibt es eben Brueche. Mit einer Ausname das Fuszballstadion Pfarrwiese, die keine Selbstreferenzen auf LL1 hat und dann auf LL2 „reaktiviert“ wird mit einer Kette die 29 Linklevel weit reicht. Ebenso 29 „Kettenglieder“ hat das Atahualpa Olympic Stadium, aber dessen „Schwanz“ bricht zwei Mal ab, bevor diese Kette bei LL15 (re)aktiviert wird.
Ein doppelter Abbruch erfolgt auch fuer den FC UTA Arad, das Estádio Urbano Caldeira und den Clube Atlético Juventus deren reaktivierte Linkketten mit jeweils 30, 33 und 34 Kettengliedern auf LL17 , LL25  und LL28 anfangen. Bei Letzterem ist die reaktivierte (und laengste) Kette aber in der Mitte und nicht am Ende.
Sogar fuenf Abbrueche weist die Stadt Santos, São Paulo auf und die vierte reaktivierte Kette an Selbstreferenzen, mit 39 Kettengliedern, beginnt auf LL26.
Mit ganzen 43 Gliedern hat die allerlaengste reaktivierte Kette (auch in der Mitte zwischen dem ersten und zweiten Abbruch) das Pacaembu Stadium.

So, das war’s fuer heute mit dem traditionellen Beglotzen von Ausreiszern. Wie mit Extremwerten ueblich gibt’s hier wenig zu holen, ’s ist aber mal witzig zu schauen.

Ich habe diese Miniserie nicht vergessen. Ich war nur so beschaeftigt mit anderen interessanten Sachen.
Wieauchimmer, beim letzten Mal erwaehnte ich, dass Schmidt, G. A. und Frank, A. in „The Silurian hypothesis: would it be possible to detect an industrial civilization in the geological record?“ im International Journal of Astrobiology, 18(2), 2018, pp. 142–150 ebenso wie ich zu dem Schluss kommen, dass es unwahrscheinlich ist, dass kuenstliche Artefakte (vulgo: Werkzeuge oder Haeuser) oder Fossilien als Zeugen einer Zivilisation von vor vielen Millionen Jahren herhalten kønnten.

Das heiszt aber nicht, dass eine solche Zivilisation keine Spuren hinterlaeszt. Denn …

[…] it is already clear that our human efforts will impact the geologic record being laid down today […].

Und „geologic record“ bedeutet, dass das auch in vielen Millionen Jahren noch messbar sein wird … wenn auch mit einem kleinen Signal. Aber dazu komme ich heute noch nicht. Heute geht es vielmehr darum, dass man bei laenger bestehenden Zivilisationen ein grøszeres Signal in den (geologischen) Daten erwarten wuerde. Aber …

[…] the longer a civilization lasts, the more sustainable its practices would need to have become in order to survive.

Was ja voll logisch ist und nicht weiter erklaert werden muss. Leider (nicht allgemein, sondern nur in diesem Zusammenhang) gilt auch, dass je nachhaltiger eine Zivilisation ist, umso kleiner deren „globaler Fuszabdruck“ wird. Lokal ist das nur bedingt gueltig, aber lokale Veraenderungen bleiben unbemerkt weil diese nicht gefunden werden oder kønnten einfach nur geologische Kuriositaeten sein. Am besten ist etwas das sich ueber die ganze Erde verbreitet (*hust*), aber wegen obiger Feststellung …

[…] might [the footprint of civilization] be self-limiting on a relatively short timescale.

Das bedeutet dann, dass in besagten stratigrafische Aufzeichnung …

[…] the Anthropocene will likely only appear as a section a few cm thick […].

Aber ein Ass haben zukuenftige Forscher dennoch im Aermel, denn dieses Signal …

[…] [will] appear almost instantaneously in the record.

Na das ist doch was womit man arbeiten kann. Dazu mehr in den naechsten Beitraeagen.

Zum Abschluss sei noch gesagt, dass die Autoren sich nur auf die Diskussion von Dingen beschraenken, von denen sie wissen dass diese bereits einen Einfluss auf die stratigrafische Aufzeichnung haben und wie das Signal dieser Dinge in etlichen Millionen Jahren aussehen wuerde. Coruscant Szenarios werden also nicht betrachtet.

Heute ein Diagramm, welches so nicht (mehr oder weniger) direkt aus der Tabelle zu bekommen ist. Hier sind …

… die drei haeufigsten Krebsarten per Alltagsgruppe (wie immer: die Zahlen sind NUR fuer norwegische Maenner im Jahre 2020).
An den Balken kann man ablesen, wie viel Prozent aller Krebsfaelle in einer Altersgruppe zu einer bestimmen Krebsart gehørten. Die drei haeufigsten Arten sind farbkodiert und alle anderen im weiszen Abschnitt eines Balkens zusammengefasst. Ueber jedem Balken ist die Anzahl der totalen Krebsfaelle in der gegebenen Altersgruppe wiedergegeben.

Auf den ersten Blick sieht das ja furchterregend aus! Warum ist das aber (schon wieder) ein positiv zu interpretierendes Diagramm und wie passt das mit dem Titel dieses Beitrags zusammen?
Das ist einfach zu erklaeren und liegt darin begruendet, dass man nie vor unkonkreten Dingen Angst, sondern nur vor solchen Sachen, denen man einen Namen geben kann. Hier meine ich damit, dass man sich bspw. als junger Mann mit 15 Jahren Sorgen um Hodenkrebs macht, weil man das irgendwo gehørt hat. Das ist eine menschliche und sehr verstaendliche Reaktion. Aber besagter junger Mann sorgt sich dann nicht im selben Masze ueber all die anderen potentiellen Krebsarten, die man auch bekommen kønnte. Dies trotz der Tatsache, dass es sogar wahrscheinlicher ist, dass man an denen, und nicht an Hodenkrebs, erkrankt.

Worauf ich hinaus will: man sollte spezifische, einem „bekannte“ Krebsarten im selben Lichte sehen wie alle Krebsarten von denen man noch nix gehørt hat. An Letzteren zu erkranken ist wahrscheinlicher, aber vor denen hat man keine Angst. Warum sollte man also Angst haben vor einer spezifischen Krebsart.
Hinzu kommt hier auch wieder, dass die Chance ueberhaupt an Krebs zu erkranken (noch dazu an einer bestimmten Art), ziemlich klein ist. In meiner Altersgruppe sind mehr als 150-tausend Maenner und weniger als 250 Maenner haben ueberhaupt Krebs bekommen. Meine Sorge vor Darmkrebs sollte ich also entsprechend (deutlich) zurueckschrauben.

Was das NICHT bedeutet: das bedeutet NICHT, dass man sich ueberhaupt keine Gedanken mehr macht und deshalb nicht zu den Vorsorgeuntersuchung geht. Egal wie klein die Chancen auch sind, wenn man spezifische Krebsarten betrachtet (also wenn einem sozusagen ALLE Krebsarten bekannt sind), dann ist die Chance die Haeufigste zu bekommen (per definitionem) am grøszten. Und das ist der Punkt an dem Vorsorgeuntersuchungen ansetzen.

Das Diagramm ist auch auf verschiedene andere Arten voll spannend, aber die Erkundung des Informationsgehalts ueberlasse ich euch, meinen lieben Leserinnen und Lesern, als Hausaufgabe :) .

Vor einer Weile erhielt ich einen neuen Laptop und sogleich machte ich das was man halt so macht: ich schraubte den auf, …

… denn ich wollte schauen ob ich einfach die Festplatte meines alten Laptops reinstecken kønnte. Kann ich nicht, denn die 500 GB Festplatte ist der duenne „Streifen“ links neben der Bueroklammer!

Krass! Damals (vor nur sehr wenigen Jahren!) als ich mit dem Studium anfing, kaufte ich eine 20 GB Festplatte und die war echt grosz. Ich erinnere mich noch wie ich erstaunt fragte ob ich ueberhaupt so viel Speicherplatz brauche. Die Antwort war: Keine Sorge die kriegst du schon voll“. Wieauchimmer, das war noch ein richtiger Klotz und 25 davon neben oder aufeinander gestellt haetten signifikant mehr Platz weggenommen als dieser Streifen.

Da kann ich nur sagen: Wir leben ja wohl mal voll in der Zukunft! Cool wa!

Ich gebe zu, dass ich mich in letzter Zeit mehr um Kevin Bacon und Krebs gekuemmert habe und diese Miniserie etwas kurz gekommen ist.
Wieauchimmer, heute geht es um ein Kernkonzept bzgl. dessen was ich eigtl. mit dieser Miniserie ausdruecken will: wieviele Gene „muessen“ von einem eigtl. in den Kindern sein, damit diese einen Teil von mir weitertragen? Eine Frage, welche direkt aus dem Bild im allerersten Beitrag folgt.

Ich befuerchte die meisten Menschen denken (wenn ueberhaupt) nur eine Generation weit:

Die Gene der Eltern finden sich je zur Haelfte im Kind wieder. Wenn ich dran glauben wuerde, kønnte ich da ja noch mitgehen, dass das Kind „etwas“ von den Eltern „weitertraegt“. … Aber die Groszeltern haben das doch auch schon gedacht und uebertragen das (irre) Konzept des „Weitertragens“ von Wasauchimmer auf die Enkel. Nur … da ist dann viel weniger von den Genen uebrig:

Nun nehme man mal an, dass die Eltern der Eltern sich nicht ausstehen kønnen? „Hat“ das Kind dann „mehr“ von den Groszeltern muetterlicherseits oder vaeterlicherseits? Und kønnen besagte Omas und Opas sich da drauf einigen?

Wenn man noch eine Generation weiter zurueck geht wird’s etwas unuebersichtlich:

Mhmmmmm … … …

Der Mensch hat ungefaehr 50-tausend Gene. Davon tragen weniger als die Haelfte ueberhaupt zum Phaenotyp bei (in wissenschaftlicher Sprache: weniger als die Haelfte unserer Gene druecken Proteine aus) … bzw. kann man sogar sagen, dass viel viel viel weniger davon zu dem beitragen was man als Mensch verstehen wuerde. Es braucht naemlich urst krass viele Gene die Zeug machen nur damit die Zelle ueberhaupt funktioniert und das traegt dann weder zur Persønlichkeit, noch den zerebralen Faehigkeiten oder den Muskeln eines Menschen bei.

Aber fuer eine _sehr_ konservative Abschaetzung lasse ich einen Menschen mit diesen 50-tausend Genen starten und sage, dass diese auch alle Ausdruck dessen sind was von diesem Menschen weitergetragen werden kønnte. Das Kind hat dann schon nur noch 25.000 davon, die Enkel nur noch 12.500, die Urenkel nur noch 6.300. Es ist leicht zu sehen ab wann nix mehr vom urspruenglichen Menschen uebrig ist: nach 16 Generationen ist weniger als 1 Gen uebrig.
Wenn man annimmt, dass es von einer Generation zur naechsten ca. 30 Jahre dauert, so ist nach ca. 500 Jahren nichts mehr da was weitergetragen werden kønnte.

In Wahrheit geht das VIEL schneller, denn es vergeht weniger Zeit zwischen den Generationen UND es gibt VIIIIIEEEEEL weniger Gene die das Menschsein, geschweige denn das Individuum-sein ausdruecken. Ich denke, dass die Corgis der Queen das gut ausdruecken, denn Susan ist 14 Generationen von Willow entfernt und das geschah alles innerhalb der Lebenszeit eines Menschen.
Und alle Versuche das durch Inzucht zu verlangsamen sind spektakulaer fehlgeschlagen.

Aber egal wie lange das „Verduennen der Gene“ auch braucht bis nix mehr uebrig ist, im Grunde fuehrt auch hier wieder alles darauf zurueck, dass das Konzept, dass Kinder etwas von den Eltern weitertragen, vølliger Irrsinn ist. Menschlich ist das verstaendlich, aber wenn mein N-mal-Urenkel nix mehr von „mir“ hat, warum sollte dann mein N-minus-eins-mal-Urenkel was von „mir“ gehabt haben und so weiter bis zum Kind. Das ist einfache Induktion. Oder man muss erklaeren warum das „etwas“ pløtzlich weg ist und wo das dann hin ist. Aber dann bewegt man sich nicht mehr auf dem Gebiet der Wissenschaft. Das ist auch sehr menschlich, aber da kenn ich mich nicht aus.
Genug fuer heute, aber mit Genen geht’s auch beim naechsten Mal weiter.

Waehrend ich die Information in den Diagrammen der vorangehenden Artikel als positiv interpretiere, so gebe ich zu, dass insb. der Graf des (korrigierten) kumulativen Risikos doch etwas furchteinfløszend aussieht. Das liegt natuerlich daran, dass dieser ab ca. 55 Jahren so schnell hoch geht und dann ueber 60 % erreicht in der letzten Altersgruppe. Deswegen zeige ich heute den dazugehørenden Grafen bzgl. der Mortalitaet … … … jaja, ich weisz, es ist etwas kurios „Sterblichkeit“ und „gute Nachrichten“ zusammen zu packen … aber wenn man die Ergebisse sieht, dann ist das sinnvoll:

Wie immer gelten diese Zahlen nur fuer Maenner in Norwegen, die Datenpunkte sind per Altersgruppe und fuer alle Krebsarten zusammen. Ebenso gilt auch hier wieder, dass die Striche zwischen besagten Punkten nicht als Zwischenwerte anzusehen sind, sondern als visuelle Hilfen um dem Verlauf besser folgen zu kønnen.

In den vorangehenden Beitraegen habe ich nur von der Inzidenz geredet, also wie oft Krebs ueberhaupt auftritt, ohne diesen Begriff zu verwenden. Nun muss ich aber damit anfangen, weil ich hier zwei Crude Rates (per 100.000 Menschen) vergleiche; naemlich fuer die besagte Inzidenz (schwarz im Diagramm) und die Mortalitaet (rot im Diagramm). Der Verlauf der Letzteren folgt dem Verlauf der Ersteren, bleibt aber immer darunter. Das war zu erwarten und ist noch nicht die gute Nachricht.

Die gute Nachricht ist die blaue Kurve, deren Werte an der rechten Ordinate abzulesen sind. Konkret stellt diese das Verhaeltnis der jeweiligen Crude Rate der Inzidenz und Mortalitaet dar und drueck im Wesentlichen aus, dass Krebs erstaunlich gut heilbar ist! Ich hatte das frueher schonmal ganz kurz anklingen lassen, bin aber nicht weiter drauf eingegangen.
Wie schon erwaehnt, liegt fuer Maenner in meinem Alter die jaehrliche Wahrscheinlichkeit Krebs zu bekommen bei nur 0.138 % und die Mortalitaet sogar nur bei 0.023 %. Das heiszt also, dass nur 1 von 6 Maennern die in meinem Alter mit Krebs diagnostiziert werden, auch daran stirbt. Das ist immer noch nicht toll, aber doch weit entfernt vom „Todesurteil Krebs“, welches man bei einer solchen Diagnose im Hinterkopf hat.

Natuerlich wird das Verhaeltnis mit zunehmendem Alter kleiner. Aber 10 Jahre spaeter ist es immer noch bei 5:1; und nochmals 10 bzw. 20 Jahre spaeter ist es immer noch besser als 4:1 bzw. 3:1.
In noch aelteren Altersgruppen kann man die Daten zwar noch auf diese Weise diskutieren, aber ab hier muss man bedenken, dass derart alte Maenner zwar mglw. Krebs haben, aber dann an was ganz anderem sterben. Das wuerde die Mortalitaet kuenstlich nach unten treiben.

Beim altersgruppenspezifischen und kumulativen Risiko sieht die Situation im Wesentlichen genauso aus. Deswegen diskutiere ich das nicht weiter.

Zum Abschluss møchte ich noch erwaehnen, dass diese Zahlen eine Zusammenfassung aller Krebsarten darstellen. Die Prognose ist fuer manche (zum Glueck seltene) Krebsarten nicht ganz so gut. Aber ich will die gute Laune nicht verderben und beende den Artikel an dieser Stelle.

Obligatorischer Videoschnipsel.

Neben den in den letzten zwei Beitraegen diskutierten Aussteigern gibt es auch das entgegengesetzte Phaenomen: Seiten die nach dem Abbruch der Kette von Selbstzitierungen dann auf einem høheren Linklevel pløtzlich wieder neue Selbstreferenzen aufweisen.
Bevor ich naeher darauf eingehe, muss ich zunaechst zwei Sachen nochmals explizit sagen. Zum Einen, sind bei den Daten mit denen die Entwicklungsparameter bestimmt wurden weder Aussteiger noch reaktivierte Seiten dabei. Sobald fuer eine Seite die Kette von Selbstreferenzen abgebrochen ist, wurde besagte Seite nicht weiter beruecksichtigt bei den erwaehnten Daten.
Zum Anderen kønnen (so wie bei den Aussteigern) auch hier wieder Doppelzaehlungen auftreten. Eine Kette an Selbstreferenzen kann mehrfach abbrechen und reaktiviert werden. Aber wie bei den den Aussteigern denke ich nicht, dass diese all zu sehr ins Gewicht fallen.

Zunaechst ist zu sagen, dass es zahlenmaeszig erstaunlich viele Reaktivierungen gibt:

Ab LL11 dann sogar mehr als Aussteiger und bei spaeteren Linkleveln bis zu einer Grøszenordnung mehr. Aber die absoluten Zahlen sind dann schon nur noch im Bereich von hundert oder weniger Seiten.

Mhmm … was mache ich denn nun mit diesen Daten? Ist ja auch ein bisschen peinlich, denn die letzten Mal wollte ich zu viel simulierte Seiten los werden und nun sollen die wieder dazu kommen? … Mist … ich komme wohl nicht drumrum mir das mal genauer anzuschauen. Mir sind die vielen Verteilungen aber langsam ueber, weswegen ich das heute mal ‚wieder als  Heatmaps darstelle. Es gibt zwei Aspekte von Interesse: wie lang eine reaktivierte Kette wird und wieviele Seiten im Durchschnitt dazu kommen … pro Linklevel natuerlich.
Ich vermute aber, dass Reaktivierungen in der Mehrzahl „Blips“ sind, also wenn eine Seite eher aus „Versehen“ noch ein Mal (und nur ein Mal) zitiert wird. Diese Vermutung wird durch die Daten bestaetigt:

Zwei Dinge sind zu beachten. Zum Einen geht die Skala fuer das Linklevel erst bei 2 los. Auf LL1 kann nix reaktiviert werden, weil ja (von Artefakten abgesehen) keine Seite auf LL0 Selbstreferenzen haben kann. Das bedeutet, dass der frueheste Ausstieg auf LL1 und die frueheste Reaktivierung auf LL2 stattfinden kann.
Zum Anderen ist die Farbskala logarithmisch … also die Farbskala an sich ist natuerlich linear, aber praesentiert logarithmische Werte.

Wie man sieht, ist die Aussage mit den „Blips“ bereits hier zu 50 % bestaetigt. Dies aeuszert sich in dem roten Bereich in der linken unteren Ecke. Es werden zwar ganz viele Seiten reaktiviert (im Maximum fast 500-tausend) die Laenge der reaktivierten Kette ist aber nur eins.
Irgendwie war das zu erwarten. Auf LL2 bis so ca. LL5 sind die Seiten thematisch noch relativ nah und aufgrund der totalen Anzahl an zur Verfuegung stehenden Seiten kann dann doch nochmal die eine oder andere Selbstreferenz auftreten.

Dem schlieszt sich ein schmales gruenes Band an welches fuer Seiten mit „mittellangen“ Ketten steht. Hier kommt aber die Logarithmushaftigkeit der Farbskale ins Spiel, denn „gruen“ bedeutet, dass es sich dabei nur noch um hunderte, bis høchstens ein paar wenige tausende Seiten handelt. Auf das gruene Band folgt ein relativ breiter blauer Bereich an laengeren Ketten. Davon gibt es dann aber meist nur eine einzige Seite die derart reaktiviert wird.

Die Anzahl der durchschnittlichen Selbstreferenzen die dazu kamen hat mich etwas ueberrascht:

Der Durchschnitt berechnete sich auf die folgende Weise. Fuer jede Seite mit einer gegebenen (reaktivierten) Kettenlaenge sind alle in dieser Kette enthaltenen Selbstreferenzen aufsummiert worden. Am Ende wurde dieser Wert durch die Anzahl der relevanten Seiten und besagte Kettenlaenge dividiert. Das ist also zwei Mal „durchgeschnitten“.

Die Ueberraschung liegt nun darin, dass die durchschnittlich dazukommende Anzahl an Selbstreferenzen unabhaengig von der Kettenlaenge ungefaehr Eins betraegt. Mit Ausnahme der nicht-blauen Punkte am linken Rand; aber dazu komme ich gleich.
Eigentlich ist das nicht komplett ueberraschend. Fuer relativ kurze Ketten hatte ich das erwartet und das waeren dann die fehlenden 50 % fuer die Bestaetigung der Aussage mit den „Blips“. Also das ist gut.
Seiten die lange reaktivierte Ketten (also die separaten Punkte ueber dem „blauen Feld“) aufweisen, haette ich aber zunaechst erwartet, dass es sich dabei um wichtige Seiten handelt und die einen entsprechend (viel?) høheren Durchschnitt an Selbstreferenzen aufweisen.
Ein Beispiel waere der oberste Datenpunkt bei LL14. Diese Seite weist eine Kette auf die ueber 43 weitere Linklevel geht. Aber jedes Mal wird die Seite nur ein einziges Mal zitiert. Ich vermute, dass es sich hierbei auch wieder um eine Art von Artefakt handelt.

Wenn ich aber laenger drueber nachdenke, dann passt diese Ueberraschung nicht mit den „Blips“ zusammen. Warum sollte die Kette an Selbstreferenzen fuer eine wichtige Seite abbrechen und dann stark weitergehen? Da scheint es durchaus sinnvoller zu sein, dass ein paar wenige Seiten oftmals hintereinander „blipsen“. Rein statistisch gesehen wuerde ich das bei fast 6 Millionen Seiten durchaus fuer møglich halten.

Der nicht-blaue Streifen am linken Rand hingegen drueckt diese Vermutung dann doch aus. Aus der ersten Heatmap sehen wir, dass die nicht-blauen Punkte durch relativ wenige Seiten zustande kommen. Es ist durchaus leicht vorstellbar, dass spaeter (relativ) vielzitierte Seiten auf LL1 keine Selbstzitate haben. Einfach weil die Anzahl der dort „verfuegbaren Seiten“ welche die Ursprungsseite zitieren kønnen stark begrenzt ist. Und dann geht’s halt los mit der Kette auf LL2 oder LL3.
Der rote Punkt an sich kommt durch nur 10 Seiten zustande. Da braeuchte nur eine einzige mit vielen Selbstzitaten auf LL2 dabei sein und das wuerde einen hohen Durchschnittswert ergeben.
Ein anderes Beispiel sind die zwei gruenen Datenpunkte darueber. Die kommen jeweils durch nur eine Seite zustande auf die das Vermutete dann wohl zutrifft.
Der Rest des nicht-blauen Bereichs ist im Wesentlichen eine Variation dessen, dass hier relativ wenige Seiten zum Signal beitragen und deswegen schon eine Ausnahme den Durchschnitt stark verschieben kann.

Lange Rede kurzer Sinn: Reaktivierungen spielen an sich nur fuer kleine Werte von Selbstzitierungen ein Rolle. Das kann in der totalen Anzahl an Selbstreferenzen pro Linklevel durchaus einen signifikanten Beitrag zur Folge haben aber nicht in der Gesamtheit der Datenpunkte der einzelnen Verteilungen.
Das ist natuerlich gut, denn die ich versuchte ja eigentlich Seiten los zu werden, weil ich insgesamt zu viele simuliere. Andererseits kønnte es durchaus sein, dass bei mittelhohen Linklevel solche Reaktivierungen zum Signal im „Schwanz“ beitragen..

So, das soll genug sein fuer heute. Beim naechsten Mal schauen wir mal kurz auf die Ausreiszer und dann sollte es das endlich gewesen sein mit den Selbstreferenzen.