Archive for the ‘Allgemein’ Category

Nach der vielen Theorie die letzten beiden Male heute nun Messwerte :) … aber der Reihe nach.

Das Ende des letzten Beitrages aufgreifend: waehrend es (beinahe) unvermeidlich schien, dass es eine „Insel der Unzitierten“ geben muss, so galt dies nicht fuer die Existenz des No-way-home-Archipels. In den Daten konnte ich Letzteres aber direkt nachweisen. Kann ich dies auch bzgl. der Archipele der erweiterten Form?

Wie erwaehnt, musste ich zur Klaerung dieser Frage  eine schøne rekursive Funktion schreiben. Ich wuerde diese gerne im Detail diskutieren, denn ich finde rekursive Funktionen voll toll und es ist total schade, dass ich die nicht øfter brauche. Ich befuerchte allerdings, dass dies kontrapodutkiv waere. Deswegen muss ich die Diskussion anders aufziehen.

Bisher arbeitete ich derart, dass ich fuer jede Seite wusste, welche anderen Seiten diese zitiert und folgte dem Linknetzwerk einen Schritt nach dem anderen. Hier nun muss ich zunaechst das „Spiegelbild“ zu diesen Daten nehmen, ich musste also fuer jede Seite bestimmen, von welchen anderen Seiten diese zitiert wird. Dann folgte ich dem Linknetzwerk rueckwaerts. Ich schaute also fuer eine Seite von wem diese zitiert wurde und bei den zitierenden Seite schaute ich wer diese zitierte und so weiter. Das ist die Rekursion und die fuehrte ich so lange fort, bis keine neuen zitierenden Seiten mehr auftauchten.

Wieauchimmer, rekursive Funktionen haben einen Nachteil: rein praktisch kann ein Computer eine Rekursion nicht beliebig tief folgen. Jedes Rekursionslevel benøtigt eigene Ressourcen und davon habe ich nicht unendlich viele in meinem Rechner verbaut.

Deswegen schraenkte ich einen Parameter fuer die Analyse folgendermaszen ein: wenn eine Seite von mehr als 69 anderen Seiten zitiert wurde, so wird die Rekursion abgebrochen. Das ist nicht die ganze Wahrheit, 69 ist das Limit fuer zitierende Seiten die ich auf einem gegebenen Rekursionslevel noch nicht „gesehen“ habe. Die Anzahl aller zitierenden Seiten kønnte also betraechtlich høher sein.
Ich denke, dass dies Limitierung plausibel ist, denn wenn eine Seite von mehr als 69 Seiten zitiert wird, so ist es sehr unwahrscheinlich, dass alle diese _nicht_ irgendwie eine Verbindung zum „groszen Auszerhalb“ haben. Letzteres wuerde dann auch die urspruengliche Seite mit der ich startete mit diesem verbinden und damit kønnte die Startseite nicht Teil eines Archipels sein.
Ich testete bis zum Wert 1500 (ab 2000 wird die Rekursionstiefe so grosz, dass ich in oben erwaehnte Ressourcenlimitierung laufe, bzw. laeszt Python das nicht mehr zu um eben dies zu vermeiden). Der „Umschlagpunkt“ ab dem keine weiteren Archipele mehr dazu kamen lag bei 68. Der Wert 69 kommt durch das Abfaerben des juvenilen Humors, des jungen Mannes der bei mir wohnt, auf mich zustande.

Desweiteren liesz ich das No-way-home-Archipel auszen vor. OKOK, das stimmt nicht ganz. Ich nahm es einmal mit in die Analyse rein. Dann dauerte Selbige aber ca. 10 Stunden, anstatt ein paar Minuten. Deswegen habe ich das nur ein Mal gemacht. Ich bespreche die Unterschiede bei den Ergebnissen an anderer Stelle, weil ich denke, dass dies durchaus lehhreich sein kann.

Aber genug der Vorrede und Vorhang auf fuer die Ergebnisse; zunaechst das bereits Bekannte.
Zum ersten Balken der Verteilung der Maxima der individuellen Verteilungen der Selbstreferenzen tragen 474.653 Seiten bei. Davon gehørten 7649 zu Seiten die sich auf LL0 selbst zitieren (von insgesamt 83.435 Seiten mit dieser Eigenschaft) und auf keinem Linklevel mehr als eine Selbstreferenz haben. Somit blieben 467.004 uebrig, die erklaert werden mussten.
Daraufhin unternahm ich Untersuchungen, die zur Entdeckung des No-way-home-Archipels fuehrten. Die grøszte „Insel“ dieses Archipels ist die „Insel der Unzitierten“ mit 320.089 Seiten und insgesamt „wohnen“ auf dem gesamten Archipel 451.792 Seiten.
Damit blieb fuer nur noch 15.212 Seiten ungeklaert, warum diese zum Signal in besagtem ersten Balken beitragen. Dies fuehrte zu den Ueberlegungen bzgl. der Erweiterung/Verallgemeinerung des Archipelkonzepts. Hier kommen dann endlich die neuen Ergebnisse.

Ohne jeglichen Einfluss des No-way-home-Archipels finde ich fast 30-tausend Untergruppen. Wenn diese zu den grøsztmøglichen, zusammenhaengenden (Ueber?)Gruppen zusammen gezogen werden, bleiben noch 8.258 Archipele. Hurra! Die Existenz von (konzeptuell erweiterten/verallgemeinerten) Archipelen ist bewiesen. Nun wird es spannend, ob ich damit auch das erklaeren kann, was ich erklaeren will.

Von den 15.212 Seiten die zitiert werden, aber keine Selbstreferenzen haben, befinden sich 9995 auf diesen Archipelen. Streng genommen muesste ich noch schauen, ob die Zitierungen auch wirklich von niedrigeren „Stufen“ kommen. Aber rein logisch muss das ja so sein, denn wenn sie von høheren Stufen kommen wuerden, dann muessten diese Seiten ja Selbstreferenzen haben. Deswegen spare ich mir das Schauen an dieser Stelle mal ausnahmsweise.

Das ist alles was ich aus den ganzen langen Ueberlegungen und den vielen Stunden die ich mit der Analyse dazu zubrachte herauskam … so viel geschrieben (nicht nur in diesem Beitrag), fuer nur eine einzige Zahl … das kønnte man als eher mickrige Ausbeute sehen, wenn da nicht die Freude am Erkenntnisgewinn und jede Menge neues, konzeptuelles Wissen ueber das Linknetzwerk an sich waeren … aber dazu mehr an anderer Stelle (wie es z.Z. aus sieht als Weihnachtsbeitrag).

Und selbst mit dieser Zahl bleiben 5217 Seiten uebrig … da dachte ich zunaechst .oO(verdammt) … um dann erleichtert fest zu stellen, dass ich ja noch gar nicht solche Seiten in Betracht gezogen hatte, die keine Links haben, aber zitiert werden.
Seiten ohne Links kennen wir schon von den „ganz fruehen Aussteigern“ aber nicht alle von denen werden zitiert, weswegen ich nicht einfach die Zahl von dort nehmen kann. Ist letzteres der Fall, dann sind die schon bei den „Bewohnern“ der „Insel der Unzitierten“ gezaehlt worden. Aber siehe da, 5202 Seiten werden zitiert, haben aber keine Links … hurrah … oder eher: AAARGHAGAHGRHG … da bleiben naemlich immer noch 15 Seiten uebrig.

An dieser Stelle dachte ich zunaechst: .oO(15 von fast 500k … da ist der erste Balken ja (fast) komplett erklaert und das „fast“ ist ein sehr sehr sehr kleines „fast“ … das kann ich getrost alles in den Fehler schieben … auszerdem habe ich mit den Archipelen so viel gelernt, eigentlich kønnte ich hier auch aufhøren).
Aber ein Teil meines Wesens ist, dass ich erst „aufgebe“, wenn ich wirklich nicht mehr weiter weisz. Und hier hatte ich zwar zunaechst keine Idee, aber das Beduerfniss, da noch laenger drueber nachzudenken, auch wenn es nur noch 15 Seiten waren, die einer Erklaerung bedurften.

Und ich gruebelte und gruebelte und kam einfach auf keinen plausiblen Mechanismus fuer diese 15 Seiten.
Dann ging ich auf einen Spaziergang … und wie so oft auf Spaziergaengen scheint die Bewegung auch mein Gehirn in Gang zu bringen, denn pløtzlich hatte ich eine Erklaerung parat.
Bei diesen 15 kønnte es sich um Seiten handeln, die von „Auszen“ zitiert werden (also zu keinem Archipel gehøren), die mindestens einen weiterfuehrenden Link haben (also nicht unter die obigen 5202 Seiten fallen, fuer die das nicht gilt) aber wo die Linkkette dann schnell ins Leere fuehrt. Also weitere „fruehe Aussteiger“ aber nicht auf LL0 wie oben, sondern auf LL1-3.

Und tatsaechlich! Diese 15 Seiten werden alle aus dem groszen Wikipedialinknetzwerk (und auch von Archipelen, aber nur Ersteres ist relevant) zitiert. Manche sogar mehrfach. Desweiteren haben alle nur einen Link und alle diese Links fuehren zu Seiten die keine weitern Links haben. … YEEEEEEEES!!! … I AM AWESOME!

Tja, und damit ist das Signal im ersten Balken komplett erklaert und das Mysterium ist keins mehr! Toll wa!

Vor einer Weile liesz ich mich darueber aus, dass die Rolle der Kirche zu Galileis Zeiten mitnichten bøse, garstig und rueckwaertsgewandt war. Vielmehr hat diese in weltlichen (!) Fragen mittels der damaligen (!) „wissenschaftliche Methode“ gearbeitet und die Wissenschaften sogar aktiv unterstuetzt. Nur in geistlichen Fragen liesz sie sich nicht reinreden. Mittlerweile denke ich, dass das (unter den damaligen Umstaenden!) durchaus gerechtfertigt war. Fuer die Kirche war ein Galilei der was in spirituellen Dingen erzaehlt ungefaehr so wie wenn mir ein Koch sagt, dass Impfen zu Autismus fuehrt. Im besten Fall nervig, im schlimmsten Fall den øffentlichen Frieden (zer)størend.
An anderer Stelle liesz ich mich ueber Newton, und wie dieser eigentlich gar kein Wissenschaftler im heutigen Sinne war, sondern vielmehr einer der letzten Magier.

Wieauchimmer, Giordano Bruno ist eine weitere mythische Figur. (Auch) von ihm wird gerne behauptet, dass er ein ganz aufrichtiger Wissenschaftler war und fuer die (einzig wahre) Wissenschaft gestorben ist. Junge, Junge, da hab ich neulich was zu gelesen. Naemlich den Artikel von Lawrence S. Lerner und Edward A. Gosselin mit dem Titel „Was Giordano Bruno a Scientist?: A Scientist’s View“ im American Journal of Physics 41, 24, 1973, pp. 24–38 … *hust*.

Ich fand den Artikel schwer zu lesen und den angefuehrten Beispielen schwer zu folgen. Aber die Schlussfolgerung ist diese: Bruno hat NICHT die damaligen wissenschaftlichen Argumente durchdrungen, sondern eher nur nachgeplappert. Die Autoren geben dafuer gute Argumente anhand von Brunos Buechern, im Vergleich mit anderen zeitgenøssischen Quellen. Er war also mitnichten ein Wissenschaftler, auch nicht unter damaligen Gesichtspunkten und wir romantisieren das, weil es uns besser in den Kram passt.
Bruno tat dies um seine eigene, eher religiøs/spirituell ausgerichtete Agenda zu førdern … Uff! … was fuer eine Verkuerzung der Argumente und des Geschehenen, aber letztllich laeuft es darauf hinaus.

Die Autoren schreiben dazu schon in der Zusammenfassung:

Bruno’s “scientific” arguments do not exhibit any understanding of scientific reasoning or purpose. Rather they serve the totally unrelated function of allegorical descriptions of a metaphysical relationship between Man and God […]. Bruno sees Nature as the signature of God, and he believes that this signature can best be perceived through the hieroglyph of the Copernican theory.

Auszerdem war er ein Querulant und Størenfried, der sein Leben lang an keinem Ort verweilen konnte, weil er es sich mit den Leuten immer dermaszen verscherzte, dass sein Leben in Gefahr war. Am Ende konnte er nirgendwoanders mehr hingehen und kehrte in eine Gegend zurueck von der er wusste, dass er dort eingesperrt wird.

Letzteres ist auch der Unterschied zu Galilei. Ich kenne keine einzige Wissenschaftlerin (!) die fuer ihre Wissenschaft gestorben ist (dito fuer die Wissenschaftler). Galilei hat widerrufen, weil ein lebender Mensch sich wenigstens Gedanken machen kann ueber wissenschaftliche Belange und das nehmen ihm zu kurz denkende Menschen heutzutage uebel. Oder anders: Wissenschaftler sind eben gerade KEINE Maertyrer, denn ihnen stehen andere Wege der Wahrheit zur Verfuegung.
Und hier liegt der Hase im Pfeffer, denn der Begriff Maertyrer ist zurecht (fast?) ausschlieszlich dem religiøsen Bereich zugeordnet. Bruno wird nun gemeinhin als Maertyrer der Wissenschaft angesehen … ein Widerspruch in sich und dann auch noch falsch (siehe oben).

Aber ACHTUNG! Das bedeutet NICHT, dass Bruno und seine Buecher irrelevant waren (oder sind). Ganz im Gegenteil! Seine philosophischen Argumente haben spaeter wichtige Wissenschaftler wie Galilei oder Huygens massiv beeinflusst. Bruno spielt in der Entwicklung der Wissenschaft also eine wichtige Rolle. Aber nicht als (Proto)Wissenschaftler, wie es der heutige, weitverbreitet Narrativ ist. Und das wollte ich mal gesagt haben.

Die Absolutheit der eigenen Sterblichkeit ist ein ganz furchterregendes Thema, dem man sich nicht wirklich naehern kann. Die allermeisten Leute beschaeftigen sich damit entweder gar nicht oder nur mittels Hilfe religiøser Argumente.

Eine weitere Reaktion bzgl. der Absolutheit dessen was unendlich mal weniger als Nichts ist, so viel weniger, dass wir dafuer nicht mal einen Begriff haben, denn das waere ja schon etwas, besteht darin, etwas „Bleibendes“ zu schaffen. Das ist das, was ganz grosze Kunst ganz grosz macht. Man fuehlt das Kaempfen der Kunstschaffenden gegen die Absolutheit des Todes in Gustav Vigelands Skulpturen, den Bildern von Vincent van Gogh oder Pieter Bruegel (der Aeltere), den Buechern von Kurt Vonnegut, Hannah Arendt, Karl Marx etc. pp., der Musik von Beethoven, Bach oder auch Jean Michel Jarre und nicht zuletzt in Videospielen wie bspw. (und mir sehr am Herzen liegend) Hellblade: Senua’s Sacrifice.
Es ist also ein natuerliches und sehr menschliches Verlangen etwas Bleibendes zu hinterlassen, was die „Essenz“ des Selbst ausdrueckt.

Die meisten Leute kønnen keine Kunst schaffen … das gilt aber nicht fuer Kinder.
Weiterhin ist es so, dass egal von wem geschaffene, Produkte immer auch einen „Teil“ der Person enthalten (wenigstens die Lebenszeit die es brauchte um das Produkt zu erschaffen). Das gilt fuer den liebevoll gebackenen Kuchen, das gebaute Haus, der Programmcode und nicht zuletzt so ziemlich jeder Weblog. Nicht alles ist Kunst, nicht alles ist Bleibend und nur das Allerwenigste drueckt auch die Essenz des Selbst aus … aber es ist immer ein Teil der Person in dem Geschaffenen.

Nun ist es scheinbar (!) naheliegend, dieses Prinzip auf das „Produkt der Lenden“ … ich bitte diesen Ausdruck zu entschuldigen, dieser ist aber allgemein bekannt (und gebraucht) und passt genau in das was ich hier eigentlich sagen will … zu erweitern … insb. auch deswegen, weil dieses die Haelfte der Gene der oder des „Erschaffenden“ enthaelt. Wobei Letzteres natuerlich ein sehr neues Konzept ist und ich komme darauf an anderer Stelle nochmal zurueck.

Und eben darin liegt das Problem … meine, von mir geschaffenen Produkte enthalten einen Teil von mir, denn ansonsten waere das ja nicht von mir geschaffen … wenn meine Enkel den Kuchen von wem anders essen kuemmert mich das ja nicht, bzw. nur in so fern, dass der besser schmecken kønnte als meine Kuchen und damit wer anders mehr geschaetzt wird als ich … Mist … ich schaffe es nicht besser auszudruecken was ich meine, aber ihr, meine lieben Leserinnen und Leser, ahnt vielleicht worauf ich hinaus will.

Wieauchimmer, ein Kind erlebe ich aber als Mensch und wenn ein Mensch einen Teil von mir enthaelt, dann muss das ja wie ich sein, denn ansonsten waere das ja nicht von mir.
DAS spricht dem Kind aber sowohl Autonomie und eine eigene Persønlichkeit ab. Ersteres deswegen weil es meinem Willen unterliegen muss (denn ich habe Macht ueber meine Produkte), Letzteres weil es ja „meine Essenz“ enthaelt und die kann ja nix Anderes sein als ich selber.
Diese Uebertragung ist natuerlich groszer Unsinn … und sicherlich einer der zugrundeliegenden Mechanismen der Probleme zwischen Eltern und Kindern. Dass es eine all zu menschliche Herangehensweise ist, aendert nichts daran, dass es Unsinn ist.

Puuuuuuuuh … verwirrend, ich bin immer noch dabei mich in meinen Gedanken bzgl. dieser Fragestellung voran zu tasten. Das erkennt man daran, dass ich mit Beispielen (anstatt Verallgemeinerungen) arbeite und so manches mehrfach sage. Aber ich hoffe, dass am Ende dieser Miniserie alles etwas deutlicher wird.

Ich bin einer der wenigen Menschen, die diesen Film im Kino gesehen haben. Ich fand den ganz hervorragend! Nicht nur als Film an sich, sondern auch weil ich (nur) dadurch auf den Autor Kurt Vonnegut aufmerksam wurde, den ich mittlerweile sehr schaetze.

Ich gebe aber zu, dass dieser Film sehr absurd zu sein scheint. Ich denke, dass dies zu den schlechten Bewertungen beitraegt, denn Menschen versuchen ja Geschichten immer zu verstehen im Zusammenspiel mit der Welt auszerhalb des Kinos (oder Fernsehsessels).
Wenn man den Film aber unter seinen eigenen Praemissen  betrachtet (was mir mglw. leichter faellt als anderen), dann ist das zwar immer noch absurd, aber eine andere Art von absurd … das Absurde ist genau genommen der zentrale (und springende) Punkt der ganzen Sache. Und das ist einer der Gruende, warum ich den so toll finde.

Wieauchimmer, ich hatte mir vor vielen Jahren den Film auf VHS besorgt und von den vielen die ich mal hatte, ist es die einzige Film-Videokassette die noch in meinem Besitz ist:

Beinahe zwei Jahrzehnte lang versuchte ich diesen Film auf DVD zu bekommen, aber der wurde nur ein Mal auf diesem Medium verøffentlicht und ist seitdem so eine Art „Sammlerstueck“. Nicht weil die DVD so wertvoll waere, sondern weil man so schwer ran kommt.

Aber letztes Jahr Weihnachten bekam ich diese endlich als Geschenk. Toll wa!

Magic: The Gathering ist ein Kartenspiel, bei dem jeder Spieler ein Set von unterschiedlichen Karten hat die im Spielablauf verschiedene Sachen machen. Die grundlegenden Regeln sind im Wesentlichen (wie bei jedem Kartenspiel) sehr simpel: Spiel in deinem Zug eine Karte und wenn auf der was drauf steht, dann mach das.
Die Dinge die auf den Karten stehen sind im Grunde auch nicht sehr komplex. Das wuerde dem Grundgedanken eines (Gesellschafts)Spiels entgegen stehen. Die Komplexitaet liegt in der Interaktion und wenn man nun bestimmte Karten in einer bestimmten Reihenfolge spielt, kann man damit eine Turingmaschine bauen.

Churchill, A., Biderman, S. und Austin Herrick schreiben ueber die Konstruktion einer Turing Maschine aus diesen einfachen Grundbausteinen in ihrem Artikel mit dem passenden Titel „Magic: The Gathering is Turing Complete“ … aber der Reihe nach.

Im Allgemeinen war dies der Konsensus bzgl. normaler, nicht-elektronischer (!) (Gesellschafts)Spiele :

[t]he approach of embedding a Turing machine inside a game directly is generally not considered to be feasible for real-world games […].

Der Grund war, dass …

[…] the unbounded memory required to simulate a Turing machine entirely in a game would be a violation of the very nature of a game.

Darum die obige Beschraenkung auf nicht-elektronische Spiele, denn Minecraft oder Dwarf Fortress haben im Wesentlichen Zugriff zu „unendlichem Speicher“ und da ist es zwar immer noch eine ziemliche Leistung eine Turingmaschine zu bauen, aber es verwundert nicht all zu sehr.

Ein weiterer Grund fuer den bisherigen Konsensus war, dass …

[…] almost every real-world game is trivially decidable, as they produce game trees with only computable paths.

Das kann zwar SEHR komplex (bspw. im Schach) werden, prinzipiell ist das natuerlich richtig. Diese Eigenschaft steht aber einer Turingmaschine entgegen, denn diese ist Turing-vollstaendig. Zur Erinnerung: letzteres bedeutet, dass man ALLE Algorithmen implementieren kann, also auch solche bei den man NICHT entscheiden kann ob die anhalten (oder nicht); was dann ja zum Halteproblem fuehrt.

Der Artikel ist stellenweise lustig zu lesen, denn normalerweise liest man so Sachen wie …

[c]onsider the following situation: both players control Lich, Transcendence, and Laboratory Maniac. One player then casts Menacing Ogre.

… eher nicht in einer wissenschaftlichen Publikation … tihihi.

Aber wie sind die verschiedenen Teile einer Turingmaschine nun konstruiert? Der Speicher ist einfach, das sind einfach nur Karten mit verschiedenen Werten (und Farben, aber ’ne Farbe ist ja auch ein Wert).

Als naechstes braucht man einen Schreib- und Lesekopf und Instruktionen was der (auf dem Speicher) machen soll.

Control instructions in a Turing machine are represented by a table of conditional statements of the form “if the machine is in state s, and the last read cell is symbol k, then do such-and-such.”

Hier nimmt man Karten mit bestimmten Bedingungen …

[m]any Magic cards have triggered abilities which can function like conditional statements.

… und mithilfe wiederum anderer Karte modifiziert man diese Bedingungen gezielt. Letztlich wird dann ein …

Rotlung Reanimator („Whenever Rotlung Reanimator or another Cleric dies, create a 2/2 black Zombie creature token“)

modifiziert mit …

Artificial Evolution […] „Change the text of target spell or permanent by replacing all instances of one creature type with another […]“

… zu:

Rotlung Reanimator [modifiziert] […] „Whenever Rotlung Reanimator or another Aetherborn dies, create a 2/2 white Sliver creature token“.

Das entspricht dann einer Instruktion wie oben beschrieben; ganz konkret in diesem Fall:

When reading symbol 1 in state A, write symbol 18 and move left.

Symbol 1 ist „Aetherborn“ (A), Symbol 18 ist „Sliver“ (S), „write“ weil Aetherborn mit Sliver ersetzt wird und aus der Farbe der Karte (hier sind die weisz) folgt automatisch, wie sich der Kopf danach bewegen muss.

Das macht man nun mit verschiedenen Karten / Kreaturen und am Ende hat man alle Instruktionen und Teile (man braucht noch mehr als Speicher und Schreib/Lesekopf) die man fuer eine Turingmaschine braucht.
In einem Spielzug fuehrt man dann bspw. eine Aktion aus, die dazu fuehrt, dass gewisse Kreaturen sterben; das triggert die modifizierten Rotlung Reanimators und dann wird eine Instruktion ausgefuehrt.

Nun gibt es Zustaende des „Spielbretts“ (also der Karten die ausliegen), die einem Spieler (prinzipiell) erlauben unendlich viele Zuege hintereinander zu machen … ZACK! Hat man eine Schleife … und die kann prinzipiell unendlich lange laufen … und wenn man das hat, werden die Konsequenzen vorheriger Spielzuege (die ja das Spielbrett in eine gewisse Situation bringen) prinzipiell unverhersagbar … damit hat man keinen Entscheidungsbaum mehr und steht vor dem Halteproblem welches eine Turingmaschine nun mal mit sich bringt.

URST COOL WA!

Um DOOM auf Magic laufen zu lassen, muss man „uebersetzen“ was ein Brettzustand, eine Karte, eine Kombination von Karten usw. usf. denn bedeutet. DAS ist urst kompliziert. Aber dadurch, dass eine Turingmaschine konstruiert werden kann ist Magic Turing vollstaendig und das bedeuet, dass es jedwedes Programm ausfuehren kann und daraus folgt, dass es eine solche Uebersetzung geben muss … Aber die ist bestimmt so involviert, dass die Framerate dieses DOOM bei einem Bild alle zehntausend Jahre liegt oder so … das ist etwas unpraktisch, nicht wahr … Aber um tatsaechliche Durchfuehrbarkeit geht’s mir ja ueberhaupt nicht.

Weil zwischen diesem und dem letzten Beitrag nix liegt, steige ich gleich voll ein.
OKOK, ein paar Stichwørter zur kurzen Wiederholung: zu viele Selbstreferenzen auf LL0, die meisten davon sind vom No-way-home-Archipel, welches aber nur ein Spezialfall des beim letzten mal erweiterten/verallgemeinerten Konzepts des Archipels-der-nicht-vom-groszen-Linknetzwerk-aus-sich-aber-in-aufsteigender-Reihenfolge-selber-zitierenden-Inseln darstellt.

Diese Erweiterung(en) habe ich beim letzten Mal nicht zuende gefuehrt und das hole ich hiermit nach. Nun aber genug der Vorrede und ich erweitere besagtes Konzepts sogleich um die Inseln Lambda und Kappa:

Lambda ist weiterhin Mitglied der roten Gruppe (weil ich das von der tiefsten Stufe (Zeta/Eta) aus erreiche) und auch Mitglied der gruenen Gruppe (dito, nur eben fuer Theta/Iota). Gleichzeitig bildet Lambda eine weitere Untergruppe „fuchsia1“ Ich denke ich muss nicht weiter erklaeren, warum dies eine weitere Untergruppe ist.

Nun ist da aber auch noch die Insel Kappa und hier wird es etwas komplizierter. Kappa hat einen Pfeil der auf Kappa selbst zurueck zeigt. Dies soll eine Seite darstelle, die sich selbst auf LL0 zitiert (und die bereits øfter erwaehnt wurden; bspw. hier) und die in dem Fall hier (und in diesem Zusammenhang relevant) nicht von anderen Seiten zitiert wird. Weil Kappa sich selbst zitiert kann sie nicht zur „Insel der Unzitierten“ (Alpha, siehe der letzte Beitrag) gehøren.

Das Komplizierte ist nun, dass ich bisher die „Stufen der Zitierungen“ relativ klar definieren konnte. Insbesondere konnte ich immer einen Anfang, also eine Stufe Null finden. Beim No-way-home-Archipel bestand Stufe Null aus nur einer Insel. Beim erweiterten Konzept konnte Stufe Null aus mehreren, sich „im Kreis“ zitierenden Inseln bestehen; dito fuer andere Stufen. Wichtig war, dass die Stufen abzaehlbar und schrittweise aufsteigend waren.
Kappa zitiert nun aber Lambda. Kappa ist in Gruppe „blau“ eindeutig Stufe Null und von Kappa aus gesehen ist Lambda Strufe 1. Aber von Eta aus gesehen ist Lambda auf Stufe 2. Das geht doch eigentlich nicht.

Das Dilemma løst sich auf die folgende Weise auf. Im ersten Fall sind die Untergruppen „gruen“ und „fuchsia1“ Teilmengen, welche vollstaendig in Gruppe „rot“ enthalten sind. Die Untergruppen sind also _nicht_ unabhaengig voneinander und dies folgt aus der Abzaehlbarkeit der Stufen.
Wenn Gruppe „blau“ nun als komplett unabhaenging von Gruppe „rot“ angesehen wird, trotzdem die beiden Gruppen eine Insel miteinander teilen (!), dann kann diese Insel Lambda sich eben doch auf zwei verschiedenen Stufen befinden, weil das ja zwei unterschiedliche „Treppen“ sind.

In den Daten wuerde ich die Existenz mehrerer, voneinander unabhaengiger Untergruppen nicht ausschlieszen wollen. Worauf ich aber hinaus will ist, dass diese doch wieder ein Netzwerk bilden, sobald es ein Verbindungsglied gibt. Anders als beim „groszen Auszerhalb“, erreiche ich hier aber NICHT jede Seite von jeder anderen Seite aus (siehe oben). Es gilt weiterhin: eine Seite die sich in einem solchen Netzwerk, welches nicht vom „groszen Auszerhalb“ zitiert wird“, befindet und von einer tieferliegenden Stufe zitiert wird, sollte keine Selbstreferenzen haben

Als Letzte Erweiterung, die aber eigentlich in allem Oben gesagten bereits enthalten ist, fuege ich die Insel Mu hinzu:

Ich habe die zugehørende Gruppe „fuchsia2“ genannt, weil mir die Primaerfarben ausgeganen sind (und gelb zu hell ist und deswegen nicht gut rueber kommt). Aber man kønnte den Namen der Gruppe ja so erklaeren, dass „fuchsia2„, so wie „fuchsia1„, eine Teilmenge von „rot“ ist, die aus nur einem Element besteht. … Puuuh, nochmal gerettet.

Wieauchimmer, Mu ist von Eta aus gesehen auf Stufe 2, gehørt aber NICHT zur Gruppe „gruen“. Zum Glueck habe ich oben das Konzept der voneinander unabhaengigen Teilmengen eingefuehrt und damit ist das kein Problem mehr (selbst dann wenn, wie hier, „fuchsia2“ vollstaendig in „rot“ enthalten ist). Oder anders: eine Stufe kann aus mehreren, voneinander unabhaengigen Inseln bestehen, die sich nicht notwendigerweise zitieren muessen; so wie Theta/Iota und Mu. Beim No-way-home-Archipel war Letzteres implizit gegeben; hier wollte ich direkt darauf hinweisen.
Desweiteren wird Mu von Alpha aus zitiert, ist aber nicht Teil des No-way-home-Archipels. NICHT, weil ich wieder zu Mu zurueck kommen wuerde, sondern weil Mu von Eta zitiert wird, und eine Insel kann nur Teil des No-way-home-Archipels sein, wenn besagte Insel nicht von „Auszerhalb“ zitiert wird (und Eta ist „Auszerhalb“ vom No-way-home-Archipel aus gesehen).

An diesem finalen Diagramm erkennt man, warum ich das in einen zusaetzlichen Beitrag gepackt habe — es passiert naemlich ganz schøn viel und aus dem intuitiv zu verstehenden Spezialfall des No-way-home-Archipels ist ein deutlich komplizierteres allgemeineres Konstrukt geworden.

Hier habe ich beispielhaft drei verschiedene Archipele, die ich als unabhaengig voneinander ansehen kann. Das No-way-home-Archipel hat keine Insel gemein mit der „roten“ Gruppe; bei der „blauen“ Gruppe ist dies aber der Fall. Letztere bilden deswegen aus leicht nachzuvollziehenden Gruenden ein gemeinsames Netzwerk. Ersteres Archipel zitiert aber Seiten in der „roten“ Gruppe und deswegen kann ich alle drei Archipele zu einem Gesamtnetzwerk „zusammen ziehen“. Aber wie gesagt, das bedeutet NICHT, dass man jede Insel von jeder anderen Insel aus erreichen kann.
Sollten in den Daten mehrere Archipele existieren, so sei ebenso gesagt, dass diese durchaus komplett unabhaengig voneinander sein kønnen. Also komplett ohne gemeinsame Elemente oder Zitierungen (selbst wenn diese nur in eine Richtung gehen wuerde).

Nun ist der Artikel schon wieder so lang und ich sage zum Abschluss nur noch das Folgende. Die Existenz des No-way-home-Archipels konnte ich nachweisen. Die Frage ist nun, ob Archipele der erweiterten Form auch im Wikipedialinknetzwerk existieren. Dafuer musste ich eine schøne rekursive Funktion schreiben und die Analyse (meiner Meinung nach durchaus plausibel) einschraenken. Aber das kommt alles beim naechsten mal.

Zur Erinnerung: zum ersten Balken dieser Verteilung tragen 474.653 Seiten bei. Das war eine Ueberraschung und ich fand herraus, dass 451.792 durch das No-way-home-Archipel zustande kommen. Somit muss nur noch fuer 15.212 Seiten erklaert werden, wie diese zum ersten Balken besagter Verteilung beitragen.

Beim letzten Mal meinte ich ganz zum Schluss, dass …

[…] das obige Konzept [des Archipels] […] nochmals erweitert werden [kann].

Und das machen wir heute.

Die Inseln des „No-way-home“-Archipels kønnen aufsteigend sortiert werden. Die Namen — Alpha, Beta, Gamma etc. — deuten dies bereits an und kønnen als Stufe 0, Stufe 1, Stufe 2 usw. gedeutet werden. Dabei ist es so, dass Seiten (auf Inseln) einer bestimmten Stufe nur von Seiten (auf Inseln) auf tieferliegenden Stufen zitiert werden; niemals von Seiten (auf Inseln) auf høherliegenden Stufen.
Es muss wahrscheinlich nicht gesagt werden, ich tue es trotzdem: DAS ist das Alleinstellungsmerkmal des No-way-home-Archipels und der Grund warum es diesen Namen bekam. In diesem Bild ist alles auszerhalb des Archipels auf einer sehr hohen „Stufe“.

Nun zur Erweiterung des Konzepts des Archipels. Die vollziehe ich schrittweise und fange einfach an indem zunaechst nur die Inseln Zeta und Eta hinzugefuegt werden:

Hier und im Weiteren muesst ihr, meine lieben Leserinnen und Leser, euch die duennen, grauen Pfeile selber denken. Diese deuteten beim letzten Mal Links nach auszerhalb des Archipels an. Natuerlich gibt es auch im erweiterten Konzept Links nach auszen, aber ich lasse die duennen grauen Pfeile heute mal weg, denn das wird schon kompliziert genug (und die sind auch nicht wirklich relevant fuer besagtes Konzept).

Von Epsilon aus erreiche ich (eine Stufe høher) Zeta. So weit erstmal nix Neues. Von Zeta aus gehe ich noch eine Stufe weiter und erreiche Eta. Nun ist es aber so, dass Eta (in der gesamten Kette eine „høherliegende“ Insel) wieder Zeta (in der gesamten Kette eine „tieferliegende Insel“) zitiert. Dies ist im Widerspruch zum obigen Alleinstellungsmerkmal und deswegen gehørt alles nach Epsilon NICHT mit zum no-way-home-Archipel.

Die rote Gruppe, gekennzeichnet durch die rote Box, liegt lokal (!) vom No-way-home-Archipel aus gesehen also auszerhalb. Aber Achtung! Weiterhin gilt, dass auch die Inseln in der roten Box nicht vom „allgemeinen (!) Auszerhalb“, also vom groszen, zusammenhaengenden Linknetzwerk, zitiert werden. Die Erweiterung des Konzepts ist naemlich gleichzeitig eine Verallgemeinerung, aber dabei ist nicht zu vergessen, dass diesem Konzept zugrunde liegt, dass keine Insel des Archipels aus dem „groszen Auszerhalb“ zitiert wird. Das No-way-home-Archipel ist nur der Spezialfall mit den zweitmeisten Einschraenkungen (die meisten Einschraenkungen hat Insel Alpha).

Letzteres laeszt sich dadurch veranschaulichen, indem man sich denkt, dass Alpha von Zeta zitiert wird. Im konkreten Fall wuerde das heiszen, dass alle der mehr als 300k „Einwohner“ von Alpha zitiert werden muessten, aber das ist ja nur ein Gedankenexperiment und man muss sich einfach nur vorstellen, dass Alpha nur einen „Einwohner“ hat. In dem Fall bleibt das Grundkonzept des Archipels (keine Zitaten vom „groszen Auszerhalb“ erhalten, aber es gibt kein No-way-home-Archipel mehr.

Weiterhin gilt, dass die „Verbindung“ zum No-way-home Archipel hier nur stattfand um einen Anknuepfungspunkt zu finden. Kein Mitglied der roten Gruppen _muss_ vom No-way-home-Archipel aus zitiert werden. Die rote Gruppe kann isoliert fuer sich allein existieren (muss es aber nicht), so lange besagte rote Gruppe nicht vom „groszen Auszerhalb“ zitiert wird, sind alle Mitglieder der roten Gruppe immer Teil des erweiterten/verallgemeinerten Archipels.

Jetzt bin ich so weit, dass ich den Spezialfall des No-way-home-Archipel auszen vor lassen kann um das Archipel nochmals zu erweitern (immerhin gibt es einen Grund, dass ich die rote Box so grosz gemacht habe):

Von Eta aus zitiere ich Theta und (wichtig) Theta zitiert Iota und Iota zitiert Theta. Diese vier Inseln sind _alle_ Teil der roten Gruppe, Theta und Iota bilden aber ebenso die kleinere gruene Untergruppe.

Was passiert hier? Nun ja, Zeta und Eta bilden zusammen die niedrigste Stufe der roten Gruppe. Von dort gelange ich zu høheren Stufen, die im erweiterten Konzept aus mehreren Inseln bestehen kønnen, aber ich komme von dort nicht zurueck zur niedrigeren Stufe. Das Konzept der „sortierbaren Stufen“ bleibt also erhalten, gilt aber nicht mehr nur fuer einzeile Inseln, wie im Spezialfall des No-way-home-Archipels, sondern fuer ganze Inselgruppen.
Ich nenne nenne es deswegen Untergruppe, weil ich von der niedrigsten Stufe die grøszte Menge an anderen Inseln (naemlich alle) erreiche, aber nicht umgekehrt. Oder anders ausgedrueckt: die gruene Gruppe ist eine Teilmenge der roten Gruppe.

Es sei gesagt, dass die niedrigste Stufe aus mehr als nur zwei sich gegenseitig zitierenden Inseln bestehen kann. Prinzipiell kønnte es eine ganze „Inselkette“ sein, solange die sich alle nur wenigstens „im Kreis“ zitieren. Also mindestens die letzte Insel der Kette muss wieder die erste Insel der Kette zitieren. Das muss also kein direktes Hin-und-Zurueck sein, wie oben dargestellt.

An dieser Stelle bin ich noch nicht fertig, ich merke aber, dass der Artikel schon wieder arg lang ist. Deswegen verschiebe ich die naechsten Erweiterungen auf das naechste Mal.

Neulich stolperte ich ueber dieses Diagramm:

Aus diffusen rechtlichen Gruenden buchstaeblich vom Bildschirm abfotografiert, wobei das hier meine Quelle war. Wie ueblich im Internet konnte ich die Originalquelle des Bildes nicht ausfindig machen, aber entweder das Bild oder wenigstens die Daten dazu scheinen aus diesem Buch zu stammen.

Willow kann seine (ihre? ich kenn mich damit nicht so aus) Abstammung in einer langen Linie bis zu Susan zurueck verfolgen. Und dann wird so gern gesagt, dass ein Teil von Susan in Willow bis ins 21. Jahrhundert gelebt hat.

Das erinnerte mich daran, wie in Frank Herberts Dune-Universum die Erinnerungen der Vorfahren in den Genen gespeichert sind und besagte Vorfahren dann mehr oder weniger autonome innere Ratgeber fuer einen Menschen werden kønnen, wenn der „genetische Wissensspeicher“ aktiviert wird.

Und da stellte sich mir die Frage: wie viel ist eigentlich noch von „mir“ (beachte die Anfuehrungszeichen (!); deren Bedeutung wird aber erst im Laufe dieser Miniserie klar) in 1000 Jahren „vorhanden“?
Oder in kurz, es geht irgendwie mal wieder irgendwie um das worueber ich bereits hier sprach.
Im Laufe dieser Miniserie werde ich Argumente bringen, warum diese Vorstellung (dass da noch was von „mir“ sein wird) alberner Unsinn ist und ich die Frage von Anfang an (also nicht erst nach 1000 Jahren) ganz konkret mit < NICHTS > beantworten kann. Aber es wird auch im mehr als dies gehen.

Jetzt beim Schreiben faellt mir auf, dass das eigentlich alles Gedanken im grøszeren Umfeld dessen sind, dass ich versuche zu lernen, mit der Absolutheit meiner eigenen Sterblichkeit umzugehen … aber so mache ich das ja immer, ich zerlege schwere Probleme in Teile die ich prozessieren kann … und oft kommen dabei Fragen und Antworten und Ideen und Ueberlegungen bei raus, die ganz unabhaengig vom urspruenglichen (oder eigentlichen) Problem durchaus interessant sind :) .

Zur Erinnerung: im allerersten Balken in der hier gezeigten Verteilung stecken 474.653 Seiten. Davon sind nur 7649 von der Sorte, die sich auf LL0 selbst zitieren und entweder keine oder niemals mehr als eine Selbstreferenz auf høheren Linkleveln haben. Damit muss ich nur noch erklaeren wo die restlichen 467.004 Seiten die dieses Signal ausmachen herkommen.

Natuerliche Kandidaten sind uns bereits vor fast genau einem Jahr begegnet. Es sind Seiten die niemals nicht zitiert werden (und damit in dem zweiten Grafen den schwarzen Streifen auf der linken Seite verursachen), aber selber andere Seiten zitieren. Damals waren die nur im grøszeren Zusammenhang von Interesse aber im Speziellen nicht weiter relevant. Aber im Zusammenhang mit dem Mysterium des hohen ersten Balkens der Verteilung der Maxima der Selbstreferenzen muss ich eben diese nun etwas genauer betrachten.

Solange eine Seite Links hat, hat diese prinzipiell Zugriff auf das gesamte Wikipedialinknetzwerk. Wenn diese Seite nun niemals woanders verlinkt wird, so fuehrt dies zu null Selbstreferenzen, trotzdem ich von der Seite den Rest des Linknetzwerkes abschreiten kann. So weit so klar und ich kann relativ einfach schauen, welche Seiten niemals nicht zitiert werden. Derer gibt es 320.089 … wow!
Es gibt sozusagen eine „isolierte Insel“ auf der ca. 5 % aller Wikipediaseiten „wohnen“. Von dieser Insel kommt man zwar weg (Links zu anderen Seiten) aber wenn man einmal weg ist, dann kommt man niemals zurueck (weil ja kein Inselbewohner zitiert wird).
Auch wenn mich die Menge etwas ueberrascht so ist das natuerlich gut mit Hinblick auf obiges Mysterium. Denn pløtzlich muss ich nur noch eine Erklaerung finden fuer 146.915 Seiten die zitiert werden, aber trotzdem keine Selbstreferenzen erhalten. Hier greift die obige, einfache Erklaerung nicht.

Nun denke man sich aber eine Seite, die zwar KEIN „Einwohner“ der (isolierten) „Insel der Verdammten Unzitierten“ ist. Diese  Seite wird dann sehr wohl zitiert, aber weiter denke man sich, dass diese(s) Zitat(e) NUR von besagter Insel kommen.
In dem Fall hat man auch null Selbstreferenzen, denn von der Seite komme ich ja niemals auf die Insel und somit kann das Selbstzitat auch niemals aktiviert werden.

So weit so gut. Ich schaute mal und tatsaechlich, ich habe 124.139 Seiten die zwar nicht Teil der „isolierten Insel“ sind, aber NUR von dort Zitate erhalten.
Cool wa! Damit bleiben nur 22.776 Seiten uebrig. Prinzipiell kønnte ich hier aufhøren und sagen, dass alles uebriggebliebene Unerklaerte nun so wenig ist, dass ich das getrost in den beruehmten Fehler druecken kann. Aber ich bin mit meinen Ideen noch nicht am Ende und das Prinzip der „Insel der Unzitierten“ haelt noch mehr in petto (was uebrigens nicht Latein sondern italienisch ist, obgleich auch aus dem Lateinischen abgeleitet) was auch so einiges ueber die Struktur des Linknetzwerkes beleuchtet. Dafuer muessen wir das Konzept aber von einer Insel zu einem Archipel erweitern. … Ich habe da mal was vorbereitet:

Die grosze Ellipse mit dem groszen Alpha drin soll die „isolierte Insel der Unzitierten“ darstellen. Die duennen, grauen Pfeile gehen zu Seiten die mit dem gesamten (restlichen) Linknetzwerk verbunden sind (aber natuerlich NICHT mit dieser Insel).
„Einwohner“ auf Alpha zitieren Einwohner auf den Beta und Gamma Inseln. Das ist durch die dicken, blauen Pfeile gekennzeichnet. Dies beruht aber nicht auf Gegenseitigkeit, denn von dort geht kein dicker, blauer Pfeil (und somit kein Zitat) zurueck. Damit kønnen Beta und Gamma NICHT Teil von Alpha sein, denn die werden ja zitiert (von Alpha) waehrend das Erkennungsmerkmal von Alpha gerade ist, dass die Seiten dort nicht zitiert werden. Gamma zitiert nun Delta und Delta zitiert Epsilon und von Epsilon komm ich nur zu Seiten im groszen Linknetzwerk.

Es bildet sich also eine Art Inselkette und das wichtige Merkmal dieser Kette ist, dass die Zitate immer nur in eine Richtung gehen und niemals zurueck! Sobald ich eine Insel verlassen habe, komme ich nie wieder auf diese zurueck.
Nun ist es aber keine Kette sondern vielmehr eben ein Archipel. Dies versuche ich mit den zwei Pfeilen zur Insel Gamma darzustellen. Oder anders: das Prinzip auf das ich hinaus will bleibt erhalten, auch wenn man Zitate von verschiedenen Inseln zulaeszt.

Was hat das nun mit unseren 22.776 Seiten zu tun, die oben noch uebrig geblieben sind? Zur Klaerung dieser Frage stelle man sich Folgendes vor: alle Einwohner von Insel Gamma gehøren zu diesen 22.776 Seiten (denn die werden ja zitiert (von Alpha und Beta)). Wenn ich mit einer Seite auf Insel Gamma starte, dann habe ich Zugriff auf das gesamte Linknetzwerk (via den duennen, grauen Pfeilen), aber von dort kommt ja niemals ein Zitat zurueck (und somit keine Selbstreferenz zustande). Die einzige Selbstreferenz kønnte von den Inseln Alpha oder Beta stammen, aber weil niemand von auszerhalb Alpha oder Beta zitiert und Insel Gamma dies auch nicht tut sind wir wieder bei obiger Situation, dass diese Selbstreferenzen niemals „aktiviert“ werden.

Aber Achtung! Waehrend die Existenz von Insel Alpha durchaus als plausibel von vornherein angenommen werden konnte, ist die Existenz eines solchen Archipels mitnichten zwangslaeufig!

Ich habe natuerlich mal geguckt und siehe da: es gibt ein solches no-way-home Archipel. Insgesamt besteht das Archipel aus 39 Inseln (inklusive der zuerst betrachteten „Insel der Unzitierten“), auf denen sich 451.792 Seiten tummeln. Die obigen 124.139 Seiten welche nicht Einwohner der „Insel der Unzitierten“ sind aber von dort zitiert werden, „wohnen“ also alle auf dem Archipel. Der Rest sind ebenso Bewohner des Archipels, die werden aber nicht von Insel Alpha zitiert.
Die weitaus meisten Inseln haben uebrigens drei oder weniger „Einwohner“; der allergrøszte Teil der „Einwohner“ treibt sich also auf nur drei Inseln rum.

Cool wa! Pløtzlich bleibt von den 474.653 Seiten im ersten Balken der Ursprung von nur noch 15.212 Seiten unerklaert. Das nenn ich mal einen riesigen Erfolg.
Ganz am Ende bin ich damit noch nicht. Denn das obige Konzept kann nochmals erweitert werden. Aber das mache ich beim naechsten Mal.

Wie schon bei den totalen und den neuen Links, schaute ich mir auch bei den Selbstreferenzen an, wo jeweils das Maximum der indivduellen Verteilung lag. Und hier erlebte ich diese Ueberraschung:

Ich meine natuerlich, dass sich das so unerwartet lang hin zieht. Diese Ueberraschung stellt sich dann aber gar nicht mehr als so interessant dar, wenn man das in Bezug setzt zur Anzahl der totalen Links. Man nehme bspw. LL10; dort gibt es noch insgesamt 222 Selbstzitate … bei immer noch ueber 200 Milliarden (!) Links total … ja gut, rein statistisch sollte das schonmal passieren. Nichtsdestotrotz komme ich nochmal kurz auf drei Seiten die zu den Messwerten ganz am Ende fuehren zurueck … weil’s kurios ist.

Wenn man die Anzahl aller Links auf einem Linklevel in Betracht zieht, dann „tuemmeln“ sich die Selbstreferenzen um Bereich des Erwarteten — sehr zum Anfang dieses Diagramms.
Ich bin also ein „Opfer“ des Gegenteils des hier als „logarithmische Komprimierung“ beschriebenen Effektes geworden: der logarithmischen Streckung und des Schaffens von (unnøtiger (?)) Aufmerksamkeit zu hohen Linkleveln und den dortigen kleinen Werten.

Wieauchimmer, die eigentliche Ueberraschung liegt vielmehr ganz am Anfang — buchstaeblich im ersten Balken: der ist naemlich urst hoch! Sagte ich nicht, dass es nur ca. 80k Selbstreferenzen (und alle sind Artefakte) auf LL0 gibt? Der Balken hat aber eine Amplitude von fast 500-tausend.
Um dies aufzuklaeren muss ich nochmals etwas weiter ausholen, was eigentlich hinter dem obigen Diagramm steckt.

Als ich das bei den totalen Links zum ersten Mal einfuehrte, erklaerte ich, wie dies zustande kam. Ich schaute mir fuer jede Seite an, auf welchem Linklevel diese die meisten totalen Links hatte. War besagtes Maximum bspw. auf LL5, so ging der Zaehler des Balkens bei LL5 um eins hoch. Wenn man sich die beispielhaft gezeigten individuellen Verteilungen nochmals anschaut, so sind das richtig schøne Kurven mit einem klaren Anfang, Maximum, Mittelteil und Ende.
Bei den neunen Links wird im Wesentlichen die gleiche Situation herrschen (von der Grøsze der Zahlen auf der Ordinate natuerlich abgesehen). Es gibt keinen Grund anzunehmen, dass dies dort anders sein sollte; dafuer sind diese beiden „Messgrøszen“ zu aehnlich.

Bei den Selbstreferenzen laufe ich aber in das Problem, dass ich davon nur so wenige habe. Erstmal kønnte das kein Problem, sein, denn auch bei kleinen Zahlen kann man (mehr oder weniger) „schøne Kurven“ haben. So wie im linken Diagramm in diesem Bild (Achtung: es gibt keine Werte zwischen den Punkten; die Linien sind nur da, damit man dem Verlauf eines Datensatzes besser folgen kann):

Bei der 1916 Democratic National Convention (schwarze Kurve im linken Diagramm) geht die Anzahl der Selbstreferenzen hoch, hat ein klar definiertes Maximum ungefaehr da wo auch das Maximum der totalen Links ist und geht dann schnell runter auf Null. Das ist also so wie oben beschrieben.
Das 10th Iowa Infantry Regiment (rote Kurve im linken Diagramm) duempelt recht lange bei kleinen Werten vor sich hin aber dann gibt es auch hier ein klares Maximum. Die Kurve folgt im Groben dem beschriebenen Schema.
Im Wesentlichen dito fuer die 10th Irish Film & Television Awards (blaue Kurve im linken Diagramm). Es gibt ein sehr breites (zweigeteiltes) Maximum gleich zum Anfang, aber die generellen Strukturen einer „schønen Kurve“ sind durchaus erkennbar.

Wichtig hieran sind zwei Sachen. Zum einen, dass „die Statistik“ (was immer das auch sein mag), also die Flaeche unter der Kurve, noch grosz genug ist um (relativ) gute Aussagen treffen zu kønnen. Zum Anderen verteilt sich besagte Statistik ueber einen (mehr oder weniger) ausgedehnten Bereich. Letzteres ist nøtig um ueberhaupt von einer „Kurve“ (welche analysierbar ist) sprechen zu kønnen.

Was aber mindestens genauso haeufig vorliegt, sieht man im rechten Diagramm (ACHTUNG: selbe Farben, unterschiedliche Seiten!). Ich habe die Linien weg gelassen, damit man das Ausmasz der Misere besser wahr nimmt.
Fuer das 1916 Furman Purple Hurricane football team versammeln sich (fast) alle Selbstreferenzen auf LL1 (plus eine einzige auf LL3). Ein Punkt ist keine Kurve (und immer das Maximum).
Bei den 10th Lambda Literary Awards verteilen sich die Werte zwar auf mehr als ein Linklevel, aber „die Statistik“ ist nicht so doll. Ist das ein „echtes“ Maximum bei LL3, blosz weil der Punkt dort mit einem Wert von zwei um eins høher ist als die Punkte bei LL1 bzw. LL4?
Und beides gleichzeitig liegt fuer das 10th Kisei vor.

Ich frag mich was es mit der Haeufung von 10’ern in den Beispielen auf sich hat. Naja, kommt sicherlich dadurch zustande, dass ich diese nur semi-zufaellig ausgewaehlt habe. Nicht vergessen, auch wenn ich hier die kompletten Titel hinschreibe, so arbeite ich intern mit Nummern. Und ich habe die Nummern fuer die Beispiele nicht aus allen 6 Millionen møglichen gezogen sondern nur unter den ersten 50-tausend die genommen, die fuer die Beispiele gepasst haben und auch repraesentativ waren. Das kønnte ja sein, dass es im Wikipediaquellcode ’ne Art lose Reihenfolge gibt. Dafuer spricht, dass alle Beispiele hier mit Zahlen anfangen und diese Zahlen alle ’ne „1“ am Anfang haben.

Wieauchimmer, ich schwoff ab. Mit dem bisher Gesagten laeszt sich die Form der Verteilung ganz oben teilweise erklaeren. Um beim dort erwaehnten Beispiel zu bleiben: ich finde es durchaus plausibel, dass 222 Seiten auf ein paar Linkleveln ein Mal, aber auf LL10 zwei Mal zitiert werden und somit zum Balken bei LL10 in besagter Verteilung beitragen.

Auch auf das Mysterium des (relativ) hohen Balkens bei LL0 werfen die obigen Aussagen etwas Licht. Der Grund liegt darin, dass wenn eine individuelle Verteilung „flach“ ist, dann wird das Maximum an den Anfang gelegt. Beispiel: eine Seite hat jeweils drei Selbstreferenzen auf LL5, LL17 und LL23; das Maximum wird nun zu LL5 „gelegt“ obwohl die anderen beiden Messwerte ja gleich grosz sind … aber so ist das nun mal.
Hier komme ich zu den bekannten 83.435 Seiten mit Selbstreferenzen auf LL0 zurueck. Davon haben 75.786 Seiten das Maximum nicht bei LL0. Es bleiben also 7649 Seiten die entweder keine weiteren Selbstreferenzen oder auf keinem Linklevel mehr als eine Selbstreferenz haben.

Von den 474.653 Seiten die im Balken bei LL0 bleiben damit noch 467.004 uebrig die nicht darunter fallen. Wie gesagt, das Obige wirft nur _etwas_ Licht auf das Mysterium.
Der Beitrag ist aber schon so lang und deswegen verschiebe ich die Aufklaerung dieses seltsamen Sachverhalts auf das naechste Mal.