Archive for the ‘Allgemein’ Category

Beim vorletzten Mal stellte ich die Entwicklung der zitierten Seiten vor. Diese Grøsze kann man nicht direkt als Ordnungsparameter benutzen aber beim letzten Mal zeigte ich, dass der daraus gewinnbare „Volumenanteil“ der Kettenseiten an allen Zitaten sehr wohl als ein solcher benutzt werden kann.
Heute nun zeige ich, dass das viel einfacher geht. Ich wollte aber den „Volumenanteil“ zuerst abgehandelt haben, denn ich denke, dass dieser intuitiver als Ordnungsparameter zu verstehen ist.

Wieauchimmer, viel leichter aus den Messungen „herauszuziehen“ ist die Entwicklung der UNzitierten Seiten und weil die Daten nicht so zappeln sieht der entsprechende Graf auch viel besser aus als der Graf vom „Volumenanteil“ vom letzten Mal:

Vor der Normierung der Daten wurde von diesen der Wert aller Seiten die niemals zitiert werden abgezogen; Letztere entsprechen nur einem „Offset“ und ich wollte das Nulllevel auch auf Null haben.

Aber moment Mal! Die Anzahl der UNzitierten Seiten ist doch nur die Anzahl aller Seiten minus die zitierten Seiten … also das „umgedrehte“ Ergebnis vom vorletzten Mal. Wieso war Letzteres kein Ordnungsparameter, das „Umgedrehte“ aber doch?
Um diese Frage zu beantworten, musste ich eine ganze Weile gruebeln, aber im Grunde ist es gar nicht so kontraintuitiv. In kurz: in einem Gas herrscht UNordnung, denn dort wuseln alle Teilchen umher und kollidieren die ganze Zeit mit allen anderen Teilchen. Wenn das Gas zur Fluessigkeit kondensiert ist, herrscht Ordnung, denn die selben Teilchen wuseln nicht mehr so dolle umher und kollidieren entsprechend nicht mehr mit allen anderen Teilchen.
Fuer das System des Wikipedialinknetzwerkes habe ich < Kollision > mit < wird zitiert > gleichgesetzt. Die Anzahl der UNzitierten Seiten drueckt dann aus, wieviele Seiten aus dem „Gewusel“ heraus genommen wurden und somit auch nicht mehr zur Unordnung beitragen kønnen. Entsprechend ist die Anzahl der UNzitierten Seiten ein direktes Masz fuer die Ordnung … … … und das geht sogar ganz von allein in die richtig Richtung (von wenig zu viel).

Nun war es aber so, dass bei der Entwicklung der zitierten Seiten …

[…] noch ziemlich viel „nach hinten raus“ passiert […] [,]

… was man in der logarithmischen Darstellung sah. Das war ein wichtiger Punkt bzgl. der Ungeeignetheit der „zitierten Seiten“ als Ordnungsparaemter. Wieso scheint sich das nicht auf die „umgedrehten“ Daten zu uebertragen (siehe die rote Kurve im Diagramm)? Nun ja, das Wørtchen „scheint“ ist wichtig, denn natuerlich uebertraegt sich das auch auf die „umgedrehten“ Daten. Aber die relative Aenderung dreht sich AUCH um und deswegen spielt das keine Rolle mehr.
Eine kurze Erklaerung fuer jeweils LL65 zu LL37. Bei den zitierten Seiten betraegt der jeweilige Wert 92 bzw. 4572. Das ist ein absoluter Unterschied von 4480 (zitierten) Seiten und ein relativer Unterschied von fast 5000 (!) Prozent … also dreieinhalb Grøszenordnungen! Bei den UNzitierten Seiten betragen die Werte 5,798,220 Seiten und 5,793,740 Seiten, was AUCH einem absoluten (!) Unterscheid von 4480 Seiten entspricht. Das MUSS ja zwingend (!) so sein. ABER der der relative Unterschied betraegt gerade mal 0.077 Prozent … normiert kønnen diese Werte also mit einem guten Gewissen als Eins gesetzt werden.

Das fetzt wa! Und weil sich der „Volumenanteil“ der Kettenseiten an allen Zitaten aus dem „umgedrehten“ der obigen Kurve berechnet muss da auch das Gleiche bei rauskommen … … … nur wenn man die zwei Kurven miteinander vergleicht (linkes Diagramm) …

… dann sieht das so aus, als ob der Start (und eingeschraenkt auch das Ende) des Phasenuebergangs an sich um zwei Linklevel verschoben ist. Das muss diskutiert werden und da widme ich mich zunaechst dem „Ende“ des Phasenuebergangs.

Mit einer gestrichelten Linie legte ich beim letzten Mal den durchschnittlichen Plateauwert des „Volumenanteils“ (nach dem Phasenuebergang) fest. Dieser lag bei 0.002 und der „Volumenanteil“ passiert diesen Wert zwischen LL11 und LL12 wo es ungefaehr 1000 Familien gibt. Die ca. 1000 Familien muss ich mit der Breite der Antwortfunktion multiplizieren und dann noch mal mit den (fuer Kettenseiten) 50 durchschnittlichen Links (cf. die Diskussion diesbezueglich beim letzten Mal). Das ergibt 500k zitierte Links an dieser Stelle was ungefaehr 10 % aller Wikipediaseiten entspricht. Im Umkehrschluss bedeutet dies, dass die Kurve fuer die Anzahl der normierten Links zwischen LL11 und LL12 von unter 90 % auf ueber 90 % springen muss.
Im linken Diagramm legte ich gestrichelte Linien rein, mit deren Hilfe man (leichter) sieht, dass dies der Fall ist (der Wert von 0.002 beim letzten Mal entspricht in der der normierten Kurve einem Wert von ungefaehr 0.5).

Leider ist die Sache bzgl. des Starts des Phasenuebergangs nicht so einfach. Es scheint, dass der Anteil der UNzitierten Links ab LL8 ansteigt, waehrend das fuer den „Volumenanteil“ erst bei LL10 der Fall ist. Eine logarithmische Darstellung aendert daran auch nix.
Dazu sage ich frei heraus: auch mein geuebter Blick wurde getaeuscht, denn ich bin auf die Aenderung absoluter Grøszen hereingefallen. Anders gesagt: hier gilt eine Art Umkehrung dessen was ich oben schrieb bzgl. der relativen Aenderung und der Sachverhalt ist im rechten Diagramm gezeigt. Aber der Reihe nach denn was ich da gemacht habe ist etwas komplizierter.

Natuerlich bin ich letztlich an absoluten Aenderungen interessiert, aber diese werden durch relative Aenderungen von einem Linklevel zum naechsten „getrieben“. Deswegen habe ich fuer die Kurven im rechten Diagramm zunaechst die Differenz der entsprechenden Werte von einem Linklevel zum vorhergehenden Linklevel berechnet. Danach schaute ich, wie grosz diese Aenderung im Vergleich zum absoluten Wert des vorhergehenden Linklevels war. Wie gesagt, dass ist im Wesentlichen das Gleiche wie weiter oben erklaert (nur „umgedreht“).
Die relative Aenderung ist uebrigens sowas wie die zweite Ableitung. Ich schaue also wie sich die Aenderung aendert.

In der rechten Abbildung erkennt man, dass die „Wuselphase“ (mit vielen Kollisionen / Zitaten) bei kleinen Linkleveln sehr stabil ist und bis LL6 immer stabiler wird. Die Werte des „Volumenanteils“ bzw. der UNzitierten Links aendern sich weniger und weniger im Vergleich zum vorherigen Linklevel. Deswegen ist das in der linken Abbildung eine gerade Linie. Bei LL7 nimmt die relative Aenderung fuer beide Kurven leicht zu. Dadurch dass es vorher einen eindeutigen Trend in beiden Grøszen gibt, kønnte man argumentieren, dass der Phasenuebergang hier los geht. Ich bin mit dieser Aussage aber eher vorsichtig, denn der „Sprung“ entspricht nur einem Faktor vier zum LL6 und das liegt definitiv innerhalb der Schwankungsbreite. Dann auf LL8 springen BEIDE Kurven pløtzlich um einen Faktor von ueber 100 nach oben. Hier wuerde ich also definitiv sagen, dass der Phasenuebergang los geht und man sieht, dass dasfuer beide Grøszen zum selben Linklevel geschieht. Das ist gut, denn das muss ja (wie oben gesagt) so sein, weil der „Volumenanteil“ aus der „Umkehrung“ der UNzitierten Links berechnet wird.
Aber warum sieht man das nicht im linken Diagramm?

Auch das ist einfach erklaert, am Beispiel der Aenderung der Werte von LL7 zu LL8. Der Wert der relativen Aenderung des „Volumenanteils“ betraegt ca. 0.02 % und des Anteils der UNzitierten Links 0.69 %. Ersteres bedeutet, dass sich erst die fuenfte Nachkommastelle des absoluten Wertes des „Volumenanteils“ aendert, waehrend bei den UNzitierten Links bereits die dritte Nachkommastelle (des absoluten Wertes) betroffen ist. Wenn der erste Wert um einen Faktor 100 zu nimmt, dann ist das zwar eine grosze relative Aenderung auf 2 % aber letztlich ist auch dann nur die dritte Nachkommastelle betroffen und solch kleine Aenderungen sieht man eben nicht im linken Diagramm waehrend sich eine Aenderung um (ueber) 69 % deutlich bemerkbar macht.

Aber eigtl.  gibt es hier gar kein Mysterium denn wie gesagt ist der „Volumenanteil“ abhaengig von den (UN)zitierten Links. Ich habe die Diskussion dennoch so lang und breit durchgefuehrt, weil es im linken Diagramm der zweiten Abbidung nicht so aussieht und solche Diskrepanzen muss man verstehen bevor man weitergehen kann.

Festzuhalten ist das Folgende: anstatt des „Volumenanteils“ der Kettenseiten an allen Zitaten kann die Anzahl der UNzitierten Links als Ordnungsparameter genutzt werden. Das ist prima, denn Letzteres ist eindeutiger und man muss dafuer nicht die Anzahl der Familien bestimmen.

SO … genug fuer heute … und auch genug bzgl. der Ordnungsparameter … und auch genug bzgl. der Phasen … ich kann hier also ohne viel Pomp abschlieszen, dass ich tatsaechlich einen Phasenuebergang im Wikipedialinknetzwerk gefunden habe … das ist schon ziemlich famos!
Nun muss ich mal schauen, was ich als naechstes machen kann … viel ist nicht mehr ueber … aber das dachte ich schon vor einem Jahr.

Beim letzten Mal erklaerte ich, dass man mittels der Anzahl den „Volumenanteil“ der Kettenseiten an allen Zitaten als Ordnungsparameter gewinnen kann. Ich zeigte wie sich die Anzahl der zitierten Seiten entwickelt und schloss mit drei Problemen ab:

Zum Ersten zitieren Kettenseiten auch andere Seiten. Zum Zweiten bewegt sich das Ensemble nicht als Diracsche δ-Funktion durch die Kette, sondern mit endlicher Breite (es kommt also zum Ueberlapp bei den Zitaten). Zum Dritten gibt es mehr als eine Kette.

Bzgl. der zitierten Seiten an sich ist das nicht so schlimm, muss aber diskutiert werden bzgl. des „Volumenanteils“ der Kettenseiten an allen Zitaten.
Ersteres ist handhabbar, denn der Anteil der Ketten an allen zitierten Seiten ist bei fruehen Linkleveln sehr klein, und bei spaeten deutlich grøszer. Fuer eine Abschaetzung nehme ich 5 Millionen Seiten am Anfang. Die Anzahl der Ketten ist unbekannt, aber aus den Ergebnissen die ich habe  _ueber_abschaetze ich die auf 5000 fuer kleine Linklevel. Wenn man das so macht, erhaelt man einen „Volumenanteil“ von 0.1 %.
Nota bene: hier darf man NICHT die Anzahl aller Kettenseiten nehmen sondern nur die Anzahl der Ketten, denn auf jedem Linklevel (auch auf kleinen) wird immer nur eine Seite (oder zwei) einer Kette zitiert … … … OKOK, streng genommen muesste man die Anzahl der Familien mit der Breite des jeweiligen Kettensignals multiplizieren; das waere aber nur ein konstanter Faktor fuer alle Linklevel und kann somit weggelassen werden)
Bei hohen Linkleveln gibt es NUR noch Ketten. Jede von diesen zitiert im Durchschnitt 10 bis 30 andere Seiten was ich zu 50 Zitaten _ueber_abschaetze. Das fuehrt zu einem Volumenanteil von 2 %. Das ist immer noch wenig, aber fast anderthalb Grøszenordnungen besser und ich denke durchaus „messbar“.
Bei einer realistischen Abschaetzung (weniger Familien am Anfang und weniger durchschnittliche Zitate per Seite) verbessert sich das Signal um etwas mehr als zwei Grøszenordnungen.

Das Zweite Problem kønnte man vermutlich durch extremes Erbsenzaehlen verhindern. Da habe ich aber sowas von gar keine Lust drauf und muss dann halt damit leben, dass das Signal insb. bei høheren Linkleveln stark schwankt. So lange das qualitativ alles stimmt, reicht mir das und ich tue einfach so, als wenn sich das Ensemble wie eine Diracsche δ-Funktion durch die Ketten bewegt.

Das dritte Problem ist massiv, denn ich kenne die Anzahl der Familien fuer kleine Linklevel nicht bzw. enthaelt diese Zahl waerend des Phasenuebergangs gewisse Unsicherheiten.
Die erste Sache kann ich aus den bereits oben verlinkten bisherigen Ergebnissen abschaetzen und ich setze die Anzahl Anzahl der Familien auf konstant 1000 fuer Linklevel kleiner LL9. Bzgl. der zweiten Sache kønnte ich wieder durch Erbsenzaehlen die Unsicherheit minimieren … oder an die Sache herangehen wie ich es bezueglich des zweiten Problems mache: es reicht mir, wenn das qualitativ stimmt.

Ach so, ganz wichtig ist das was ich hier im „[w]ichtige[n] Einschub“ sagte. Denn auch wenn ich eine Kette nicht mehr erkenne, so bewegen sich die Nachzuegler noch drei weitere Linklevel darin und das muss man mitzaehlen. Das fuehrt dann bspw. dazu, dass bis LL11 die Anzahl der Familien als 1000 angenommen wird.

Nimmt man nun die Anzahl der Familien und dividiert diese durch die Anzahl der zitierten Seiten (beides pro Linklevel) erhaelt man den „Volumenanteil“ der Kettenseiten an allen Zitaten (wie so oft dienen die Linien zwischen den Punkten nur zur Besserung Fuehrung des Auges):

AHA! Das ist zwar alles ein bisschen krumm und schief, aber die Werte sind klein bei kleinen Linkleveln, nehmen ab LL9 sehr schnell zu und erreichen schon bei LL12 einen Plateauwert. Die Zunahme betraegt etwas mehr als eine Grøszenordnung zwischen dem „Grundniveau“ bei kleinem Linkleveln und dem ungefaehren Mittelwert des Plateaus (die graue, gestrichelte Linie ist NICHT der genaue, berechnete Mittelwert; die habe ich nur so Pi-mal-Daumen reingelegt). Besagte Zunahme ist also echt und so wie das qualitativ aussieht wuerde ich das von einem Ordnungsparameter erwarten.
Wie erwartet schwankt der Plateuwert. Die Schwankungen betragen nur ca. einen Faktor zwei um den Mittelwert. Qualitativ kann man sagen, dass der Wert konstant ist … wie ich es von einem Ordnungsparameter erwarten wuerde. Das ist ein GANZ wichtiger Unterschied zur Anzahl der zitierten Seiten, welche ja auch bei groszen und ganz groszen Linkleveln stetig abnimmt (also NICHT konstant ist).

Ich gehe nur bis LL66 weil ich nur bis dort die Familien gezaehlt habe. Eigentlich geht das noch ein paar Linklevel weiter; siehe der Hinweis auf den „wichtigen Einschub“ oben. Das tut aber nix zur Sache.
Apropos ganz hohe Linklevel; ich wuerde NICHT sagen, dass der „Volumenanteil“ ab LL50 einen weiteren Sprung macht. Hier ist nur noch das „São Paulo FC“-Artefakt ueber UND dessen Signal in der Linkfrequenz ueberlappt ueber mehrere Jahre. Ab LL50 wird demnach nur noch eine Familie durch die Zitate aller (ueberlappenden) Jahre geteilt. Weil dann aber mehr und mehr Vorlaefer „raus fallen“ nimmt der Teiler irgendwann immer mehr ab und das sieht aus wie’n stetiger Anstieg.

Eine Sache bleibt noch und das ist der kleine Absolutwert des Plateaus. Bei „Volumenanteil“ wuerde ich erwarten, dass der gegen Eins geht, die gestrichelte Linie liegt aber bei 0.002, also 1/500 von 1.
Das machte mich etwas stutzig aber zumindest einen Teil des Raetsels konnte ich schnell løsen und ist wieder „nur“ Problem #2. Wenn sich das Ensemble durch die Ketten bewegt tut es das eben nicht wie eine Diracsche δ-Funktion. Vielmehr sind immer mehrere Kettenseiten „aktiviert“ weil die Antwortfunktion (in Form der Linkfrequenz) eine endliche Breite hat. Bei obigen Betrachtungen habe ich diesen Aspekt ja mit Absicht auszer Acht gelassen. Ich wuerde sagen, dass 10 Linklevel im Schnitt ueberdeckt werden … eigtl. 11 mit Reflexionen (von denen ich annehme, dass die meistens auftreten) und 9 ohne Reflexion und dann weniger wenn man sich dem Ende einer Kette naehert … alles nicht so einfach, aber 10 Linklevel Ueberdeckung fuehlt sich brauchbar an und damit kann man leicht rechnen. Diesen Sachverhalt mit einbezogen wuerde die gestrichelte Linine bei 0.02 liegen.

Nun wird fuer den „Volumenanteil“ die Anzahl der Familien durch die Anzahl der zitierten Seiten geteilt. Bei einem Wert von 0.02 wuerde das aber durchschnittlich 50 zitierten Seiten entsprechen. Das liegt zwar immer noch innerhalb meiner ersten (konservativen) Abschaetzung waere aber ca. einen Faktor zwei grøszer als was ich von normalen Wikipediaseiten annehmen wuerde. Und ehrlich gesagt, so kønnte das schon so sein, denn die Ketten sind ja oft Listen die etwas aus einem bestimmten Jahr aufzaehlen. Ich griff zufaellig 1885 in Australian literature heraus und zaehle 31 Links … mhmmm … das liegt zwar an der oberen Grenze fuer normale Seiten aber doch noch ca. den Faktor 2 entfernt von 50.
Deswegen schaute ich mal systematisch und die Kettenseiten auf LL20 (22 an der Zahl) haben im Durchschnitt tatsaechlich 40 Links. Fuer LL10 sind es sogar 44 Links und von den dort gefundenen 1860 Kettenseiten (ACHTUNG: das hier und hier Gesagte gilt aber fuer eine Abschaetzung muss ich das nicht betrachten … zumal die „falschen Ketten“ (und deren Links) ja sowieso in der obigen Rechnung mit benutzt werden) haben ueber 15 % mehr als 50 Links. So hat bspw. die List of members of the 3rd Jatiya Sangsad 605 Links. Wenn das oft genug passiert, wird der (durchschnittlichen) Wert des Divisors fuer den „Volumenanteil“ genug angehoben um naeher an die 50 zu kommen.
Wieauchimmer, 40 oder 44 durchschnittliche Links pro Kettenseite bring die gestrichelte Linie nahe genug an die Eins, sodass ich diese Diskrepanz als geløst betrachte.

Dies alles besprochen halte ich fest, dass man als einen (!) Ordnungsparamater den „Volumenanteil“ der Kettenseiten an allen Zitaten hernehmen kann UND dass dieser sich so verhaelt wie man das erwarten wuerde. Leider ist der „Volumenanteil“ umstaendlich zu berechnen und mit gewissen Nachteilen behaftet. Deswegen stellt sich die Frage: geht das nicht auch einfacher? … Und die Antwort ist JA! Sogar ueberraschend viel einfacher. Aber das muss genau diskutiert und mit einem bestaetigten Ordnungsparameter (dem „Volumenanteil“) verglichen werden, weswegen ich das auf das naechste Mal verschiebe.

Wenn, wie beim letzten Mal etabliert, das Ensemble aller Wikipediaseiten zwei Zustaende hat und es zu einem Phasenuebergang vom Einen in den Anderen kommt, so …

[…] stellt sich die Frage des Ordnungsparameters […].

Dafuer muss ich etwas weiter ausholen und man denke sich zunaechst einen (riesigen) Haufen mit gut durchmischten Legosteinen (der Einfachheit halber denke man sich den ikonischen 2×2 Stein, in verschiedenen Farben). Der Legosteinhaufen ist ein isotropes System. Das bedeutet, dass egal in welche Richtung ich einen Stab durch den Haufenstecke (von oben, unten, schraeg von hinten), so wird dieser (um Durchschnitt) immer gleich viele Steine und gleich viele Farben beruehren. Isotrope Systeme haben eine hohe Symmetrie und das ist voll toll, denn dadurch braucht man weniger Parameter um die zu beschreiben. Beim Stab ist die Orientierung vøllig egal, es kommt immer das Gleiche raus.
Trotz (oder wegen?) hoher Symmetrie ist andererseits die „Ordnung“ des Systems klein; der Haufen ist schlieszlich bunt durchmischt. Oder anders: der Ordnungsparameter ist null.

Nun stecke man die urst vielen Legosteine auf eine gigantische runde (!) Grundplatte (aber immer noch gut gemischt). Pløtzlich ist die Richtung des Stabes NICHT mehr egal. In der Ebene macht die Orientierung nichts aus, da gilt das Gleiche wie vorher. Aber wenn man den Stab senkrecht zur Ebene orientiert, dann sieht der immer nur noch einen Stein mit einer Farbe. Das System der Legosteine ist nicht mehr isotrop, die Symmetrie ist gebrochen und man braucht einen weiteren Parameter um Selbiges vollstaendig beschreiben zu kønnen. Anders ausgedrueckt: durch den Symmetriebruch hat die Ordnung des Systems zugenommen.
Wenn man dann auch noch die Farben sortiert, benøtigt man einen weiteren Ordnungsparamter um das System nach dem Farbensortierphasenuebergang vollstaendig beschreiben zu kønnen

Im System des Wikipedialinknetzwerkes „wuselt“ das Ensemble aller Seiten vor dem Phasenuebergang ungeordnet umher und „kollidiert“ (via Zitate) mit allen (!) anderen Seiten. Nach dem Phasenuebergang bewegt es sich geordnet in den Ketten, von einer Kettenseite zur naechsten und kollidiert im einfachsten Bild nur noch mit den Kettenseiten.
In diesem einfachsten Bild bietet sich also der „Volumenanteil“ der Kettenseiten an allen Zitaten als Ordnungsparameter an. Dieser Anteil ist (nahe) Null vor dem Phasenuebergang und (um einfachsten Bild) eins danach.

Um besagten „Volumenanteil“ zu bestimmen muss man zunaechst wissen, wieviele Seiten pro Linklevel zitiert werden. Dazu  kann ich wieder die Linkfrequenz zu Hilfe nehmen.
Zur Erinnerung: bei der Linkfrequenz schaue ich ob Seite X auf einem gegebenen Linklevel Seite A zitiert; ist das der Fall, geht der Zaehler fuer dieses Linklevel fuer Seite A um eins hoch. Zitiert nun Seite Q ebenso Seite auf auf dem selben Linklevel, geht der Zaehler um noch eins hoch. Wenn ich nun fuer jede Seite und jedes Linklevel NUR schaue ob der Zaehler ungleich null ist, finde ich raus, wie viele Seiten pro Linklevel zitiert werden. Es kommt also zu einer weiteren Informationskomprimierung und das Ergebniss ist die schwarze Kurve in diesem Diagramm:

Toll wa! Die schwarze Kurve sieht doch schon fast so aus wie’n Ordnungsparameter … das Wørtchen „fast“ ist wichtig, denn leider ist die Entwicklung der schwarzen Kurve „falsch herum“ dafuer; von viel zu wenig anstatt von wenig zu viel wie oben beschrieben.
Bei der roten Kurve wurden die Daten auf die Anzahl aller zitierten Seiten normiert und mit logarithmischer Skala dargestellt. Durch die „logarithmische Streckung“ sieht man, dass fuer diese Grøsze noch ziemlich viel „nach hinten raus“ passiert und das passiert natuerlich, weil das reale Daten sind, welche sich nicht nach dem einfachsten Ansatz verhalten. und bei realen Daten hat man drei Schwierigkeiten. Zum Ersten zitieren Kettenseiten auch andere Seiten. Zum Zweiten bewegt sich das Ensemble nicht als Diracsche δ-Funktion durch die Kette, sondern mit endlicher Breite (es kommt also zum Ueberlapp bei den Zitaten). Zum Dritten gibt es mehr als eine Kette.

Damit der Artikel nicht so lange wird, verschiebe ich den Rest auf das naechste Mal.

Beim letzten Mal fuehrte ich ein, dass die Linkfrequenz die „Antwort“ des Ensembles aller Wikipediaseiten auf eine „Anregung“ darstellt (bzw. einen spezifischen Teil der Antwort).
Weiterhin habe ich etabliert, dass die Ketten zwar eine Ausnahme aber ein Charakteristikum des Wikipedianetzwerkes ist.
Nun war es so, dass ich die Ketten ueberhaupt erst entdecken und untersuchen konnte, weil fuer die kettenkonstituierenden Seiten die „Antwort“ des Ensembles anders ist. Oder anders ausgedrueckt, das Ensemble „reagiert“ auf die Ketten anders als auf den Rest des Wikipedialinknetzwerkes.

All das zusammen bringt mich wieder zur Idee der Phasen und eines Phasenuebergangs zurueck. Vor ueber einem Jahr verwarf ich die Idee nach einer laengeren Diskussion wieder, weil ich die Daten fuer ein Artefakt hielt. Nun weisz ich aber, dass das Signal echt ist und durch die Ketten zustande kommt.
Oder anders: das „gasførmig“ „herumwuselnde“ Ensemble „kondensiert“ in die (mehr als) ca. 100 Ketten die alle als 1 Zustand gesehen werden kønnen. Dort sind die „Bewegungsmøglichkeiten“ (die Anzahl der Links) der das Ensemble konstituierenden Seiten massiv „eingeschraenkt“.
Insbesondere gilt fuer den nunmehr „fluessigen Zustand“, dass die neuen (also die Reaktion / Bewegung erhaltenden) Links nur noch in eine Richtung gehen. Oder anders: das Ensemble kann nicht von der 1980 Saison des „São Paulo FC“-Artefakts in die 1969 Saison springen ohne Schritt fuer Schritt alle dazwischenliegenden Saisons durchzugehen. Fuer alle Seiten die NICHT zu einer Kette gehøren (also im „gasførmigen“ Zustand sind) ist dies aber møglich (und passiert auch).

Das Ensemble verhaelt sich also komplett anders in diesem „fluessigen Zustand“ als vorher. Weil die Unterschiede zwischen „vorher“ und „nachher“ grosz genug sind, kønnen diese beiden „Zustaende“ meiner Meinung nach tatsaechlich als Phasen bezeichnet werden.
Ehrlich gesagt, hat mich das etwas ueberrascht … aber die Entdeckung der Ketten (oder Archipele) hat mich ja auch etwas ueberrascht … und das trotzdem ich deren Existenz irgendwie erahnte.

Das „São Paulo FC“-Artefakts, welches als einzige Kette ab LL47 uebrig bleibt, kønnte man als ein „Ausfrieren“ in einen „festen Zustand“ ansehen. So weit wuerde ich aber nicht gehen, denn das Verhalten des Ensembles aendert sich dort nicht weiter … es ist also immer noch die gleiche Phase wie auf LL37, nur halt eben mit nur noch einer Kette.

Die Frage ist jetzt, wo der Phasenuebergang stattfindet. Aus den hier gezeigten Daten bzgl. der Entwicklung der Ketten pro Linklevel wuerde ich sagen, dass das so ca. ab LL10 stattfindet. Vermutlich NICHT sehr viel eher. Ebenso wuerde ich sagen, dass das Ensemble die neue Phase definitiv ab LL20 angenommen hat. Wahrscheinlich gilt dies fuer den allermeisten Seiten schon ab LL15 (aus den Daten zur Entwicklung der „Patchworkfamilien“ schlieszend).
Das ist also ein kontinuierlicher (wenn auch schneller) Prozess, was einen Phasenuebergang 2. Ordnung charakterisiert.

Jetzt wo das etabliert ist, stellt sich die Frage des Ordnungsparameters … und das behandle ich beim naechsten Mal.

Der Titel spielt auf den beruehmten Roman von Jules Verne an, denn neulich war ich in Japan und bei der Reise war sowohl der Hin- als auch der Rueckflug ostwaerts. Was natuerlich bedeutet, dass ich nun die Welt einmal komplett umrundet habe … cool wa.

In dieser Miniserie werde ich auf ein paar Kuriositaeten eingehen, ueber die ich in diesem fernen Land gestolpert bin und als allererstes nehme ich dafuer die Toilettensituation her.

Zunaechst muss ich sagen, dass es dort SEHR viele øffentliche Toiletten gibt und die sind so sauber, dass ich (von einer Ausnahme abgesehen) auf allen die ich betreten (und benutzt) habe auch ein grøszeres Geschaeft verrichtet haette (wenn es denn nøtig gewesen waere). Bzgl. Letzterem gebe ich zu, dass ich bei ein paar (z.B. in øffentlichen Parks), dennoch „Papierburgen“ auf dem Brillenrand gebaut haette.
Das sind die zwei wichtigsten Unterschied zu allen (!) anderen Laendern die ich bisher gesehen habe: dass es ausreichend øffentliche Toiletten gibt und dass man davon ausgehen kann, dass man sich nicht ekelt wenn man die benutzen muss.
Die eine Ausnahme war in diesem Zug, …

… zurueck von Ibusuki nach Kagoshima, der so alt war, dass die Toilette nur ein Loch im Boden mit Keramikschuessel drueber war (eine Situation die ich das letzte Mal vor bald 20 Jahren erlebte, als ich die Brockenbahn benutzte). Und selbst diese Toilette war sauber genug.

Im Gegensatz dazu (oder vielleicht auch im Zusammenhang damit) steht das Verhalten der Japaner (ich habe aus naheliegenden Gruenden das Verhalten von Japanerinnen diesbezueglich nicht beobachten kønnen) sich im Median NICHT die Haende zu waschen nach dem Toilettengang … oder maximal die Haende vernachlaessigbar kurz unter flieszendes Wasser zu halten.
Das muss eine kulturelle Sache sein, denn oft genug gibt es nicht mal Seife bzw. sind bei Touristenattraktionen Fluessigseifebehaelter hingestellt wie man die im Supermark kaufen kann, was eher improvisiert wirkt. Ich kann mir durchaus vorstellen, dass fehlende Seife eine Rueckkopplung auf’s Haende waschen hat.
Mglw. hat die fehlende Seife einen konkreten Hintergrund der mir nicht bekannt. Als Beispiel sei hier das Abhandensein von Muelleimern im øffentlichen Raum genannt. Muelleimer wurden naemlich 1995 bei den Terrorattacken auf die U-Bahn in Tokyo benutzt um dort die Giftgasbehaelter zu verstecken. Oder es ist doch die kulturelle Sache, denn wann immer man irgendwo was zu Essen bekommt, gibt es vorher fuechte Tuecher zum Haende waschen dazu. Das Ganze ist also kein Raetsel sondern halt nur anders als da wo ich herkomme.

Bzw. das letzte _Bild_ von meinem Gehirn ist eine zweite Seitenansicht …

… denn das Ding ist ja dreidimensional :) .

Diesmal nur bei 7 T, denn leider habe ich davon kein Vergleichsbild bei einer kleineren magnetischen Flussdichte.

Als ich in der Maschine lag wunderte ich mich, warum die ein drittes Mal losratterte, aber das Scannen in der dritten Dimension erklaert das natuerlich.

Das Aptian ist ein Alter waehrend der Kreide(zeit) waehrend dessen, vor ca. 120.5 Millionen Jahren, das ozeanische anoxisches Ereignis  OAE1a stattfand.

Im unteren Diagramm von Fig. 1 zeigen Schmidt und Frank das δ13C Signal aus diesem Zeitraum. Ich konnte eines der dort dargestellten Datensaetze habhaft werden (unter Research data for this article, dann (Appendix A1) Calcium carbonate and TOC concentrations and isotope ratios of DSDP Site 47-398 (Direktlink) und dort dann Download dataset as tab-delimited text) und die Form und Verteilung der Datenpunkte passt. Aber weil dort wieder die Tiefe aus der die Probe entnommen wurde angegeben ist, anstatt der Zeit, digitalisierte ich lieber wieder den erstgenannten Grafen (und alle relevanten Datenpunkte) um es dann selbst darzustellen:

Das OAE1a liegt im Vergleich zum beim letzten Mal vorgestellten Paläozän/Eozän-Temperaturmaximum viermal laenger zurueck, und die Schwankungen in den Daten sind auch ca. vier mal grøszer. Dennoch ist im δ13C-Signal ein (relativ) klarer Unterschied ausmachen zu den Jahren vor und nach dem Ereignis. Schon fetzig, was die Wissenschaft so kann!

Und das soll es dann mit diesem Thema (und der dazugehørigen Miniserie) auch gewesen sein. Ich fand es sehr interessant zu lesen, dass man eine Dinosaurierzivilistaion mglw. tatsaechlich nachweisen kønnte. Aenderungen in relevanten Signalen waeren zwar (sehr) klein, aber die Beispiele des PETM und OAE1a zeigen, dass diese auch nach ueber hundert Millionen Jahren immer noch zu sehen sind. Und auch geologisch sehr kurze Ereignisse (also anders als die ausgedehnten Perioden des PTEM bzw. OAE1a) sind durchaus messbar. Cool wa!

Geburtstagsbeitrag! Und wieder einmal schreibe ich ueber ein Thema, welches vermutlich nicht interessant ist fuer den Rest der Menschheit, aber was mich schon laenger beschaeftigt.

Dieses Mal geht es darum, dass es vielleicht der letzte Geburtstagsbeitrag ist. Hoffentlich nicht weil ich bald sterbe, sondern weil ich schon seit Jahren immer wieder mit dem Gedanken spiele mit dem Weblogschreiben aufzuhøren. Der Grund liegt darin, dass ich das jetzt 15 Jahren mache und das doch relativ viel meiner Zeit braucht.
Aber relativ viel Zeit brauchte es schon immer und schon seit Jahren denke ich mir zwar ein Publikum wenn ich einen Beitrag schreibe, bin mir aber bewusst, dass hier (fast?) niemand mehr liest … der Zeitaspekt kann also nicht der einzige Grund fuer diese Gedanken sein.

An der Stelle wuerde ich jetzt „Aber der Reihe nach“ schreiben … nur gibt’s diesbezueglich keine Reihe. Dies ist eher ein „Work in Progress“ als ein logisch und konsistent ausgearbeitetes Gedankengebaeude (weswegen es ganz hervorragend als Geburtstagsbeitrag passt). Es sind also Spruenge in den unten angesprochenen Themen zu erwarten.

Angefangen habe ich urspruenglich um die in Dtschl. gebliebenen Bekannten auf dem Laufenden zu halten wie das so in Norwegen ist. Das wurde aber schnell „alt“.
Im Nachhinein sehe ich, dass ich zu dem Zeitpunkt bereits in einer „Periode der wilden Entdeckungen“ war, welche meine persønliche Entwicklung _MASSIV_ vorantrieben. Die zwei groszen Stichworte sind hierbei Anarchismus (im Kropotkinschen Sinne) und Postmodernismus … wobei das Ganze natuerlich viel komplexer ist als zwei Wørter und viele Jahre dauerte, bevor ich da ueberhaupt halbwegs durchblickte und was fuer mich persønlich „draus machen“ konnte. Letztlich gab es dadurch einen (mehr oder weniger) flieszenden Uebergang in eine zweite Phase dieses Weblogs, welche fuer mich ein Art „goldenes Weblogzeitalter“ war in dem ich viel ueber diese ganz wunderbaren Ideen schrieb.

Aber das ist nun auch schon eine Weile vorbei. Nicht dass ich mit obigen Ideen „fertig“ waere — mitnichten! — aber ich bin schon seit Jahren auf keine mir fundamental neuen Ideen gestoszen. Und das fuehrte in eine dritte Phase des Weblogs, die eher eine Art „øffentliches Tagebuch“ als „ich-muss-meine-Gedanken-bzgl.-dieser-fantastischen-Ideen-unbedingt-loswerden-damit-mein-Kopf-vor-Freude-und-Begeisterung-darueber-nicht-explodiert“ ist. Klar freu ich mich immer noch ganz betraechtlich ueber das was ich hier schreibe (und ueber mindestens 100 Mal mehr Sachen ueber dich ich nicht schreibe) und will das der Welt immer noch mitteilen … aber … mhm … ich sag jetzt mal „der Ton“ ist ein anderer … und das ist OK.
Und da ist es schon. Auch wenn hier immer noch regelmaeszig Artikel erscheinen, so geht mir das Material aus worueber ich schreiben will … ich wiederhole mich zwar oft, aber wenn ich das Gefuehl habe, dass ich etwas oft genug gesagt habe, dann kommt auch nix mehr (bzw. viel viel weniger); siehe wieder Anarchismus (im Kropotkinschen Sinne) und Postmodernismus.

Kurzer Sprung zu Ideen an sich. Ein Kuenstler (mich duenkt das war Ruthe oder Flix) meinte mal, dass Kuenstler (mglw. insb. Cartoonisten) immer gefragt werden, wo sie denn ihre Ideen hernehmen und dass das ja ganz erstaunlich ist wie viele verschiedene das sind. Seine Antwort war, dass er da gar nix macht, auszer mit „wachen Augen“ durch die Welt zu laufen.
Und das geht mir genauso. Am offensichtlichsten ist das bei den vielen Artikeln solcher Art. Aber nicht nur bei denen, denn manchmal (in der 2. Phase des Weblogs auch øfter als nur manchmal) wenn ich was lese denke ich: .oO(das lohnt sich darueber ’nen Artikel zu schreiben). Da ich einen Teil lese, kommt da ueber die Zeit so Einiges zusammen.
Aber auch hier bemerke ich seit Jahren, dass ich das weniger oft denke … meistens aus den gleichen Gruenden wie oben.

Deswegen gibt es Fuellartikel … aber bevor ich zu denen komme møchte ich zunaechst sagen, dass ich sehr gerne schreibe … ich nehme an, dass dies das wichtigste „Gegengewicht“ zum obigen Zeitaspekt und der Hauptgrund ist, warum mein Weblog nicht laengst vor langer Zeit das selbe Schicksal erlitten hat wie so viele andere Weblogs.
Vielleicht der wichtigste Grund warum ich so gerne schreibe ist, dass es mir hilft Dinge und mich und andere und die Welt und das Universum besser zu verstehen. Das ist also sowas wie die Gummiente beim Programmieren; nicht genau das Gleiche, aber aehnlich.

An der Stelle møchte ich gerne aus einem anderen (Achtung: eher konservativen) Weblog (den es bestimmt bald nicht mehr gibt) ausfuehrlich zitieren:

When you are grasping at something through your keyboard. When you have read something on the ancient Yamnaya and the North American native nations and the French after WWII and you find a common thread. You have grasped at some subterranean layer of truth. And you try and draw it out for others, but really for yourself. And you create it and share it online and never look at it again but you know it is there and that it is good.

Das manifestiert sich dann auch darin _wie_ ich schreibe. Verøffentlicht werden die Artikel seit bald 10 Jahren regelmaeszig an jedem Primzahltag … auszer dem 23. September, dann das ist nur einen Tag nach meinem Geburtstag und manchmal erschienen Artikel auch an Tagen die durch andere Zahlen als nur Eins und sich selber teilbar sind.
Geschrieben wurden (und werden) die aber oft in „Schreibrunden“ von oft nur wenigen Wochen mit laengeren und langen Pausen dazwischen. Bspw. ist es jetzt gerade erst Anfang August, aber seit Mitte Juli sind bis Mitte November Artikel vorbereitet (und diesen Geburtstagsbeitrag habe ich lange vor mir hergeschoben).

Das scheint nur ein nebensaechlicher Aspekt zu sein, aber ist ein Ausdruck zweier Dinge. Zum Einen dessen was ich oben schrieb: ich mag es zu schreiben und wenn ich erstmal dabei bin, dann „flieszen“ die Gedanken von selber in meine Finger und selbige „fliegen“ ueber die Tastatur. Der andere Aspekt ist das Gegenteil dessen, denn nach einer Pause faellt es mir immer schwer wieder anzufangen mit dem Schreiben.
Oder anders: wenn ich weniger Artikel schreiben und diese unregelmaesziger verøffentlichen wuerde, dann ist das vermutlich das Ende dieses Weblogs.

Und hier kommt ein weiterer Stolperstein, denn seit einiger Zeit habe ich den Eindruck, dass bzgl. meiner persønlichen Entwicklung (siehe oben) nicht mehr so viele aufschreibenswerte grosze Dinge dazukommen. Das sieht man ja auch ganz deutlich daran, wie sich die Art der Themen an denen ich mich ausfuehrlich abarbeite geaendert haben. Die seit langer Zeit laufende (aber auch auf das Ende zugehende) Kevin Bacon Maxiserie ist im Wesentlichen nur ein „Notbehelf“ um einen Grund zum Webblogschreiben zu haben. Auch wenn ich die Untersuchungen sehr interessant finde (und nur durch das Schreiben auf so viele Ideen gekommen bin), so sind dies keine (neuen) Ideen, die mir helfen das Universum und meine Position darin besser zu verstehen.
Klar ich stolpere immer noch ueber interessante Sachen, die ich in mein Weltbild einbaue, aber das sind dann eher Modifikationen als „Durchbrueche im Verstehen der Welt“ … aber ich wiederhole mich, denn darueber liesz ich mich weiter oben bereits aus.

Damit komme ich zu den Fuellartikel zurueck. Die erkennt man meistens daran, dass diese an Tagen erscheinen, von denen es nur 2 Tage bis zum naechsten Primzahldatum sind. Fast immer sind diese kuerzer. Mit Ausnahmen natuerlich, bspw. sind die Krebs-Artikel (aber auch andere) eigentlich keine Fuellartikel, aber wg. Kevin Bacon sind die Plaetze fuer lange Artikel ausgebucht.
Auf die Idee der Fuellartikel um mich am Schreiben zu halten kam ich vor ein paar Jahren und dafuer nahm ich zuerst meine Toilettenbilder her … was letztlich fast 250 Artikel wurden. Als ich keine Toilettenbilder mehr hatte, schrieb ich ueber 300 Weltraumabenteuerartikel; da habe ich zwar noch ein paar offen, aber letztlich ist da auch „die Luft raus“. Es gab auch viele Fuellartikel in anderer Form (bspw. das was z.Z. unregelmaeszig unter der Ueberschrift „Revisited“ erscheint).

Und mehr als ein paar Mal passierte (und passiert) es, dass ich nur kurz was schreiben wollte und „aus Versehen“ entwickelte sich ein langer Artikel daraus, weil beim Schreiben noch mehr Gedanken dazu kamen und Verknuepfungen enstanden und dadurch Zusammenhaengen ersichtlich wurden … siehe das Zitat weiter oben: intellektuelle stimulierung durch das Schreiben an sich. Das ist (wieder: intellektuell) natuerlich sehr befriedigend und somit eine Art positive Rueckkopplungsschleife warum ich so gerne Schreibe.

Das Konzept der kurzen Fuellartikel ist also ganz wichtig, um mich am Schreiben zu halten … nun gehen mir aber nicht nur die neuen (des Aufschreibens wuerdigen) „groszen Gedanken“ aus, sondern auch die „Kleinen“ fuer Fuellartikel.
Andererseits klage ich (intern) da seit Jahren drueber und bisher hab ich doch immer noch was gefunden.

Als letzten Aspekt fragte ich mich ob ich hier nur noch schreibe, weil ich schon so viel Zeit in diesen Weblog gepackt habe. Das waere eine aehnliche Situation wie als die Regierungen der Briten und Franzosen beim Concorde-Projekt dem vielen schlechten Geld noch mehr gutes Geld hinterhergeworfen haben, anstatt das alles abzubrechen. Auch wenn hier Geld keine Rolle spielt, also eine Art des „Versunkene-Kosten-Irrtums„.
Ich habe ehrlich das Gefuehl, dass dem nicht so ist. Hauptsaechlich aus dem oben genannten Grund, dass ich wirklich gerne (hier) schreibe, trotz des immensen Zeitaufwands.

Alles in allem kann das ganz kurz zusammengefasst werden:
1.: mir geht das Material aus und …
2.: … wenn ich nicht regelmaeszig schreibe, schreibe ich gar nicht.

Deswegen die Frage im Titel … vllt. komme ich noch bis zum naechsten Geburtstag, oder vielleicht auch darueber hinaus. Ein paar Ideen hab ich noch und dann wollte ich auch einige der hier vorgestelten Datensachen (bspw. Kino, oder Strøm und so) auf den neuesen Stand bringen.
So lange was da ist, werde ich schreiben … aber vllt. krieg ich irgendwann ’n Rappel ganz pløtzlich und dann wisst ihr meine lieben Leserinnen und Leser jetzt schon, warum vielleicht pløtzlich nix mehr kommt.

Die Suche nach Ketten war sehr erfolgreich, unter den potentiellen Kandidaten befanden sich aber auch falsche positive Resultate, also scheinbare Kettenseiten die keinen „wahren“ Ketten zuzuordnen sind.
Ausgangspunkt der Suche war die Nutzung des Linkfrequenzsignals zur Vorsortierung um potentielle Kandidaten zu finden. Danach schaute ich entweder nach „Familiennamen“ bzw. welche Seite welche anderen Seiten zitiert um auch die „Patchworkfamilien“ und Anhaenger zu finden. Da lag es natuerlich nahe, dass ich eine ganze Weile darueber nachdachte ob Letzteres nicht von Anfang an genutzt kønnte um ohne Vorsortierung Ketten zu finden … also so ’ne Art ab inito Analyse. Zu meiner Unzufriedenheit fuehrten diese Ueberlegungen immer in die gleichen Sackgassen die sich alle mit diesem Bild zusammenfassen lassen:

Hier hat man alles: die Kette an sich (Punkte mit roter Umrandung), den Einstiegspunkt (links oben) und das Ende der Selben (mittig unten), abzweigende Ketten (bspw. (aber nicht ausschlieszlich) zu Anhaengern) die Teile der eigentliche Kette „mitbenutzen und ganz wichtig, Teile des direkt „angeschlossenen“ Gesamtwikipedialinknetzwerkes. In kurz: die Kettenseiten sind (selbstverstaendlich!) Teil des Netzwerkes ALLER Wikipediaseiten.
Der Begriff „Kette“ gaukelt leider vor, als ob die nur fuer sich stehen und leicht zu erkennen sind. Ich muss zugeben, dass die Art wie ich das Phaenomen bisher darstellte zu diesem Eindruck beitraegt. Zur Rechtfertigung kønnte ich heranziehen, dass das daher kam, weil Kettenseiten im Linkfrequenzsignal auch scheinbar (!) so aussehen; am Anfang solcher Seiten passiert „nix“ und  erst zum Ende ist ueberhaupt ein nennenswertes Signal da … was ja falsch ist, denn ueber alle Linklevel gibt es ein Signal, aber das ist minimal und ich habe das einfach nicht weiter betrachtet, weil es nicht nuetzlich war.

Das bedeutet, dass der oben erwaehnte ab initio Ansatz doppelt gemoppelt ist, denn dieser wuerde wieder das gesamte Netzwerk untersuche eben mit den Kettenseiten als Ausgangspunkt … und das habe ich ja schon gemacht.

Das wiederum brachte mich dazu mir mal zu ueberlegen, was das „Kettenseitensignal“ in der Linkfrequenz ueberhaupt ist und in kurz ausgedrueckt (unter Zuhilfenahme einer der Physik entliehenen Terminologie) ist es die „Antwort“ des Ensembles (aller Wikipdiaseiten) auf eine „Anregung“ … … … oioioi … hier gibt es drei Sachen zu „entpacken“.

Die „Anregung“ ist nur der Start der Analyse, also das „Anschubsen“, damit die Ursprungsseite (ueberhaupt erstmal) „los geht“ und allen (neuen) Links auf LL0 folgt. So lange es neue Links gibt ist das eine sich selbst erhaltende „Reaktion“.
Mit „Ensemble“ ist die Gesamtheit ALLER Wikipediaseiten gemeint, inklusive der Kettenseiten. Wie oben dargestellt, sind die Kettenseiten (selbstverstaendlich) Teil des Ensembles.
Die Frage zur „Antwort“ ist im Wesentlichen: wann „kollidieren“ (oder sehen) die Seiten des Ensembles zum ersten Mal mit gegebenen anderen Seiten (des selben Ensembles). Damit ist die „Antwort“ selber das was man im Linkfrequenzsignal sieht. Prinzipiell kønnte man das als sowas wie eine „mittlere freie Weglaenge“ betrachten.

Weiterhin ist es nun so, dass die (meisten) Kettenseiten im Durchschnitt viel spaeter mit dem Rest des Ensembles „kollidieren“ als (fast) alle anderen Seiten. DAS ist das Erkennungsmerkmal (aber nicht Alleinstellungsmerkmal!) von Kettenseiten. Daraus folgt dann zwingend: so lange ich die „Antwort“ des (gesamten) Ensembles auf die „Anregung“ nicht kenne, kann ich Kettenseiten nicht identifizieren.
Das habe ich also von Anfang an (vermutlich eher unbewusst … naja … vielleicht semi-bewusst) gemacht, weil ich das Linkfrequenzsignals zur Vorsortierung nutzte; ich hatte nur keine Terminologie dafuer um den Prozess und was dahinter steht systematisch zu beschreiben.

Nun ist es aber so, dass die „Kettensignalantwort“ aber auch von Seiten kommen kann, die keine Kettenseiten sind. Wenn man die Antwort des Ensembles kennt, also Kandidaten schon vorsortiert hat, kann man dann den ab inito Ansatz hernehmen (der dann natuerlich NICHT mehr ab inito ist! … aber die Herangehensweise bleibt erhalten) und den allen wer-zitiert-wen-Links folgen … was das ist was ich gemacht hatte um „Patchworkfamilien“ und Anhaenger zu finden. Zu dem Zeitpunkt hat das Ensemble ja schon „geantwortet“ (ich habe Kandidaten vorsortiert) und dadurch fallen extrem viele Pfeile in der obigen Abbildung weg. Man folgt nur noch den wenigen Verbindungen die grob vereinfachend gesagt noch keine „Kollision“ erfahren haben (oder erst ganz kurz vorher), was sich dadurch ausdrueckt, dass sie eben auch als potentielle Kandidaten fuer Kettenseiten „vorsortiert“ wurden.

In diesem Bild des Ensembles welche auf eine „Anregung“ „antwortet“ komme ich wieder auf eine Idee zurueck, die vor laengerer Zeit bereits vorgeschlagen, naeher untersucht und durch die unzureichende Datenlage wieder verworfen wurde. Das wuerde hier aber zu einem all zu lagen Artikkel fuehren und ich verweise auf das naechste Mal.

Warum das Ganze? Warum habe ich mich so ausfuehrlich mit einer Sache beschaeftigt, die im gesamten Wikipedialinknetzwerk weniger als 1 Promille (!) aller Seiten ausmacht?

Die Antwort auf die Frage ist ganz einfach: weil dieser Prozess das ist was Wissenschaft ausmacht und das finde ich persønlich sehr spannend und auf verschiedene Arten aeuszerst befriedigend. Man beachte das Wort „Prozess“, denn es geht dabei nicht nur um das Endresultat, sondern auch wie man dort hingelangt.
Verkuerzend gesagt fuehrte die Untersuchung und das systematische Verstehen des Zustandekommens einer Kuriositaet im (wieauchimmer gearteten) Signal nicht nur zu einem generellen Erkentnissgewinn sondern auch zur Entdeckung einer bisher unbekannten Sache.

Hier war es ein langer Schwanz bis ueber LL59 hinaus in allen Signalen. Bei den Archipelen war ein Balken in einem Histogramm mit vielen Balken etwas høher als erwartet.
Hier hielt ich es urspruenglich fuer ein Artefakt der urspruenglichen Datenaufbereitung. Bei den Archipelen haette ich es einfach auf die nicht zitierten Seiten (spaeter als „isolierte Insel der Unzitierten“ bezeichnet) schieben kønnen. In beiden Faellen haette ich die „kleinen Reste“ die nicht unter diese Erklaerungen fallen in den schon oft erwaehnten Fehler „schieben“ und es dabei belassen kønnen ohne schwerwiegende Konsequenzen fuer die allgemeineren Resultate. Letzteres ist durchaus legitim wenn die Effekte ohnehin nicht viel ausmachen.
Beide Male beschaeftigte ich mich aber mit einer Winzigkeit in der Menge aller Wikipediaseiten und machte nur dadurch die coolen Entdeckungen :) .

Was hat das nun alles mit dem Ende der Dinosaurier zu tun. Nun ja, das ist einfach zu erklaeren und ich verweise sogleich auf den schønsten wissenschaftlichen Artikel den ich in meinen ueber 40 Jahren in diesem Universum gelesen habe (und mir sind ein paar wirklich Gute untergekommen in der ganzen Zeit). Ich meine „Extraterrestrial Cause for the Cretaceous-Tertiary Extinction“ … *hust* … von Luis W. Alvarez, Walter Alvarez, Frank Asaro und Helen V. Michel in Science 208 (4448), 1980, pp. 1095–1108.
Das ist der Artikel in dem das erste Mal das Aussterben der Dinosaurier ganz konkret in Form von Beweisen mit dem Einschlag eines Asteroiden in Verbindung gebracht wurde.

Ein Artikel der irgendwie mit Dinosauriern UND dem Weltraum zu tun hat ist ja an sich schon cool. Aber dann wird auch noch ein irgendwie mystisches Material untersucht … und mag mir hier niemand behaupten, dass Iridium so banal wie Eisen oder Aluminium ware.

Aber warum der Artikel fuer mich den Status des schønsten wissenschaftlichen Artikels (ever) hat liegt daran, weil darin genau das gemacht und dargelegt wird was mich dazu brachte Wissenschaftler zu werden (und warum ich immer noch einer bin, wenn auch eher untypisch).
Die Behauptung wird plausibel dargelegt und in einen grøszeren Zusammenhang gepackt. Die Resultate akribischer Untersuchungen werden herangefuehrt um die Behauptung zu stuetzen. Das Ganze wird mit Material von einem anderen Ort auf der Erde wiederholt. Ein Vergleich mit einem bekannten Ereignis (ein gewaltiger Vulkanausbruch) mit aehnlichen (wenn auch viel kleineren) Konsequenzen wird herangefuehrt um die Plausibilitaet weiter zu festigen und (erstaunlich genau!) abzuschaetzen wie grosz der Asteroid gewesen sein muss um die erwaehnten Resultate besagter akribischer Untersuchungen zur Folge zu haben. Letztlich werden alternative Erklaerungen ernsthaft diskutiert (und verworfen).
Und das Ganze ist wirklich gut und verstaendlich geschrieben und wird durch groszartige, aussagekraeftig und mit Informationen vollgeladene Diagramme unterstuetzt.

Und was hat das alles mit „meinen“ Archipelen oder Ketten zu tun? Das ist ebenso leicht zu erklaeren, denn die Autoren des Artikels haben eine 1 cm breite „Anomalie“ in einer ueber dreihundert Meter dicken Gesteinsschicht untersucht. Das ist ein Sprung ueber vier Grøszenordnungen. (Am zweiten Ort war die untersuchte Schicht i.A. ein paar Zentimeter und die Gesamtformation ca. 10 m dick … also immer noch zwei bis drei Grøszenordnungen). Zur besseren Veranschaulichungen zeige ich ausnahmsweise mal ein direktes (und nicht nachempfundenes, oder abfotografiertes) Bild:

Fig. 2 entnommen aus Alvarez, L. W., Alvarez W., Asaro F. und Michel, H. V. „Extraterrestrial Cause for the Cretaceous-Tertiary Extinction„, Science 208 (4448), 1980, pp. 1095–1108

Die Schichtdicke ist in Spalte (a) zu sehen und die entnommenen Proben in Spalte (f). Die Proben H bis L sind alle aus der nur 1 cm dicken, mit Iridium angereicherten Schicht. Bzgl. dessen was die restlichen Spalten darstellen verweise ich auf den Artikel.

Und da war’s wieder: fetzige Wissenschaft die sich mit einer „Kuriositaet“ in einem „Meer an Daten“ befasst und zu einem Erkentnissgewinn fuehrt, der dann sehr schnell Einzug in den Wissenskanon der Menschheit (und auch die Lehrbuecher fand).
Letzteres wird mit dem was ich hier ueber das Wikipedialinknetzwerk heraus finde natuerlich nicht passieren, aber der zugrundeliegende Prozess, die wissenschaftliche Methode, ist im Wesentlichen der Selbe … und darum mache ich das Ganze

… … …

Nun hatte ich beim letzten Mal nicht nur den schønsten wissenschaftlichen Artikel, sondern auch das schønste Diagramm was mir jemals untergekommen ist versprochen. Es ist nicht das Obige (auch wenn das erstaunlich nahe ran kommt). Weil der Artikel nun aber schon wieder so lang ist, verschiebe ich das auf ein anderes Mal.