Ganz ohne Vorrede setze ich mit dem fort was ich beim letzten Mal begann. Dort schrieb ich zum Ende:
Wenn ich die Grenze auf LL25 lege, treten noch keine Ketten auf in der die Seiten nicht alle den gleichen „Familiennamen“ haben […]. Deswegen reduzierte ich die Grenze fuer eine weitere Untersuchung auf LL13.
Von den 820 potentielle Kandidaten die ich fand hielten sich 638 in 68 Familien mit mehr als einem Familienmitglied auf und ich versprach, dass heute die verbleibenden 182 Kandidaten naeher angeschaut werden. Dieses Anschauen geschieht losgeløst von den Familienkettenseiten.
Zur Erinnerung: das sind alles Seiten die ein Kettensignal haben. Ist eine Seite aber eine Kettenseite und gehørt NICHT zu einer Familie, dann kann die Seite nur zu einer Kette ohne Familiennamen (ich sag dazu jetzt mal Patchwork-Familie) gehøren oder ein Anhaenger sein.
Fuer das Nachfolgende gilt, dass normale Familienseiten (wo alle Seiten den selben „Familiennamen“ haben) zunaechst komplett aus den Daten genommen werden. Ich habe also nur noch Nicht-normale-Familienseiten.
Patchworkfamilien finden sich dann dadurch, indem man sich eine Startseite nimmt und schaut ob die von einer anderen Nicht-normalen-Familienseiten zitiert wird. Ist das der Fall, so gehøren beide zu einer Patchworkfamilie. Dann nehme ich die neu gefundene Seite und mache das gleiche nochmal. Dies wird rekursiv so lange gemacht, bis keine neuen Mitglieder zur Patchworkfamilie hinzu kommen. Man folgt also rekursiv der Linkkette und schaut welche Seiten verbunden sind. Dann nimmt man sich die naechste Startseite und macht alles nochmal.
Durch diesen Prozess finde ich 13 Patchworkfamilien mit insgesamt 49 Mitgliedern. Davon haben aber 6 Familien nur zwei Mitglieder. Ich zaehle die auch als Patchworkfamilien (einfach weil die technisch den Kriterien entsprechen) aber das ist etwas komplizierter.
Familien die nur zwei Mitglieder haben sehen verdaechtig nach dem letzten Glied einer Patchworkfamilien mit Anhaenger aus. Oder wie die letzten zwei Elemente einer Patchworkfamilienkette. So wie die sind (also bis zur gegebenen Grenze nur zwei Elemente beinhaltend) kann ich Erstere nicht von Letzteren Unterscheiden ohne die alle persønlich anzuschauen. Das wird dadurch illustriert, dass es zwei von diesen Patchworkfamilien gibt, die aber nur drei verschiedene Mitglieder haben (eins tritt also doppelt auf) … weil das jetzt aber nicht so’n riesiges Ding ist, muss ich damit leben … je kleiner die Grenze wird, desto grøszer wird das „Ding“ aber … blosz je kleiner die Grenze wird umso unsicherer wuerde ich sowieso bzgl. dem Erkennen von Ketten werden und ohnehin mehr falsche positive Ergebnisse erwarten.
Ueberhaupt liegt bei Patchworkfamilien das Problem vor, dass sich prinzipiell Anhaenger reinschleichen kønnen (einfach weil die ja von der Patchworkfamilie zitiert werden). Ich habe geschaut und zumindest die Titel der Seiten suggerieren, dass das nicht der Fall zu sein scheint bei den obigen (eindeutigen) 7 Familien mit mehr als 2 Mitgliedern … vielleicht ist das aber der Fall bei den anderen 6.
Die coolste Familie besteht aus Have You Seen the Other Side of the Sky?, Myth of the Love Electrique, Crystal Rainbow Pyramid Under the Stars, Nam Myo Ho Ren Ge Kyo, Acid Motherly Love, 41st Century Splendid Man, Recurring Dream and Apocalypse of Darkness, Glorify Astrological Martyrdom, Interstellar Guru and Zero, und Cometary Orbital Drive. Das sind alles Alben von Acid Mothers Temple & the Melting Paraiso U.F.O. … einer anscheinend sehr produktiven Band.
Auszerdem finden wir eine kurze Kette von scheinbar (!) ausgestoszenen Familienmitgliedern. Dabei handelt es sich um die 1st Robert Awards, 2nd Robert Awards und 3rd Robert Awards. Es ist natuerlich leicht zu sehen dass deren Status als scheinbare (!) „Ausgestoszene“ nur durch die englische Zaehlweise zustande kommt denn es gibt eine Xth Robert Awards Familie. Vielmehr handelt es sich hierbei um eine weitere „Scheidungsfamilie“, die aber nicht so leicht zu erkennen ist. Dies liesze sich einfach korrigieren, aber wie schon beim letzten Mal habe ich auch da keine Lust drauf.
Soweit so gut. Es bleiben 133 Seiten uebrig. Die Anhaenger unter denen erkennt man daran, dass sie von Familien (egal welcher Art, hier kommen also die oben ignorierten wieder dazu) zitiert werden aber NICHT von anderen Seiten. Wenn ich die 121 daraufhin untersuche, finde ich 87 Anhaenger.
Fuer die restlichen 46 Seiten kann ich ein paar Kategorien finden unter welche diese fallen.
Zum Ersten nehme man Diving at the 2017 Summer Universiade – Men’s 10 metre platform und Diving at the 2017 Summer Universiade – Women’s synchronized 3 metre springboard. Aha! Das sieht doch so aus wie die beim letzten Mal ganz zum Schluss erwaehnten Seiten. Hier scheint die Mutterseite die 2017 Summer Universiade zu sein und die Kette entsteht durch die verschiedenen Sportarten. Weil sich die Namen in mehr als ein paar Zahlen unterscheiden habe ich die keiner (normalen) Familie zuordnen kønnen und die beiden Seiten werden auch nicht von dort zitiert. Zu Letzterem aber auch die naechsten Punkte.
Zum Zweiten nehme man als Beispiel 1656 in Denmark. Das sieht mir verdaechtig nach dem Ende einer Kette aus, denn unter den Familien gibt es XXXX in Sweden oder XXXX in Wales. Wenn das Beispiel nun das Ende einer Kette ist, so hat diese Seite ein Kettensignal, ich kann aber weder andere Seiten mit dem selben „Familiennamen“ finden noch kann ich unter den Kandidaten (!) andere Seiten finden die 1656 in Denmark zitieren, denn solche Seiten liegen unterhalb der Grenze. Ein weiteres Beispiel ist 2019 in birding and ornithology.
Zum Dritten waeren da Seiten so wie Ken McDowall oder mglw. auch Rozendal cabinet die aussehen wie Seiten die am Ende von Ketten zitiert werden die gerade so unter die Grenze fallen. Deswegen sehe ich die zitierenden Seiten nicht unter den Kandidaten aber (bspw.) Ken McDowall sehr wohl, denn der schafft es gerade so ueber die Grenze. Ob das stimmt muesste ich im Einzelfall konkret nachschauen. Da habe ich aber keine Lust drauf und die Argumentation klingt plausibel.
Und dann ist da noch Battle of Little Belt. Ich hab mir die angeschaut, sehe aber keine Hinweise wie eine Linkkette zustande kommen kønnte. Es gehørt zu Count’s Feud wird dort aber nicht zitiert. Das ist naheliegend denn Count’s Feud scheint mir eine ganz normale Seite zu sein und Battle of Little Belt waere das bei einem direkten Zitat von dort dann auch und wuerde nicht bei den Kandidaten auftauchen. Es gibt eine Kategorieseite zu Seeschlachten in denen Daenemark involviert war. Vielleicht gibt es darum auch eine Kette von entsprechenden Seeschlachten und Battle of Little Belt wuerde dann unter eine der obigen Kategorien fallen. Aber letztlich kann ich das nicht aufklaeren.
Schlussendlich glaubte ich auch „Mischformen“ zu erkennen. Ein Beispiel ist die Botanical Garden station (Chengdu Metro). Unter den Patchworkfamilien ist eine dabei, welche mehrere chinesische Bahnsationen als Familienmitglieder zusammenfasst. Aber anscheinend wird Botanical Garden station (Chengdu Metro) von dort nicht zitiert und zitiert auch nicht dort hin (denn dann waere sie Teil der Patchworkfamilie geworden). Deswegen dachte ich zunaechst, dass da vieleicht der Link vergessen wurde.
Letztlich stellte sich aber heraus, dass besagte Patchworkfamilie alle zur Linie 9 der Shenyang Metro gehøren und das Beispiel zur Linie 3 der Chengdu Metro. Das løst das Geheimniss, denn das faellt vermutlich unter den zweiten Fall.
Zusammen mit dem letzten Beitrag waren das aber nur die Resultate fuer zwei Grenzenwerte welche ich hernahm um zu erklaeren was die „Jagd nach Artefakten“ zutage førdert und wie sich das zusammensetzt.
Beim naechsten Mal wird es interessanter, denn ich schaue mir mal an, wie sich diese Grøszen pro Linklevel entwickeln.
Leave a Reply