Archive for the ‘Allgemein’ Category

Beim letzten Mal schrieb ich, dass ich …

[…] die zweite Art der Komprimierung auf’s naechste Mal [verschiebe].

Als ich mir alles anschaute dachte ich mir allerdings dass es besser ist, wenn ich zunaechst die bedeutungskomprimierten Falschfarbenbilder zeige.

Wie immer „huepfen“ die Bilder zwischen den 2020-Daten und den 2023-Daten. Weil ich damals ein Prozent als Wert fuer die Komprimierung benutzte, tat ich das auch hier wieder. Vom letzten Mal wissen wir, dass das NICHT zu notwendigerweise zu 100 komprimierten Bedeutungsgruppen und zu „Spruengen zwischen einigen Spalten“ fuehrt. Auszerdem kann die Anzahl der komprimierten Gruppen bei den verschiedenen Datensaetzen unterschiedlich sein. Es ist wichtig dies im Hinterkopf zu haben, damit die dadurch verursachten „Effekte“ in den Bildern nicht die Interpretation der eigentlichen Information støren. So fuehren die besagten „Spruenge zwischen den Spalten“ zu Streifenstrukturen und die Unterschiede in der Anzahl der Gruppen zu Spruengen bei den Skalen der Achsen).
Und nicht vergessen: die durch die Abszisse repraesentierten Seiten werden von den durch die Ordinate repraesentierten Seiten zitiert.

(Auch) Wie immer fange ich mit dem Reproduzierbarkeitsteil an und der ist hier im linken Falschfarbenbild zu sehen, in dem die bedeutungskomprimierte Zitategruppe ueber der bedeutungskomprimierten Zitategruppe abgetragen ist:

Huch! Im Vergleich zu damals sieht man ja nuescht! … nun ja … wenn man genau hinschaut sieht man schon die gleichen Merkmale wie damals … aber noch viel besser sieht man, warum ich die Farbpalette wechselte; wie gesagt, meine Lieblingsfarbpalette „luegt“ und gaukelt mir Informationen vor die eigentlich gar nicht da sind.
Ansonsten sieht man wieder die gewaltige Dominanz der Wikipedia-Hauptseite in den 2023-Daten.

Im rechten Bild ist die bedeutungskomprimierte Linksgruppe ueber der bedeutungskomprimierten Zitategruppe abgetragen. Interessant ist der helle Punkt in der rechten unteren Ecke. Der tritt in beiden Datensaetzen auf und kommt deswegen NICHT durch die Wikipedia Hauptseite zustande. Als einzelner Punkt „ueberstraehlt“ dessen Intensitaet diese sogar! (Wobei die Summe ueber die gesamte Spalte sicherlich grøszer ist fuer die Hauptseite). Aber wie so oft in dieser Phase des bereits so lange andauernden Kevin-Bacon-Projekts: ich hab keine Lust (mehr) zu schauen, was das ist.
Ich weise nur darauf hin, dass dort in der Ecke anscheinend noch mehr passiert, denn dort treten etliche andere Pixel aus dem Schwarz hervor (wenn auch nicht ganz so deutlich) … eine weitere Erfolgsgeschichte fuer das neue Werkzeug :).

Weiter zu den Falschfarbenbildern, bei denen die Abszisse die komprimierten Linksgruppen repraesentiert:

Im linken Bild passiert nichts Unerwartetes. Dass die Hauptseite nicht am Ende der Abzsisse liegt (wie bei der Anzahl der Zitate), ist von vorher bekannt. Im Vergleich mit dem rechten Diagramm im oberen Bild spiegelt sich hier schøn wieder, dass die Information in diesen Bildern nicht symmetrisch ist und die Achsen nicht vertauscht werden kønnen.

Etwas spannender ist das rechte Falschfarbenbild. Sofort ins Auge fallen die hellen Punkte, welche alle in der selben Reihe liegen, und sowohl bei den 2020- als auch den 2023-Daten vorhanden sind (wenn auch an anderen Positionen auf der Abzsisse). Diese Punkte sind bereits vorher aufgetreten und ich wuerde spekulieren, dass die mit dem „helle[n] Punkt in der rechten unteren Ecke“ von weiter oben zu tun haben … ohne weitere Untersuchungen wuerde ich aber nicht drauf wetten. Falls dem so ist, ist es interessant, dass die zwar alle unterschiedliche Links, aber anscheinend (ungefaehr) gleich viele Zitate haben. Ihr meine lieben Leserinnen und Leser ahnt es sicherlich bereits: (i) ein weiteres Merkmal, enthuellt durch das neue Werkzeug, und (ii) ich werde das nicht weiter untersuchen.
Ansonsten sieht man hier deutlich, warum ich ueberhaupt erst auf die Idee der Komprimierung gekommen bin; hatte ich doch damals bereits in dem vielen Schwarz der unkomprimierten Daten doch noch Informationen vermutet. Die lila Tøne oberhalb der unteresten Reihen bestaetigen diese Vermutung. Das trifft uebrigens fuer alle Falschfarbenbilder zu, man sieht das nur nicht ueberall so gut (insb. bei den 2023-Daten, bei denen die hohe Intensitaet der Hauptseite die Farbskala festlegt und deswegen (fast) alles andere in den dunklen Bereich draengt).

Juti … ging ja schnell heute. Ich kann mich nur zitieren und sagen, dass …

[…] die zweite Art der Komprimierung […] [beim] naechste[n] Mal [behandelt wird].

Damals konnte ich in beim Hereinzoomen in die groszen, schwarzen Bereiche der Falschfarbenbilder helle Punkte wahrnehmen. Es stellte sich dann natuerlich die Frage, ob diese blosz einem „Rauschen“ entsprechen, oder ob es dort Information gibt. Zur Beantwortung der Frage „komprimierte“ ich die Daten: kurz gesagt, um die Signalstaerke zu erhøhen, addierte ich die Werte von mehreren Spalten / Reihen. Dabei habe ich natuerlich „Aufløsung“ verloren, weil ein erhøhtes Signal nicht mehr eindeutig einem Zitategruppewert zugeordnet werden konnte (denn diese Gruppen wurden ja gerade „komprimiert“).

Soweit zur Wiederholung. Beim letzten Mal schrieb ich:

[…] [die Komprimierung] konnte ich […] erweitern und generalisieren […]

… und darum geht es heute.

Zur Erinnerung: damals war ich mir nicht der Møglichkeiten dieser Analysemethode bewusst und schaute nur auf die Zitate-ueber-Zitate Daten. Die Komprimierung bestand dann darin, dass ich mir die Bedeutung jedes Wertes auf der Ordinate anschaute und damit ausrechnte wieviele Zitate die Seiten auf sich vereinten, die in der entsprechenden Spalte vertreten waren. Drei Beispiele: 100 Seiten die jeweils 5 Zitate haben, vereinen 5 x 100 = 500 aller Zitate auf sich. 50 Seiten die jeweils 10 Zitate haben, vereinen ebenso 10 x 50 = 500 aller Zitate auf sich. 5 Seiten die jeweils 23,517 Zitate haben, vereinen 5 x 23,517 = 117,585 Zitate auf sich.
Mit der Information rechnete ich dann aus, wieviele Spalten ich jeweils zusammenfassen muss, damit in einer zusammengefassten / komprimierten / „verschmolzenen“ Spalte immer ca. 1 % aller Zitate auftreten.

Soweit, so gut. Damals hatte ich mir nix weiter dabei gedacht, aber diese Art der Komprimierung nenne ich jetzt „Bedeutungskomprimierung“. Es wird naemlich nur darauf geachtet, wieviel der „kompletten Bedeutung“ eine Spalte auf sich vereint. Konkreter: wie hoch der Anteil an allen Zitaten (oder Links) aller Wikipediaseiten ist, die in der gegebenen Spalte steckt und die Achse gibt die Bedeutung vor.
Da damals Ordinate und Abzsisse die selbe Bedeutung hatten, konnte die obige Komprimierung 1:1 auf die Reihen angewandt werden.

Als ich dieses Thema das erste Mal behandelte hatte ich das nicht gezeigt, aber das Gesagte kann man auch in ein Diagramm packen. Hier ist so ein Diagramm zu sehen:

Fuer die Diskussion dessen was man hier sieht, ist es egal ob man auf die Daten aus 2020 oder aus 2024 schaut. Wenn wichtig, gehe ich auf die Unterschiede weiter unten kurz ein, aber fuer die allgemeine Besprechung macht das keinen Unterschied, denn wiedereinmal gibt es im Wesentlichen keine Unterschiede zwischen den Jahren.

Ich sollte auch erwaehnen, dass man hier noch gar keine Komprimierung sieht, sondern nur wie hoch der „Bedeutungsanteil“ einer jeden Spalte in den Falschfarbenbildern ist, wenn die Bedeutung besagter Spalte die Anzahl der Zitate ist. Auf der Abzsisse sind also die UNkomprimierten Zitategruppen abgebildet und das ist somit die Grundlage fuer die „Bedeutungskomprimierung“ im naechsten Schritt.

Bei lineaer Abzsisse (linkes Bild) sieht man, dass bei sehr kleinen Zitategruppen kurz sehr viel „passiert“. Bei logarithmischer Achse ist dieser Bereich „aufgespreizt“ und man sieht, dass einzelne Spalten bis zu (fast) 1 % aller Zitate auf sich vereinen. Dies obwohl die dazugehørenden Seiten nur (sehr) wenige Zitaten haben. Nur gibt es von denen so viele, dass da in der Summe ganz schøn viel zusammen kommt. Kleinvieh macht auch Mist (und nicht zu wenig).
Ein weiterer Vorteil der linearen Abzsisse ist, dass man am besten sieht, dass ab ca. Zitategruppe 200 der Bedeutungsanteil dann aber (sehr) klein wird und (mehr oder weniger) auf diesem kleinen Wert „verharrt“. Ausgenommen die allerletzten paar Punkte zieht sich dieses Verhalten der Kurve bis (weit) ueber Zitategruppe 5000 hin. Auch das ist einfach zu erklaeren, denn trotz zum Teil sehr hoher Anzahl an Zitaten, so bestehen gerade (sehr) hohe Zitategruppen aus nur wenigen Seiten (oft gar nur einer). Da summiert sich also in einer Spalte nicht viel auf, gesehen auf die weit ueber 100 Millionen Zitate insgesamt.
Ganz am Ende machen die Punkte dann nochmal ’nen Sprung nach oben. Bei den 2020 Daten faellt der recht klein aus, waehrend die allerletzte Zitategruppe bei den 2023 Daten ueber 2.5 % aller Zitate auf sich vereint. Das ist natuerlich wieder die Wikipedia Hauptseite die neuerdings von (fast) allen anderen Seiten zitiert wird.

Interessant ist, dass die 2023 Daten bis ca. Zitategruppe 20 etwas tiefer liegen als die 2020 Daten. Zunaechst dachte ich, dass die Hauptseite da einfach alles „runterdrueckt“, weil die so viele Zitate auf sich vereint. Aber dann haette man das auch bei høheren Zitategruppen sehen muessen. Deswegen rechnte ich den Anteil der letzten 17 Zitategruppen raus (vulgo: ich berechnete alles nochmal, aber ohne die). Waere meine Erklaerung richtig gewesen, dann haette der Verlauf der Kurven der beiden Daten im Wesentlichen gleich sein muessen. Mathematisch gesprochen, haette die Subtraktion der korrigierten 2023-Daten von den unkorrigierten 2020 Daten mehr oder weniger konstant sein muessen, mit einem Wert von null (plusminus Rauschen). Fuer Seiten in Zitategruppen grøszer als 100 ist dem auch so, aber die „Erniedrigung“ bei kleinen Zitategruppenwerten bleibt trotz Korrektur erhalten.
Dieses Ergbeniss deutet wieder auf eine „Hausmeisteraktion“ hin, bei der etliche Seiten geløscht wurden. So etwas vermutete ich bereits hier. … … … Da hat dieses neue Werkzeug wieder was aufgedeckt, fetzt wa!

Soweit zur Grundlage der Komprimierung. Wenn man die entsprechende Anzahl an Spalten dann miteinander „verschmilzt“, damit jede komprimierte Zitategruppe ungefaehr 1 % der Gesamtzitate enthaelt, erhaelt man diese zwei Diagramme:

Als erstes sei zu sagen, dass die 2020 Daten in 102 komprimierte Gruppen (ich lasse das Wørtlein „Zitate“ der Lesbarkeit jetzt weg) (bedeutungs)komprimiert (das Wørtlein „bedeutungs“ lasse ich auch weg) wurden und die 2023 in 101 Gruppen. Ich erklaere weiter unten, warum das nicht genau 100 (entsprechend 100 %) werden.
Im linken Diagramm sind auf der Abzsisse immer noch die UNkomprimierten Gruppe abgetragen, waehrend im rechten Diagramm einfach nur die (laufende) „Gruppenzahl“ der komprimierten Gruppen abgetragen ist. In beiden Faellen entsprechen die Punkte und Quadrate den komprimierten Gruppen.
Wie man an der Ordinate ablesen kann, wurde das „Versprechen“, dass die komprimierten Gruppen ungefaehr 1 % aller Zitate enthalten, eingeløst.

Auffaellig ist, dass im linken Diagramm der Abstand der Punkte anfangs sehr klein ist, dann zu nimmt und zum Ende hin wieder kleiner wird. Das ist leicht mit dem vorherigen Diagramm bzgl. der „Grundlagen der Komprimierung“ zu erklaeren. Kleine (unkomprimierte) Zitategruppen enthalten so viele Seiten, dass sie einen entsprechend hohen Anteil aller Zitate repraesentieren. Deswegen braucht man da nur wenige UNkomprimierte Gruppen um eine komprimierte Gruppe „voll zu machen“. Spaeter ist es dann so, dass eine UNkomprimierte Gruppe immer weniger Seiten, (sehr) oft gar nur eine einzige, enthalten. Entsprechend mehr Gruppen muss man miteinander „verschmelzen“ um eine komprimierte Gruppe zu erhalten. Und da die „verschmolzenen“ unkomprimierten Gruppen ja alle in EINER komprimierten Gruppe landen, verschwinden die dann bei einer Abzsisse wie im linken Diagramm und der Abstand zwischen den Punkten nimmt zu. Zum Ende hin bestehen die Gruppen zwar auch nur aus einzelnen Seiten, aber weil die so viele Zitate haben, ist deren Anteil an allen Zitaten wieder grøszer und man braucht weniger UNkomprimierte Gruppen um eine komprimierte Gruppe „voll zu machen“. Deswegen nimmt der Abstand zwischen den Punkten wieder ab.
Im rechten Diagramm tritt dieses Phaenomen natuerlich nicht auf, da alle komprimierten Gruppen den gleichen Abstand zueinander haben.

Der selbe Mechanismus erklaert auch, warum das am Anfang so zappelt bzw. warum es zu „Spruengen“ im Graf auf der rechten Seite kommt. Zur Veranschaulichung ein Beispiel.
Man denke sich vier, aufeinander folgende, UNkomprimierte Gruppe, die jeweils 0.9 %, 0.5 %, 0.3 % und 0.3 % aller Zitate enthalten (in dieser Reihenfolge).
Wuerde die 0.9 % Gruppe mit der 0.5 % Gruppe verschmelzen wuerde die komprimierte Gruppe 1.4 % aller Zitate repraesentieren. Aber 1.4 % ist weiter von 1 % entfernt als 0.9 %. Deswegen findet die Verschmelzung nicht statt, die 0.9 % Gruppe wird ihre eigene komprimierte Gruppe.
Nun verschmelzen die 0.5 % Gruppe und die erste 0.3 % Gruppe und bilden zusammen eine komprimierte Gruppe die 0.8 % aller Zitate auf sich vereint. Das ist noch nicht nah genug an 1 % dran, weswegen auch die zweite 0.3 % Gruppe mit denen verschmolzen wird. Alle drei zusammen vereinen nun 1.1 % aller Zitate auf sich. Das liegt zwar ueber 1 %, ist aber naeher dran als 0.8 % und deswegen bleibt diese Verschmelzung erhalten.
Weil beide Punkte im Diagramm direkt aufeinander folgen, der erste aber unter 1 % und der zweite ueber 1 % liegt, kommt es zu einem „Sprung“. Wie man im rechten Diagramm sieht, muessen solche Spruenge nicht nur nach oben, sondern kønnen auch nach unten gehen.

Und immer noch der selbe Mechanismus ist dann auch dafuer verantwortlich, dass es mehr als 100 komprimierte Gruppen gibt (und sogar unterschiedlich mehr). Das erklaer ich jetzt aber nicht haarklein und ihr, meine lieben Leserinnen und Leser møgt euch die Details selbst ueberlegen.

So weit so gut. Ich erklaere das hier so ausgiebig, weil sich dies in den entsprechenden Falschfarbenbildern in helleren Streifen aeuszern wird. Die erklaerte ich zwar damals bereits genauso, aber weil das hier in einem vøllig andersgeartetem Diagramm (und mit besserer Notation) auftritt, bin ich nochmal drauf eingegangen.

All das gesagt, kann ich ohne viele Worte die entsprechenden, relevanten Grafen zur Bedeutungskomprimierung der Linksgruppen zeigen:

Es ist bereits bekannt, dass’s ungefaehr drei Mal weniger Links- als Zitategruppen gibt. Interessant ist, dass so viele unkomprimierte Linksgruppen (deutlich) ueber 1 % aller Links repraesentieren. Deswegen waere es vllt. besser einen etwas høheren Anteil (bspw. 1.5 %) fuer die Komprimierung zu waehlen. Das Programm kann das jetzt, aber ich mache hier alles auch weiterhin mit 1 %.
Diesee hohe Werte sind dann auch der Grund, warum ich hier fuer beide Datensaetze weniger als 100 komprimierte Gruppen erhalte; 96 fuer die 2020 Daten und 97 fuer die 2023 Daten.

Ansonsten ist das qualitativ im Wesentlichen das Gleiche, sowohl zwischen den verschiedenen Datensaetzen, als auch im Vergleich mit den komprimierten Zitategruppen oben.
Ach so … im linken Diagramm scheinen kleine Linksgruppen der 2023 Daten um eins nach rechts verschoben zu sein, im Vergleich mit den 2020 Daten. Das liegt natuerlich wieder an der Wikipedia Hauptseite, die ja nun anscheinend auf (fast) allen Seiten auftaucht. Bei høheren Linksgruppenwerten sieht man das wegen der logarithmischen Achse nur nicht mehr.

Alles hier ist bereits neue (und interessante) Information die mir vorher gar nicht aufgefallen ist, weil sie mir gar nicht vor lag. Wieder „ans Licht gebracht“ wurde das alles durch das „neue Werkzeug“ … cool wa!

Weil die Daten hier nach der BEDEUTUNG der Achse komprimiert sind, werden beim Zitate-ueber-Zitate Falschfarbenbild die Reihen natuerlich auf exakt die selbe Art und Weise komprimiert wie die Spalten. Dito (mutatis mutandis), fuer das Links-ueber-Links Falschfarbenbild. Und bei „gemischter“ Bedeutung der Achsenkombinationen wird natuerlich die jeweils richtige Bedeutungskomprimierung fuer die entsprechenden Spalten oder Reihen benutzt. Aber diese ist dann die Selbe wie hier gezeigt. Das fuehrt bei den zwei „gemischten“ Achsenbedeutungskombinationen dennoch zu unterschiedlichen Ergebnissen, weil diese beiden Falschfarbenbilder ja nicht symmetrisch sind.

Uff … jetzt ist das doch schon wieder so viel geworden. Deswegen verschiebe ich die zweite Art der Komprimierung auf’s naechste Mal.

Ich wuensche euch, meinen lieben Leserinnen und Lesern, einen guten Rutsch und ein ganz hervorragendes 2025 :) .

Zum Ende meines diesjaehrigen Geburtstagsbeitrags schrieb ich:

[…] [D]as Thema […] werde ich anhand eines konkreten Beispiels an anderer Stelle nochmal aufgreifen.

Da ich bisher anderweitig beschaeftigt war, liesz die Antwort auf sich warten (und mir ist bewusst, dass der Abschluss der Hormesis-Reihe schon laenger her ist und dass auch die Feinstaubreihe noch in der Luft haengt).

Das konkrete Beispiel ueber das ich heute schreibe ist eine weitere „Anwendung“ des im Geburtstagsbeitrags anhand eines (anderen) Beispiels illustrierten Prinzips. Oder anders: wieder bleibt mir das „Hab dich!“ (bzw. hier eher „du bist ja doof“) im Halse stecken, wenn ich alles gruendlich durchdenke und mein Gegenueber deswegen besser verstehe.

In kurz geht es um diesen alten Gag …

Geklaut von hier, ’ne echte Originalquelle gibt’s sicher nicht.

… der sich (meist) ueber (US) Amerikaner lustig macht … und frueher hab ich kraeftig mitgelacht (und mitgemacht).

Irgendwann ist mir dann aber mal aufgefallen, dass ich …
… „1 Meter“ sage, mir aber eine Schrittlaenge vorstelle, und zu Fusz gehe …
… „5 Kilometer“ sage, mir aber die Strecke zwischen Buch und Grieben vorstelle, … bzw. heute bei 4 km an einen Spaziergang um den Theisendam denke … und das automatisch mit ca. 1 Stunde spazieren gehen gleichsetze … oder 20 Minuten Fahrrad fahren … oder durchgeweichten Stoffschuhen, aber trockenen Herbstschuhen, bei leichtem Regen, …
… „500 km“ sage, mir aber die Strecke Trondheim – Oslo vorstelle, … und das automatisch mit einer unbestimmten, definitiv nicht metrischen Menge Stress gleichsetze, weil das oft Fliegen bedeutet, …
… „einmal um die halbe Welt“ sage, mir aber die Strecke Norwegen – Japan vorstelle, … *opps* nun ist ja nicht mal mehr das erste metrisch, …

… … … .oO(genug der Laengen) … … …

… „ein halber Liter“ sage, mir aber ’ne Colaflasche vorstelle, …
… „25 kg“ sage, mir aber vorstelle wie schwer ein Sack Zement ist, …
… beim kochen definitiv NICHT „14.7868 Milliliter“ sage oder denke, sondern einfach ’n Essløffel voll benutze (gerne gehaeuft), …
… weisz, dass die Strecke Erde – Sonne ungefaehr 150 Millionen Kilometer sind, das aber (fast) nie benutze sondern (fast) immer an eine Astronomischen Einheit denke, …
… ich von Milli-, Micro, Nanosekunden weisz und oft genug damit zu tun hatte (und habe), ein Tag aber trotzdem 86,400 Sekunden enthaelt.

Ich møchte damit ausdruecken, dass das metrische System zwar toll ist, wenn man was zu rechnen hat und das mit Sachen die nicht in der eigenen „Werkstatt“ (im allerweitesten Sinne) gemacht wurden vergleichen muss. Aber im Alltag verdient es nicht unbedingt die Huldigungen, die es so oft bekommt … insb. von Leuten wie mir. Sobald ich eine „alltagstaugliche“ Zahl im Zusammenhang (Laenge, Masse, Zeit) høre, stelle ich mir Mehltueten anstatt Kilogram, Colaflaschen anstatt Volumen und Stress oder Zeiteinheiten anstatt Laengen vor … und letztere kønnen sogar noch unterschiedlich sein, je nach Verkehrsmittel … oder anders: ich stelle mir alles AUSZER metrischen Einheiten in meinem Alltag vor.

Und selbst das Rechnen ist physikalisch gesehen nur in kleinen Bereichen metrisch. Ich wuerde sagen bis zu Laengen von ca. 1/2 Million Kilometer, dann faengt man eher an in Lichtsekunden zu rechnen. Ab ca. 50 Millionen Kilometern in astronomischen Einheiten, ab ca. 1 Billion Kilometern in Lichtjahren und ab ca. 1 Billiarden Kilometern in Parsec … und irgendwann ist alles so weit weg, dass man nur noch in Rotverschiebung rechnet. Keine einzige dier Einheiten ist mit den anderen Einheiten mittels einer fein durch 10 teilbaren Konstante „verbunden“. Vielmehr ist es ein buntes Kuddelmuddel an Umrechnungsfaktoren. Und alle Umrechnungsfaktoren beziehen sich auf Dinge die man sich vorstellen kann (mehr oder weniger).

Dito, bei der Zeit. Im ganz Kurzen ist alles metrisch, aber schon die Minute hat 60 Sekunden … wenigstens bleibt der Faktor auch fuer die naechste Einheit erhalten. Und dann kommt der Tag mit seinen 24 Stunden … aber das basiert ja wenigstens alles noch auf der Zahl 6 … aber die 6 ist definitiv nicht metrisch. Und dann schwankt die Anzahl der Tage im Monat … und das Jahr laeszt sich weder in eine 10-er Zaehlung noch eine 6-er Zaehlung pressen (auch der franzøsische Revolutionskalendar løste Problem nicht in Gaenze). Dennoch, wird so vieles in Jahren angegeben. Und sobald man 10 Jahre voll hat, geht es wieder mit 10-Faktoren los … wobei eine Dekade oder ein Jahrhundert ja dann doch auch wieder nicht mit der „durch 1000 teilen“ Regel zusammen passt. Und ich hab auch noch nie jemanden sagen høren: ich bin jetzt 0.044 Millenia alt … vielleicht sollte ich damit anfangen, einfach um die Leute zu verwirren … tihihi.

Die gleichen Ueberlegungen zur Masse ueberlasse ich euch, meinen lieben Leserinnen und Lesern, zur Uebung als Hausaufgabe.

Die Einheitlichkeit (!) aller Masze (und Gewichte … wie man frueher sagte, auch wenn ein „Gewicht“ ja auch nur ein Masz fuer Masse ist) ueber die Dorf- und Landesgrenzen hinweg (und ebenso wichtig: ohne Aenderungen dieser Einheitlichkeit ueber die Jahre) ist wichtiger als der Umrechnungsfaktor zwischen den verschiedenen Einheiten der verschiedenen Skalen. Es ist fein, dass dieser im metrischen System ein Faktor 1000 ist. Das macht bestimmte technische Berechnungen auf gewissen, eher limitierten Skalen (siehe oben), einfacher.

Aber wenn alle Leute einheitlich irgend ein anderes System benutzen wuerden, weil sie damit aufgewachsen sind, dann waere das in den allermeisten Faellen genauso gut. Ich brauche naemlich nie ’ne Tonne Salz beim Kochen und wenn ich mal 10 Liter Milch brauche, dann schreibe ich nicht „10 Liter Milch“ auf den Einkaufszettel sondern nur „Milch x10“ (man beachte hier, dass ich die Maszeinheit weglasse). Heutzutage muss das naemlich nicht mehr im Laden abgemessen werden und ich kann mich drauf verlassen, dass eine Tuete Milch genauso viel Fluessigkeit enthaelt wie die die daneben steht. Und ja! Es liegt an genau der Vereinheitlichung, dass ich mich drauf verlassen kann. Was fuer eine das ist, ist aber egal und in den USA wuerden es dann eben nur zwei grosze Milchflaschen werden (da fehlt dann zwar ungefaehr 1 Liter, aber bei 10 Litern kommt’s darauf dann auch nicht mehr wirklich an bzw. ist das Kuchenrezept angepasst).

Zusammengefasst bedeutet das zwei Sachen:
1.: Wer im Glashaus sitzt (und selber alles als „Døner pro Fuszballfeld“ im Geiste wahrnimmt), sollte sich nicht ueber Leute lustig machen die das direkt, also ohne Umwege (mehr oder weniger) lebensferner Maszsysteme, tun.
2.: Das macht natuerlich im obigen Bilde auch schon den Ursprungsbeitrag unnuetz. Es kuemmert mich doch ueberhaupt nicht, wie viele Fuesze in einer Meile sind. Eine Meile bedeutet doch viel eher, dass ich das nicht laufen werde, sondern in 2 Minuten (eine Zeiteinheit) mit dem Auto (eine „Arbeitseinheit“ oder „Stresseinheit“ oder „Faulheitseinheit“ wenn man auch gehen kønnte) da bin.

All das Gesagte ist natuerlich anders zu sehen, wenn ich Zucker in andere Laender verschicken oder an der internationalen Raumstation mitbauen will … aber das sind lebensferne Sachen, die mit 99.999% des Lebens der aller-aller-aller-aller-aller-allermeisten Menschen nix zu tun haben … nicht mal dann, wenn sie in ferne Laender reisen, weil man sich dort dann recht schnell auf ein anderes Messsystem einstellt. Und fuer den Rest reicht es, wenn man sich auf ein System einigt, das muss aber mitnichten das Metrische sein.
Wenn man hingegen das Leben besagter aller-aller-…-allermeisten Menschen bedenkt frage ich mich dann doch, ob das Maszsystem der USA nicht vielleicht doch besser (da lebensnaeher) ist.

Da faellt mir ein, dass ich dazu mal was zur Temperatur hatte, bei der die Experten lange Zeit meinten, dass das ueberhaupt nicht objektiv gemessen werden kann (und im Alltag tun wir das immer noch nicht … da geht’s nur um warm oder kalt bzw. darum ob die Brøtchen noch weisz oder schon angebrannt sind).

So viel Geschrieben und zum Abschluss kann ich leider nur sagen, dass mich diese Erkenntnis zum „Spielverderber“ macht. Ich lache (nicht mehr) ueber Sachen die viele andere Menschen in meinem Umkreis voll witzig finden … und dann kann ich meinen Mund nicht halten und møchte den Leuten zwar nicht ihren Spasz nehmen, ihnen aber gerne klar machen, warum es sich lohnt, sich in andere Menschen hinein zu versetzen … und sehr schnell haben die Menschen um mich herum keine Lust mehr auf, als Moralpredigten wahrgenommene, lange Monologe von mir und fangen an sich selbst zu zensieren wenn ich dabei bin und erzaehlen keine Witze mehr … und damit habe ich dann doch den ganzen Spasz verdorben … *seufz*.

So … damit das nicht so traurig endet hier ein Beispiel wie man sich-lustig-machen weglassen kann und dabei dennoch lustig bleibt:

Geklaut von hier … und ich bin zu faul um den urspruenglichen Erschaffer (bzw. Quelle) zu suchen (zumal ich ohnehin nicht denke, dass das von Erfolg gekrønt waere).

Witzig!

Ich wuensche erholsame Feiertage :) .

Ja genau! Das war der Typ der „die unsichtbare Hand des Marktes“ erfunden hat. Auszderm schrieb er das urst bekannte, urst wichtige (da urst einflussreiche), von mir aber nicht gelesene Buch „The Wealth of Nations„. Bei aller Kritik die ich gerne und oft am kapitalistischen System aeuszere, erkenne ich doch an, dass es doch auch fuer den viele Reichtum um mich drumherum, der mir das Leben unendlich viel einfach macht als vor 200 Jahren, verantwortlich ist. Und dieser Mann hat das zum ersten Mal systematisch analysiert und aufgeschrieben und damit ganz massiv Politiker und damit die Entwicklung der (nicht nur) westlichen Welt beeinflusst. In den „social sciences“ (das kann man nicht 1:1 auf die Sozialwissenschaften im dtsch. uebertragen; es kommt aber sehr nahe) ist es von allen vor 1950 publizierten Buechern, das am zweithaeufigsten zitierte. Haeufiger zitiert ist nur „Das Kapital“.

Apropos Marx … auch wenn er gerne ueber Vulgaerøkonomen und deren Machwerke schimpft, so zaehlt er Smith nicht zu denen und lobt die Erkenntnisse die dieser Mann hatte … auch wenn er sie oft genug (und oft scharf) kritisiert.

Lange Rede kurzer Sinn: es ist nicht verwunderlich, dass ich bei meinem Besuch in Edinburgh das Grab dieses Mannes …

… besuchte. Fetzt wa!

Beim letzten Mal wurden die Spalten der Falschfarbendarstellungen normiert. Ohne weiteren Aufhebens schreibe ich heute nur, dass das Gleiche (mutatis mutandis) auch fuer die REIHEN der Falschfarbendarstellungen gemacht werden kann (und damals auch gemacht wurde). Oder anders: aus jeder originalen, nicht normierten Falschfarbendarstellung werden zwei normierte Falschfarbendarstellungen „geboren“ und beim letzten Mal zeigte ich nur eins der „Kinder“.

Zunaechst wieder der Reproduzierbarkeitsteil — das Zitate-ueber-Zitate Bild (mit normierten Reihen):

WOW! Der helle Bereich „springt“ um fast hundert Reihen nach oben von 2020 zu 2023! Mit allem was wir bisher wissen ist das aber leicht zu erklaeren. Der Grund fuer dieses Phaenomen liegt wieder einmal in der Wikipedia Hauptseite, die bei den 2020-Daten nicht dabei ist und ueber 5 Millionen Zitate auf sich vereint. Letzteres entspricht auf der Abzsisse der allerletzten Zitategruppe und die kann man hier nicht sehen, weil ich die Abzsisse bei Zitategruppe 200 abschneide. Wenn man sich das aber anschaut, dann ist da eine helle Spalte. Wenn man das in Betracht zieht wird die Frage warum es ueberhaupt einen hellen Bereich nahe der Ordinate gibt, und sich nicht nur alles am Ende tummelt, viel interessanter.
Zum Glueck ist das auch leicht zu erklaeren, denn eines der wichtigsten (noch nicht reproduzierten) Ergebnisse war, dass die Anzahl der Links und die Anzahl der Zitate zusammenhaengen. Je mehr von dem Einen, desto mehr von dem Anderen. Oder anders, wenn eine Seite nur wenige Zitate erhaelt, hat diese sehr wahrscheinlich nur wenige Links. Aber einer dieser Links geht definitiv zur Hauptseite waehrend sich die anderen Links i.A. ueber die gesamte Abzsisse verteilen kønnen (Letzteres muss gleich modifiziert werden, kann hier aber erstmal so bestehen bleiben). Das fuehrt natuerlich dazu, dass die letzte Spalte bei kleinen Werten auf der Ordinate immer heller wird, waehrend die Zaehler in den entsprechenden Zellen aller anderen Spalten nur ganz langsam grøszer werden.
Je høher man auf der Ordinate geht, desto mehr Zitate und damit mehr Links haben die entsprechenden Seiten. Prozentual gesehen nimmt der Anteil den die Hauptseite an der Anzahl der Links hat also ab. Und nun die erwaehnte Modifikation: auf der Abzisse gesehen gibt es viel mehr Seiten mit wenigen Zitaten als mit vielen Zitaten. Ja, die Links zitieren dann zwar Seiten die sich prinzipiell „gleichmaeszig ueber die gesamte Abzsisse ausdehnen“, aber es werden viel mehr Seiten nahe des Ursprungs zitiert. Das bedeutet natuerlich, dass die Zaehler dort høher zaehlen als in den allermeisten anderen Spalten und deswegen hat man einen hellen Bereich nahe der Ordinate, der dann sogar den Zaehler der Hauptseite ueberstrahlen kann (eben weil der entsprechende „Zaehler“ prozentual weniger „reinhaut“).

Ich schrieb das so ausfuehrlich, weil man das „Springen“ in allen reihenweise normierten Bildern sieht. Der Rest ist wie beim letzten Mal im Wesentlichen wieder nur „Rauschen“ und die Veraenderungen desselben. Womit ich direkt zum ich zum Links-ueber-Zitate Bild (mit normierten Reihen) ueber gehen kann:

Hier sieht man den „Sprung“ besser, weil sich die Ordinate nicht so lang hinzieht … ansonsten nix weiter von Interesse und deswegen geht’s gleich weiter zum Links-ueber-Links Bild (mit normierten Reihen):

AHA! Hier sehen wir den Uebeltaeter!  … .oO(oder ist es eher eine Uebeltaeterin, denn das Substantiv „Seite“ ist weiblich?) … ja genau … hier sehen wir die Uebeltaeterin! Und was ich oben in vielen Worten beschrieb (auch wenn es keine 1000 waren) ist hier sofort zu sehen. Ich nehme an (habe es aber nicht nachgepreuft), dass der helle Streifen bei Linksgruppe 150 auf der Abzisse der Wikipedia Hauptseite entspricht. Hier hatte ich also Glueck, dass besagte Seite weniger als 200 Links hat (ich bin ziemlich sicher, dass die Anzahl der Links und die Zitategruppe hier noch 1:1 „projiziert“ werden) und damit nicht im abgeschnittenen Teil des Bildes landet.

Als Letztes noch schnell das Zitate-ueber-Links Bild (mit normierten Reihen) …

… und da ich oben bereits alles haargenau erklaerte, sieht man sieht hier eigtl. nix Neues. … Ach ja … der zweite, schwaechere, vertikale Streifen wird wohl zu der (anderen) Seite gehøren die ueber 1 Million Zitate auf sich vereint, bei der ich aber nie nachschaute um was es sich dabei handelt.

Beim letzten Mal hatte ich ganz zum Schluss noch ein Bild ohne „abgeschnittene“ Ordinate gezeigt, und dort sah man helle vertikale Streifen. Wenn man sich alles, also ohne „abgeschnittene“ Abzsisse, anschaut, denn sieht man solche Streifen auch hier wieder. Diesmal sind die natuerlich horizontal und treten wieder nur auf, wenn die Ordinate (da wir die Reihen normieren) die Linksgruppe praesentiert. Da diesbezueglich hier nix weiter zu holen ist und ich dazu alles schon beim letzten Mal sagte, spare ich mir das entsprechende Bild zu zeigen.

Sooo … das war’s … noch nicht, denn damals hatte ich den Eindruck, dass sich in den groszen schwarzen Bereichen noch Information versteckte. Um die aufzuspueren musste ich aber die Daten noch mehr bearbeiten. Diesen Prozess konnte ich auch erweitern und generalisieren und darauf gehe ich dann beim naechsten Mal ein (und sicher auch beim uebernaechsten Mal … und vielleicht darueber hinaus … das weisz ich gerade aber noch nicht).

… (obligatorisches Video … .oO(sag mir wie alt du bist, ohne mir zu sagen wie alt du bist) … krass, wie „frisch“ das auch nach ueber 30 Jahren noch ist … hatten (haben) schon Talent die (damals) jungen Maenner … und das sag ich als jemand, der das damals nicht so dolle fand und der auch heute nicht solcherart Musik hørt … aber darauf wollte ich gar nicht hinaus und das hat nicht mal nur sehr sehr entfernt mit dem heutigen Thema zu tun.

Aber der Reihe nach.

Zunaechst verweise ich nochmals auf dieses, fuer die Welt das Universum so wichtige Werk:

Im Zeiten Teil — Willing, Kapitel 9 — Epictetus and the omnipotence of the Will, werden die Philosophien von Paulus (von Tarsus … JA! DER!) und Epiktet verglichen. Das ist an und fuer sich auch sehr spannend, aber mir geht es nur um diesen kurzen Abschnitt:

[…] they share an almost instinctive contempt for the body–this „bag“, in Epictetus words […]

… … … Wait! … … … WHAT?

An dieser Stelle MUSS ich wieder einmal auf den den mglw. von mir am øftesten verwiesenen Artikel (ist es doch eine Art Dreh- und Angel-, mindestens der erste, mehr oder weniger klar, artikulierte Ausgangspunkt, fuer viele, mein _ich_ betreffende Fragen) verweisen … denn diesem gab ich den Titel „Fleischsaecke“ … wait! … what?

Ich erinnere mich noch vage, dass es mir damals schwer fiel einen Titel zu finden … weniger bewusst, als viel mehr „instinctive“ landete ich dann bei dem Gewaehlten. Und auch wenn ich es nicht direkt sage, so kønnte man aus den dort dargestellten angerissenen Ideen einen gewissen „contempt“ fuer meine sterbliche Huelle herauslesen. Sage ich doch (diesmal ganz direkt), dass diese ja eigentlich nur den kleinsten Teil dessen ausmacht, was (ich oder) andere „sehen“, wenn sie an mich denken.

Aber ich møchte mich hier nicht wiederholen. Vielmehr geht es mir darum, dass es mir nicht zum ersten Mal passierte, dass ich was von wem Beruehmtes lese und mich dann „aergere“, dass Gedanken und Ideen die mich selber auch (oft schon laenger) beschaeftigen schon vor Jahrzehnten, Jahrhunderten, oder gar Jahrtausenden von wem anders ausgedrueckt wurden.

Wobei der Gebrauch des Wortes „aergern“ hier erklaert werden muss. Es aergert mich natuerlich mitnichten, dass die besagten beruehmten Leute das (laaaaange) vor mir diskutiert haben. Ganz im Gegenteil, vielmehr freue ich mich urst drueber. Zum Einen, weil’s schmeichelhaft ist, dass viel viel wichtigere Menschen als ich das auch beschaeftigt hat. Zum Anderen, weil eben diese Menschen eine bestimmte Idee nicht nur besser ausdruecken, sondern auch VIIIIIEEEL besser durchdacht haben und mir mit meinen eigenen Gedanken und Herangehensweisen diesbezueglich oft unglaublich voran helfen.
Der „Aerger“ betrifft eher mich selbst. Ja, ich bin auf eine Idee auch von alleine gekommen und habe die Gedanken dazu unabhaengig gedacht (wenn auch laengst nicht auf so raffinierte Art und Weise). Ich muss mich da also nicht „unter’n Scheffel stellen„.
Gleichzeitig fuehle ich mich aber wie’n „Betrueger“ der nix Originelles macht … siehe, der Titel dieses Beitrags. Dem ist natuerlich nicht so, aber trotzdem: *seufz*.

Das Zitat ist ein besonders krasses Beispiel, denn es stellt nicht nur die gleiche (gar die selbe?) Idee an sich dar, sondern benutzt auch (beinahe) die exakt gleichen Worte. Da hab ich nach dem ersten kurzen „Aerger“ und vor allem groszer Verblueffung erstmal gelacht, darob dessen, dass das Universum ganz generelle Herausforderungen fuer die Menschheit parat hat, welche auch nach Jahrtausenden nicht geløst sind und vermutlich nicht løsbar sind … zumindest nicht auf dieser Ebene des Daseins … und mir sind andere (vulgo: spirituelle) Ebenen ganz grundsaetzlich versperrt … das entbehrt schon nicht einer gewissen Ironie.

Und nun wisst ihr, meine lieben Leserinnen und Leser das auch :)

Addendum: der Gedanke mit den „Fleischsaecken“ scheint sich uebrigens durch die Philosophie ganz von Anfang an zu ziehen. Im ersten Teil Teil des selben Buches — Thinking, Kapitel 10 — The intramural warfare between thought and common sense, paraphrasiert (und zitiert) Hannah Arendt Platos Gedanken von beinahe einem halben Millenium eher (ich lasse den Kontext mal weg):

[One desire of] [t]he „true philosopher,“ […] [is that] he may be free from all kinds of business and especially be rid of his body, which always demands to be taken care of, „falls in our way at every step … and causes confusion and trouble and panic,“ […].

Und gleich im naechsten Abschnitt wird René Descartes von Hannah Arendt zitiert, welcher mehr als 1 1/2 Jahrtausende nach Epiktet meinte (Kontext wieder wieder weggelassen) …

„[…] as long as the soul is attached to the body it may be bothered in its operations by the bad disposition of the body’s organs.“

Ich kann mich nur wiederholen: „[…] vermutlich nicht løsbar […]“.

Weil man damals nicht viel sah (und immer noch nicht viel sieht), wenn man sich alles auf einmal anschaut bzw. nur das bisschen was um den Ursprung rum passiert, normierte ich die Matrizen.
Kurz zur Wiederholung: Normierung bedeutet in diesem Fall, dass ich alle Werte einer Spalte durch den grøszten Wert in besagter Spalte dividiere. Dadurch wird die maximale Intensitaet auf eins festgesetzt und alle Spalten haben den selben maximalen Wert (nur eben (mglw.) an anderen Stellen).

Durch die Normierung wurde das viele Schwarz zumindest teilweise deutlich farbenfroher und man konnte viel mehr von dem sehen was eigentlich passiert. Das Wort „teilweise“ bezieht sich darauf, dass sich die Farben immer noch nahe der Abzsisse „tuemmelten“ … weswegen die Bilder hier und heute zwar den gesamten Definitionsbereich zeigen, auf der Ordinate aber nur bis zum Wert 200 gehen.

Und los geht’s wieder mit dem Reproduzierbarkeitsteil — das Zitate-ueber-Zitate Bild (mit normierten Spalten):

Bis auf eine Ausnahme passiert nix Wesentliches. Vielleicht gibt es ein Muster in den Bildern, ich denke aber, dass die Laenge und Intensitaet der einzelnen Spalten zufaellig ist. Das nennt man auch „Rauschen“ und Rauschen veraendert sich nunmal ueber die Zeit.
Die Ausnahme ist der helle Streifen in den 2020-Daten bei einer Zitategruppe von ca. 2600. Der ist entweder nicht mehr existent in den 2023 Daten, oder hat sich deutlich nach rechts, in die Naehe von Zitategruppe 5000 verschoben. Auch wenn ich das nicht geprueft habe, so denke ich nicht, dass Ersteres zutrifft. Der Grund liegt darin, dass sich der helle Streifen damals als zur Seite CinemaScore gehørend herausstellte. Die ist zu wichtig um einfach zu verschwinden. Auszerdem stellte sich damals auch heraus, dass die Art und Weise wann besagte Seite zitiert wird etwas speziell ist und dieses Spezielle kønnte eine deutlich høhere Anzahl an Zitaten drei Jahre spaeter durchaus mit einschlieszen.

Das schlieszt den Reproduzierbarkeitsteil ab und wie beim letzten Mal gehe ich sofort zum Links-ueber-Zitate Bild (mit normierten Spalten) ueber:

Das ist ja nun etwas komplett Neues, aber ich denke, dass man auch hier wieder vor allem Rauschen und Veraenderungen darin sieht.
Im Vergleich zum (spaltennormierten) Zitate-ueber-Zitate Bild ist es interessant, dass der helle Bereich nicht auf nur ein paar wenige Reihen nahe der Abzsisse konzentriert ist sondern sich ueber fast 30 Reihen ausdehnt. Ebenso ist der „Start“ des hellen Bereichs um ca. 10 Reihen nach oben verschoben. Und dann sind da noch zwei „Artefakte“ (?); zwei Steifen die sich etwas nach rechts ziehen. Einer in Reihe 13 oder 14 der von Zitategruppe 0 bis ca. 500 / 600 reicht und ein zweiter, schwaecherer zwischen den Reihen 32 und 36, von ca. Zitategruppe 200 bis ca. 1200.
Ich lass das alles jetzt einfach so stehen und mache da nix weiter mit.

Vielmehr gehe ich direkt ueber zum Links-ueber-Links-Bild (mit normierten Spalten)

Im Wesentlichen wieder nur Rauschen. Es gibt aber eine Abweichung die von groszem Interesse ist: der helle Bereich laeuft nicht ueber die gesamte Abzsisse. Vielmehr wird dieser „schwaecher“ ab ca. Linksgruppe 700 und ist nur noch sehr schwach, mit vielen Unterbrechungen ab ca. Linksgruppe 1100.
Das bedeutet ja, dass Seiten mit vielen Links, NICHT am haeufigsten von Seiten mit wenigen Links zitiert werden, denn dann wuerde der helle Bereich sich komplett durchziehen. Vielmehr scheint es so, dass solche Seiten von anderen Seiten mit zum Teil deutlich mehr als 50 Links zitiert werden. Letzteres ist aber nicht systematisch und deshalb sind die hellen Pixel (also das Maximum einer Spalte) bei Seiten in Linksgruppen ueber ca. 1100 zu groszen Teilen wie die Sternen am Himmel (also zufaellig) verteilt. Ich komme ganz am Ende darauf zurueck.

Als (vor)letztes das Zitate-ueber-Links-Bild (mit normierten Spalten):

Ah ja … sieht im Wesentlichen aus wie erwartet — eine Mischung der oben diskutierten und gezeigten Phaenomene. Der helle Bereich ist wieder schmal und nahe der Abzsisse (weil die Ordinate die Zitategruppe darstellt) und weil auf der Abzsisse die Linksgruppen abgetragen sind, tritt auch hier der „Sternenhimmel“ auf. Deswegen schreibe ich da niz weiter zu.
„Komisch“ sind in den 2020-Daten nur die duennen vertikalen Streifen die um Zitategruppe 110 (auf der Ordinate) auftreten. Die sieht man zwar nicht mehr, wenn man sich das Links-ueber-Links Bild (mit normierten Spalten) der 2020-Daten ohne „abgeschnittene“ Ordinate anschaut …

 

… aber deren „grosze Bruder“ tauchen bei ungefaehr Linksgruppe 700 auf der Ordinate auf! Ich habe da keine Erklaerung fuer, denn ich habe das nicht weiter untersucht, es sieht aber dem „Blob“ von damals erstaunlich aehnlich. Nur dass ich damals noch deutlich mehr als eine Normierung machen musste um ueberhaupt auf diese Anomalie aufmerksam zu werden, und beim „neuen Werkzeug“ faellt das einfach so raus.
Es scheint sich hierbei um eine Art „Linksphaenomen“ zu handeln, denn ich sehe das NICHT in den Bildern bei denen die Abzsisse die Zitategruppen praesentiert. Auch hier wieder: das soll reichen und es folgt nix weiter.

Abschlieszend kann ich auch dieses mal sagen: cool wa! Das neue Werkzeug „keeps on giving“. Das war’s aber noch nicht, denn weil es zu viel geworden waere, bekommen die reihenweise normierten Bilder ihren eigenen Beitrag (den naechsten).

Im Film Oppenheimer, den ich zum Zeitpunkt des Erscheinen dieses Artikels 24 Stunden im Kino und 3 Stunden zu Hause auf BlueRay…

… gesehen haben sollte, kann das zentrale Thema sehr stark vereinfacht, aber nicht unzulaessig, als „die Angst der Wissenschaftler die Atmosphaere zu entzuenden“ zusammengefasst werden. Das soll diesbezueglich hier und heute reichen und ich diskutiere das vielleicht nochmal genauer an anderer Stelle.

Mir geht es heute aber ganz konkret genau darum, dass die Wissenschaftler des Manhatten Projektes fuer eine Weile ernsthaft das Folgende diskutierten: unter der Annahme, dass eine auf Kernspaltung basierte Bombe, so viel Energie frei setzt, dass es zu einer Fusion (!) von Stickstoffatomen kommt, kann die durch die Fusion frei werdende Energie diese Reaktion in Gang halten?

Neulich stiesz ich auf den Los Alamos National Laboratory Originalbericht dazu, von E. J. Konopinski, C. Marvin, und E. Teller aus dem Jahre 1946. Der entstand zwar erst im Nachhinein, aber fasst besagte Diskussion zusammen und ist ein wirklich gutes Beispiel dafuer, wie man informierte Entscheidungen selbst bei Abhandensein gewisser nøtiger Informationen machen kann, aufgrund von (notwendigerweise konservativen) Abschaetzungen.

Kurz (und vereinfachend) gesagt wird zunaechst berechnet, wie oft Stickstoffatome zusammenstoszen (denn meistens fliegen die aneinander vorbei) und fusionieren und wieviel Energie dabei pro Sekunde und Kubikmeter Luft produziert wird. Dabei wird vom schlimmsten Fall ausgegangen, dass alle Støsze frontal aufeinander sind (sehr unrealistisch) UND dass jeder Zusammenstosz eine Fusion zur Folge hat (auch sehr unrealistisch, denn andere Reaktionen, wie Emsission von Alpha Partikeln und so, sind viel wahrscheinlicher).
Dann wird berechnet, wieviel Energie verloren geht. Dies geschieht hauptsaechlich durch Bremsstrahlung; schnelle (vulgo: heisze) Elektronen werden gebremst und der Energieunterschied wird in Form von Strahlung … øhm … abgestrahlt. Diese Energie steht dann der Fusionsreaktion nicht mehr zur Verfuegung, denn es benøtigt „feste Partikel“ die gegen die Stickstoffatome „prallen“ um die aufzuheizen … nicht vergessen: Temperatur entspricht der kinetischen Energie der Teilchen und beim „Teilchenbilliard“ wird besagte Bewegungsenergie ja durch andere „Billiardkugeln“ uebertragen.
Bei all dem werden „Nebenprozesse“ weg gelassen. Oder anders: es wird (A) davon ausgegangen, dass die Energie immer auf die effektivste Weise produziert wird und (B) andere Prozesse die zu Energieverlust fuehren, werden nicht in Betracht gezogen (man nimmt also an, dass es die nicht gibt und die Energie somit nicht durch solche Nebenprozesse verloren geht).

Energieverlust und -produktion werden dann ins Verhaeltniss gesetzt und das ergibt den Sicherheitsfaktor, von dem man møchte, dass der grøszer als 1 ist. Der Strahlungsverlust soll also grøszer sein als die Energieproduktion. Und dem ist zum Glueck so.
Dummerweise sind alle Grøszen abhaengig von der involvierten Energie, also wie schnell die Stickstoffatome (und Elektronen) sind. Sehr kalte Teilchen haben keine grosze Chance zu fusionieren und dadurch wird nur wenig Energie produziert. Sehr schnelle Teilchen fusionieren zwar oft und produzieren viel Energie, aber der Bremsstrahlungsmechanismus wird dabei auch sehr effektiv und ueberkompensiert Ersteres. Brenzlig wirds mittendrin und wenn man aus Sicherheitsgruenden die konservativsten Annahmen trifft kommt der Sicherheitsfaktor mit einem Wert von 1.6 der eins ganz schøn nahe.
Solche „mittendrin“ Energien sind aber immer noch sehr hoch und konnten durch die beim Manhattan Projekt entwickelten Bomben nicht produziert werden. Auch Weiterentwicklungen seitdem schaffen das nicht wirklich (zumindest nicht in ausreichendem Masze).

Nur um sicher zu gehen, ging die Diskussion dennoch auf eine andere Art und Weise weiter und die Wissenschaftler beschaeftigten sich mit der folgenden Frage: wieviel Luft muss man initial heisz genug machen, sodass die Reaktion sich von alleine fortsetzen kann (unter der Annahme, dass der Sicherheitsfaktor kleiner ist als oben berechnet).
Der Hintergrund liegt darin, dass bei einer zu kleinen Kugel die Oberflaeche im Verhaeltniss zum Volumen sehr grosz ist und deswegen durch besagte Oberflaeche mehr Energie abgestraehlt, als im Inneren produziert wird. Das ist also der gleiche Effekt, warum Pinguine in Suedafrika kleiner sind als die Pinguine am Suedpol.
Die Antwort: solch ein (Kugel)Volumen muss einen Durchmesser von ueber 100 Meter haben. Um ein solches Volumen genuegend aufzuheizen, sodass die Partikel schnell (vulgo: heisz) genug sind fuer einen kleinstmøglichen Sichterheitsfaktor, wuerde man ueber 1 Million Kilogramm spaltbares Material brauchen … WENN Letzteres zu 100 % gespaltetet werden wuerde (und somit die entsprechende Energie frei wird). In der Realitaet sind die 100 % eher um nur ca. ein Prozent.

Als Letztes wird ein weiterer wichtiger Energieverlustmechanismus diskutiert, der die obigen Zahlen noch unrealistischer macht.

Wir haben also:
– der Sicherheit wegen wird von extrem konservativen (vulgo: im Wesentlichen unrealistischen) Annahmen ausgegangen,
– der Sicherheitsfaktor bleibt trotzdem immer grøszer als 1,
– kommt fuer gewisse høhere Energien der 1 aber nahe,
– aber solche Energien kønnen nicht produziert werden,
– und selbst wenn solche Energien produziert werden kønnten und der Sicherheitsfaktor unter 1 fallen wuerde (die Berechnungen also nicht ganz richtig sind), wuerde man dafuer bei 100 % Effizienz absurd viel spaltbares Material benøtigen damit es zu einer fortlaufenden Reaktion kommen kann,
– und in der Wirklichkeit ist die Effizienz VIEL kleiner als 100 %.

Lange Rede kurzer Sinn: die von Edward Teller vorgebrachte Reaktion ist echt und ein Weltbrand kann daraus als Schlussfolgerung gezogen werden. Deswegen war die ausfuehrliche Beaschaeftigung mit dem Thema extrem wichtig. Eine SEHR konservative Abschaetzung zeigt aber deutlich auf, dass das nicht passieren wird.

Abschlieszend dazu noch ein Kommentar bezueglich den „Chances are near zero„. Das bezieht sich NICHT auf die obigen Rechnungen. Das ist also NICHT das was viele unter „Quantenmechanik“ verstehen. Es geht also NICHT darum, dass das Eintreten eines Ereignisses eine Wahrscheinlichkeiten ist und „near zero“ bedeuten wuerde, dass ein Ereignis irgendwie doch eintreten kann.
Das „near zero“ bezieht sich darauf, dass die Wissenschaftler, in typischer wissenschaftlicher Manier, es nicht ausschlieszen wollten, dass sie einen Fehler gemacht haben oder dass es nicht doch einen bisher unbekannten Mechanismus gibt, der eine fortdauernde Fusionsreaktion von Stickstoff erlaubt haette.
Mit den getroffenen extrem konservativen Annahmen waren besagte Wissenschaftler allerdings so ueberzeugt davon, dass ihr Bild von der Welt vom Universum richtig ist, dass sie dieser Møglichkeit eine „near zero“ Chance gaben.
Oder anders gesagt: das Universum sagte in Form der Physik, dass die Atmosphaere nicht entzuendet werden wird: Wahrscheinlichkeit gleich Null … aber die involvierten Menschen wollten nicht ausschlieszen, dass sich nicht vielleicht doch noch etwas (zum Thema relevantes!) hinter dem „Schleier“ versteckt von dem sie nix wissen. Letzteres kann man aber niemals in Formeln packen und deswegen auch nicht abschaetzen. Wie soll man eine Aussage ueber etwas treffen von dem man weder weisz ob es NICHT existiert noch ob es existiert? (Das geht in eine aehnliche Richtung wie Russels Teekanne.) Zu dem Zeitpunkt wusste die Menschheit allerdings bereits so viel ueber das Universum, dass die Wahrscheinlichkeit der Existenz einer solchen (zum Thema relevanten) Sache als „near zero“ eingestuft wurde.

Der Film macht da aus (nicht nur) dramaturgischen Gruenden ein viel grøszeres Buhei draus, als es in Echt wahr. Meiner Meinung nach ist es aber Christopher Nolans (filmtechnischer) Genialitaet zu verdanken, dass er diesen „Kniff“ (nicht abschaetzend gemeint) nicht nur erkannte sondern auch hervorragend (auf verschiedenen Ebenen) umzusetzen wusste.
Wie gesagt, dazu vielleicht (mglw. aber nicht) mehr an anderer Stelle. Fuer heute soll es genug sein.

Es ist zwar ein Stereotyp aber zum Glueck von der ganz milden Sorte: in Japan ist trotz der hohen Haeuser alles irgendwie kleiner kuerzer. Ich habe mir ein paar (wenige) Male den Kopf leicht gestoszen, weil ich unterbewusst annahm, dass eine Sache høher angebracht war, als sie es tatsaechlich war.

Zum ersten Mal ist mir das in der U-Bahn in Sapporo aufgefallen:

Mich duenkt die horizontale Stange zum dran festhalten … ich fass doch nicht die Haltegriffe an … da sind doch ganz bestimmt noch mehr Viren und Bakterien dran als an der besagten Stange (einfach, weil Letztere nicht von kurzen Menschen erreicht werden) … streng genommen fasse ich meistens nicht mal die horizontalen Stangen an sich an, sondern ich versuche mich an den, (meist) vertikal aus der Decke haengenden, Befestigungsmøglichkeiten fuer besagte Stangen festzuhalten … jaja … ich weisz, dass das nicht ganz rational ist … wo war ich … ach ja … ist in Europa etwas høher … ich kønnte mich da aber taeuschen.

Am Rande: Die Tuete enthaelt uebrigens urst leckere die weltleckersten Kekse aus der dortigen Schokoladenfabrik (mit angeschlossenem Vergnuegenspark).

Auf diesem Bild sieht man einen Beinahezusammenstosz:

Dieser passiert im Regionalzug, auf dem Weg zurueck aus der Wueste.

Also: immer schøn den Kopf einziehen in Japan … das gilt natuerlich nicht fuer den kleinen Mann und andere kurze Menschen … SCNR :P .

Nach der nøtigen Verallgemeinerung vom letzten Mal kann ich endlich zu den zweidimensionalen Falschfarbenbildern kommen. Nur eine kleine Sache muss ich noch erwaehnen. Meine Lieblingsfarbpalette fuer Falschfarbenbilder hat gewisse Probleme (in kurz: sie luegt mich an und gaukelt mir Sachen vor die gar nicht da sind; schau bspw. hier, etwas technischer hier). Ich wusste davon seit einigen Jahren. Dinge die einem am Herzen liegen, gibt man nur nicht so schnell auf. Aber nun endlich habe ich mich dazu durchgerungen eine andere Farbpalette zu benutzen, die nicht mit diesen Problemen einher kommt.

Hier ein Vergleich von alt und neu:

Es ist gerade noch nicht so wichtig, was man da sieht (denn ich komme gleich darauf zurueck). Wichtig ist, dass die Farbpalette von blau bis rot im hellgruenen Bereich eine viel høhere Intensitaet vermuten laeszt, als tatsaechlich da ist. Das ist nur das auffaelligste Merkmal (es gibt noch andere, wenn man genau hinschaut) und ich werde hier nicht darauf eingehen, inwiefern das Information hinzufuegt, die so nicht vorliegt. Aber all das tritt bei Benutzung der neuen Farbpalette nicht mehr auf.

Das soll dazu reichen und ich gehe sofort zum eigentlichen Thema ueber: Falschfarbenbilder die zeigen welche Seiten von welchen anderen Seiten zitiert werden.
Bereits damals stellte ich fest, dass man im Wesentlichen nur schwarz sieht (Wortspielkasse), wenn man sich alles anschaut und die „Action“ um den Ursprung herum passiert. Daran hat sich auch mit den 2023-Daten nix geaendert und deswegen zeige ich hier nur Bilder die sich auf die ersten hundert Bedeutungsgruppen (zum Quadrat) konzentrieren.

Fuer den Reproduzierbarkeitsteil (aber mit neuen Farben) der Vergleich des Zitate-ueber-Zitate-Bildes:

„OI! Da aendert sich doch aber gewaltig viel!“ kønnte man da sagen, denn die Intensitaet nimmt stark ab. Ihr meine lieben und aufmerksamen Leserinnen und Leser seht aber sicherlich sofort, dass sich auch die Farbskala gewaltig aendert. Und wenn man das vergleicht, dann ist das doch sehr aehnlich.
Der Grund fuer die viel weiter reichende Farbskala bei den 2023-Daten liegt in der einen Wikipedia Hauptseite die insgesamt ueber 5 Millionen Zitate erhaelt und in den 2020-Daten nicht dabei ist. Das ist buchstaeblich nur die allerletzte Spalte, und auch da nur ca. die ersten 23 Pixel, die den kompletten (Farb)Bereich voll ausnutzen. Die Farbwerte (aber nicht die Zahlenwerte) aller anderen Pixel ist dementsprechend herunter gesetzt. Die Aenderung ist somit ein technisches Artefakt und liegt nicht an den allgemeinen (!) 2023-Daten an sich. Wenn man besagte Hauptseite (und noch eine zweite Seite mit ueber 1 Million Zitaten, bei der ich aber nicht schaute um was es sich dabei handelt) entfernt, ist alles im Wesentlichen wie vorher. Und hier ist das entfernen vøllig OK, da es sich ja im einen tatsaechlichen Ausreiszer handelt, der gar nichts ueber die generelle Situation aussagt.

Von dem leicht zu korrigierenden, technischen Artefakt abgesehen passiert auch bei den 2023-Daten nicht viel. Das Intensitaetsmaximum liegt beide Male um 3 Zitate auf der Abzsisse und 1 Zitat auf der Ordinate und der leuchtende „Blob“ zieht sich parallel zur x-Achse ein wenig in die Laenge und bildet einen „duennen Schwanz“ aus.

Wenn man sich aber das Links-ueber-Zitate Bild anschaut wird’s in den 2020-Daten spannend:

Zum Einen verteilt sich die „Action“ mehr; der „Blob“ ist viel ausgedehnter. Zum Zweiten leigt das Maximum bei ungefahr 4 Zitaten auf der Abzisse und ungefaehr 11 Links auf der Ordinate. Zum Dritten dehnt sich der „Blob“ zwar relativ gleichmaeszig entlang beider Achsen aus, scheint die Richtung parallel zur Ordinate aber ein klein wenig zu bevorzugen. All das ist voll aufregend und gehørt untersucht. Aber nicht (mehr) von mir und nicht an dieser Stelle.
Abschlieszend zu diesem Bild ist wieder nur zu sagen, dass es keinen Unterschied in den 2023-Daten gibt. Die Aenderung der Intensitaet ist auch hier wieder nur ein Artefakt.

Auf zum Links-ueber-Links Bild:

Ich gehe jetzt nicht im Detail auf alle Merkmale ein, an den 2020-Daten sieht man aber leicht, dass es noch andere Informationen offenbart als beide vorherigen Darstellungen.
Interessant ist die helle, unterbrochene Linie, parallel zur Abzsisse, bei 12 Links auf der Ordinate. Dort treten etliche Pixel _deutlich_ hervor. Das ist bestimmt ein weiteres Artefakt und es wuerde mich nicht wundern, wenn es sich dabei um Seiten handelt, die ich hier als „Information Operations“ bezeichnete. Diesmal liegt das Artefakt aber nicht in der Darstellung, sondern in den Daten … andererseits dachte ich auch beim „São-Paulo-FC“-Phaenomen, dass es sich dabei um ein Artefakt handelt und das stellte sich dann nur als extremste Ausfuehrung einer systematischen Sache heraus.

An dieser Linie sieht man auch die einzigen zwei echten Unterschiede zu den 2023-Daten. Zum Einen scheint die Linie um eins nach oben zu „springen“. Ich wuerde zunaechst nicht ausschlieszen, dass ich da einen Fehler gemacht habe. Denke aber nicht, dass dem so ist.
Vielmehr vermute ich, dass der Hintergrund wieder die Wikipedia Hauptseite ist. Ein Link dahin scheint bei den 2023-Daten in (fast) allen Seiten drin zu sein (denn andernfalls haette die nicht so viele Zitate). Wenn besagter Link zwischen Ende 2020 und Ende 2023 automatisch zu allen Seiten hinzugefuegt wurde, heiszt das ebenso, dass die Anzahl der Links aller Seiten um eins nach oben geht. Das wuerde die hier nicht mal erwaehnte, weil so schwache, ganz leichte Verschiebung der roten Kurve erklaeren … wenn man genau hinschaut, scheinen dort alle Seiten um eins nach rechts gehuepft zu sein. Aber auch das werde ich mir nicht weiter anschauen … ich erwaehnte es nur als plausiblen Mechanismus, der die Unterschiede einfach erklaeren wuerde.
An der Linie sieht man noch einen weiteren Unterschied: die Position der hellen Punkte verschiebt sich auch entlang der Linie (bzw. verschwinden diese zum Teil vøllig). Das sieht mir nach ’ner „Hausmeisteraktion“ bei der Wikipedia aus, bei der bspw. „Information Operations“-Seiten geløscht wurden. Ein paar solcher Seiten konnten „entkommen“, bzw. rutschten vermutlich gerade unter die Erkennungsgrenze die fuer solche Seiten festgelegt wurde.

Und nun noch schnell das Zitate-ueber-Links Bild:

Man sieht an den 2020-Daten, dass es von allen drei neuen Achsenbedeutungskombinationen am meisten dem Zitate-ueber-Zitate Bild zu aehneln scheint. Es gibt aber Unterschiede die sich lohnen naeher zu betrachten … ihr, meine lieben Leser und Leserinnen ahnt es aber sicherlich schon: das wird nicht hier passieren und auch nicht (mehr) von mir gemacht werden.

Das soll reichen fuer heute. Ich møchte nur noch erwaehnen, dass erst dieses (neue) Werkzeug das (obige) Fuellhorn an Informationen zur Verfuegung gestellt hat. Das ist so’n bisschen wie damals (also ganz damals, viel frueher als mein Kevin-Bacon-damals) beim Mikroskop; die Informationen waren ja die ganze Zeit schon da, ich hab die nur (fast) nicht gesehen, weil ich die nicht „im richtigen Lichte“ betrachtet habe, weil mir bis vor Kurzem das richtige Werkzeug dazu fehlte.

Cool wa … das was eigentlich nur als Reproduzierbarkeit des ganzen Krams gedacht war hat (schon wieder) was Neues hervorgebracht. Wie ich es schon øfter erlebte, lohnt es sich sehr, am Ende nochmals auf eine Sache zu schauen mit der man sich laengere Zeit beschaeftigte. Denn dann kennt man viele der Details und wenn man das „Bild“ dann aus grøszerem Abstand anschaut, sieht man neue Sachen, die man vorher nicht sehen konnte, weil man eben diese Details noch nicht kannte. Aber ich fange an mich im Kreis zu bewegen und mache deswegen nun wirklich Schluss fuer heute.