Weil ich beim letzten Mal alles so lang und breit erklaert habe, kann ich sofort und ohne viel Aufhebens (oder nochmalige Wiederholung) daran anknuepfen und zeige ohne Umschweife die kumulativen Kurven fuer die Untergruppen mit den mittelvielen Links / Zitaten (UWL / UWZ):

Rein qualitativ wuerde ich daraus die folgenden Dinge vermuten bzgl. der Histogramme. Weil die beiden schwarzfarbigen Kurven beinahe aufeinander liegen, sollten die Histogramme fuer die Links in den wesentlichen Eigenschaften gleich sein fuer beide Untergruppen. Die rote Kurve schmiegt sich anfangs sehr an die beiden zuvor genannten Kurven an. Deswegen wuerde ich vermuten, dass auch das entsprechende Histogramm der Zitate der UML den vorherigen beiden Histogrammen aehnlich ist.
Bzgl. der Verteilung der Zitate der UMZ wuerde ich denken, dass diese „rechtslastig“ ist, im Vergleich zu den anderen drei Verteilungen, weil die kumulative Kurve erhøht ist. Aber genug der vielen Worte hier sind die Histogramme:

Ich bleibe bei einer qualitativen Diskussion der Ergebnisse und auf den ersten Blick scheint alles so zu sein wie oben vermutet. Der jeweils høchste schwarze und graue Balken sind an der gleichen Stelle und das Histogramm entwickelt sich auch aehnlich.
Der høchste rote Balken liegt nur um einen „Eimer“ daneben und entwickelt sich auch aehnlich. Das wuerde mich nicht wundern, wenn ein so geringfuegiger Unterschied im Histogramm bei den kumulativen Kurven keinen groszen Unterschied hinterlaeszt. Ob eine Seite nun 10 oder 20 neue Links sieht … vom Bauchgefuehl haut das schon hin.
Die grøszte Schwierigkeit scheint darin zu liegen zu erklaeren, warum die hellrote kumulative Kurve sich nicht auch an die anderen Kurven anschmiegt. Die Histogramme sehr doch aehnlich aus, ja der høchste Balken ist an der selben Stelle. Ich denke, dass die Erklaerung darin zu suchen ist, dass es keine hellroten Balken links von 20 Zitaten gibt, waehrend alle anderen Histogramme dort doch betraechliche Anteile haben (was die kumulativen Kurven entsprechend „runter zieht“).

Nun schrieb ich im letzten Satz das Wort „scheinbar“ nicht umsonst, denn die eigentliche Schwierigkeit sieht man erst beim genaueren hinschauen: auch wenn das Maximum des schwarzen und des grauen Histogramms an der selben Stelle ist, so sind die grauen Balken rechts davon doch ungefaehr immer doppelt so hoch wie die schwarzen Balken. Wenn man da mal drueber nachdenkt, dann sollte das doch zu einer høheren kumulativen (grauen) Kurve fuehren, … tut es aber augenscheinlich nicht.
Das bereitete mir erhebliches Kopfzerbrechen und ich musste von einer qualitativen Betrachtung zumindest zu einer teilweisen quantitativen Betrachtung uebergehen um die Erklaerung fuer das NICHTvorhandensein von etwas Erwartetem zu finden  … aber der Reihe nach.

Zunaechst verweise ich auf die beiden Diagramme vom letzten Mal und zur vereinfachten Diskussion beschraenke mich auf die Daten fuer die neuen Links (das Folgende ist aber analog bzgl. allem was mit der Linkfrequenz zusammen haengt).
Die kumulativen Kurven gehen etwas, aber nicht weit auseinander. Die Kurven sind aber definitiv nicht (beinahe) deckungsgleich wie hier. Bei den entsprechenden Histogrammen sieht man, dass es sehr viele (und hohe) grauen Balken rechts vom Ende der schwarzen Balken gibt. Genauer gesagt haben ca. 75 % aller Seiten der UMZ mehr Links als die Seiten der UML. Das ist betraechtlich.
Fuer die kumulativen Kurven zaehlt aber letztlich nicht nur der Unterschied in der Anzahl der Seiten, sondern das Produkt aus der Anzahl der Seiten in jedem „Eimer“ mit der Anzahl der Links fuer die dieser „Eimer“ steht. Oder anders: jede Seite im høchsten grauen Balken (Anzahl Links = 10 bis 20)  ist doppelt bis viermal so viel „wert“ wie die Seiten im letzten schwarzen Balken (Anzahl Links = 5).

Worauf ich hinaus will ist der Fakt, dass die Histogramme doch schon DEUTLICH unterschiedlich sind, es aber dennoch nur zu einem relativ geringen Abstand in den kumulativen Kurven fuehrt. Damit kann ich zurueck zur obigen Schwierigkeit gehen.
Ca. 65 % der Seiten der UMZ sind in den (grauen) Balken rechts vom Maximum des Histogramms „einsortiert“. Fuer die Seiten der UML liegt der Wert bei ca. 45 %. Das ist ein Unterschied von gerade Mal 20 %. Klar, 20 % ist schon nicht mehr wenig. Andererseits kommt der Name des „ca.-10-Prozent-Fehlers“ nicht von irgendwo her; alles was nur so wenig von den Erwartungen abweicht ist schwer vom „Rauschen“ zu unterscheiden … und 20 % ist gerade mal doppelt so grosz. Auszerdem kann man in der grauen kumulativen Kurve ja auch eine kleine „Erhøhung“ erkennen … nur eben nicht so deutlich wie im entsprechenden Diagramm vom letzten Mal.

Ich brauchte Stunden (und musste eine Nacht drueber schlafen) um darauf zu kommen … wobei ich viel Zeit damit verbracht habe erstmal nochmal alles auszurechnen und das entsprechende Programm auf Fehler zu ueberpruefen, weil ich dachte, ich hatte irgendwo einen gemacht. Aber so ist das nun Mal, wenn man nach Wissen strebt und es bereitet mir trotz des vielen Haare raufens grosze Freude :) .
Wieauchimmer, ich nehme aus den hier sehr kurz gehaltenen Betrachtungen mit, dass die Unterschiede in den Verteilung ziemlich grosz sein muessen, um wenigsten moderate „Spuren“ in den kumulativen Kurven zu hinterlassen.
Das ist aber auch gut so, denn dadurch wird meine Aussage, dass ein Unterschied von einem Balken nicht so viel ausmacht, direkt (oder indirekt … ach ich will da jetzt nicht drueber nachdenken) bestaetigt.

Ebenso ist das auch nicht gegenteilig zu dem was ich oben bzgl. der jeweils hellroten Balken / Kurve schon sagte. Bei der schwarzen und grauen Kurve liegen jeweils ca. 20 % der Seiten links vom høchsten Balken, waehrend es ueberhaupt gar keine hellroten Balken dort gibt. Die rosa Kurve wird also in keinster Weise von solchen „kleinteiligen“ Anteilen „herunter gezogen“. Hinzu kommt, dass bei genauer Betrachtung die hellrote kumulative Kurve anfangs ja dann doch gar nicht all zu weit weg ist von bspw. der schwarzen kumulativen Kurve. Qualitiativ wuerde ich sagen haut das alles hin und mein Bauchgefuehl sagt mir, dass die obige Erklaerung bzgl. des Nichtvorhandenseins eines groszen Unterschieds zwischen der grauen und der schwarzen kumulativen Kurve nicht geaendert werden muss.

Uff, jetzt ist das doch so viel geworden … naja … dann muss die Erklaerung fuer die groszen Intragruppenunterschiede der UVL und UVZ (welche diese Betrachtungen ja ueberhaupt erst herbeifuehrten) noch bis zum naechsten Mal warten.

Man kennt das ja, ein Diagramm wird gezeigt und irgendwer dem das nicht in’n Kram passt (oder der’s nicht versteht sich aber (pseudo) intellektuell geben will) sagt dann sowas wie „nur weil es auf dem Land mehr Størche gibt und auf dem Land mehr Kinder geboren werden, heiszt das nicht, dass Størche die Kinder bringen“ … oder „die Dinosaurier konnten nicht lesen und jetzt sind sie ausgestorben, das bedeutet aber nicht, dass sie ausgestorben sind, weil sie nicht lesen konnten“ … oder „der Wind weht kraeftiger, wenn die Windturbinen sich schneller drehen, das bedeutet aber nicht, dass Windturbinen Wind produzieren“ … oder „je mehr Eis am Strand verkauft wird umso mehr Menschen ertrinken, das bedeutet aber nicht, dass Eis dafuer verantwortlich ist, dass Leute ertrinken“ … usw. usf.

Und bei diesen Beispielen gebe ich den erwaehnten Personen sogar Recht … es sind aber alles reichlich bekloppte (wenn auch sehr illustrative, den Punkt der Kritik klar machende) Beispiele die mir in die Haende spielen bzgl. dessen, was ich mit diesem Beitrag ausdruecken will.

Zunaechst sollte ich sagen, dass es richtig und voll gut ist, dass Leute sich bewusst sind, dass man bei Diagrammen gut aufpassen muss. Leider werden (pseudo)wissenchafltiche Resultate oft genug derart verpackt, sodass sie authoritaer aussehen um damit Menschen ohne wissenschaftliche (Grund)Ausbildung (und oft genug auch solche mit; ich mag mich davon nicht ausnehmen) von bestimmten (meist falschen) Behauptungen zu ueberzeugen. Dagegen ist zurecht die Aussage cum hoc ergo propter hoc — Obacht! Scheinkausalitaet! — anzufuehren!

Was in den Faellen in denen die Kritik berechtigt ist fehlt, sind plausible (und ehrliche!) Modelle, die den behaupteten Zusammenhang erklaeren kønnten. In ernsthaften (und ehrlichen) wissenschaftlichen Publikationen wird so’n Quatsch aber gar nicht erst gezeigt, eben weil man kein plausibles Modell dafuer finden wuerde. Vielmehr werden Diagramme erst dann verøffentlicht, wenn andere, unabhaengige Variablen gefunden sind, die dann einen (modellabhaengigen) Kausalzusammenhang plausibel machen.
Das bedeutet NICHT, dass ein Modell welches die Daten plausibel erklaeren wuerde auch richtig ist. Und selbst wenn es das ist, so bedeutet das dennoch NICHT, dass ein einziges Diagramm ausreicht um die Richtigkeit zu beweisen. Aber ich will hier nicht abschweifen.

Worauf ich hinaus will ist, dass man, wenn man ein Diagramm sieht und ein Kausalzusammenhang behauptet wird, sehr oft erstmal davon ausgehen sollte, dass das so stimmt.
Es sei denn wenn man:
– ein besseres Modell hat, welches die Daten besser erklaeren wuerde (bspw. dass mehr Leute an heiszen Tagen Eis essen UND baden gehen, wenn aber mehr Leute baden gehen, dann ertrinken auch mehr Menschen),
– bessere Daten hat (bspw. Windmessungen in Gebieten ohne Windturbinen ODER ausgeschaltete Windturbinen bei all zu starkem Wind), oder
– ein Schwurbler die (zu kritisierende) Behauptung aufstellt … Schwurbler (Klimaspinner, Impfspinner, Scheisz-Nazis etc. pp.) benutzen aber leider oft genug richtige Daten, interpretieren die aber dann nur so, wie es denen in den Kram passt (haben also ein Modell, das nur in derem Weltbild richtig ist … was (schon wieder) eine gute Ueberleitung zu einer massiv Abschweifung waere).

Andererseits bin ich auch verwøhnt mit dem was ich aus der Physik kenne … ich hoffe aber, dass die Wissenschaftler bspw. in der Psychologie oder der Soziologie einem aehnlichen, wissenschaftlichen Ethos unterliegen … bzw. weisz ich, dass der Mechanismus der wissenschaftlichen Selbstkorrektur ueber laengere Zeitraeume ganz gut funktioniert (und davon ist die Physik (trotz i.A. guter Daten und Modelle) nicht ausgenommen).

… … …

Jetzt aergert’s mich, dass ich hier mehr bzgl. dessen schreibe was ich eigtl. kritisiere. Das liegt natuerlich daran, weil heutzutage so urst viel Quark behauptet wird und man bei Daten und Diagrammen aufpassen muss.
Deswegen schliesze ich so ab: die Person von ganz oben hat einen durchaus berechtigten Punkt; aber dieser muss natuerlich ebenso mit einer Begruendung (bspw. ein besseres Modell) untermauert werden, bevor der Warnung gefolgt und das urspruengliche Ergebniss verworfen wird.

In meiner Japanreiseberichterstattung schwoff ich in den letzten Beitraegen etwas ab, weil ich die Fetzigkeit des Landes nicht mit der oft gelesenen Aussage von Økonemen bzgl. Japans sogenannte(n) „verlorene(n) Dekade(n)“ in Einklang bringen konnte. Bisher konnte ich diesbezueglich eigtl. ganz gut zeigen, dass diese Aussage ziemlicher Quark ist, wenn man mal das Gesamtbild anschaut (und nicht nur, den Teilaspekt, wie reiche Leute noch schneller noch reicher werden kønnen).
Zwei Beitraege møchte ich noch bei dem Thema verweilen (bevor ich endlich wieder zur Reiseberichterstattung an sich zurueck kehren werde) und heute geht’s um die Produktivitaet; oder in lang (und all zu vereinfacht): dem Verhaeltniss der Menge aller produzierten Gueter zur Menge der dafuer benøtigten Arbeit

Diese Grøsze wird von Økonomen als super wichtig betrachtet … und von dem Wenigen das ich diesbezueglich weisz, gehe ich da (ausnahmsweise) mit. Mit dem Wissen wuerde ich bei der Phrase „verlorene(n) Dekade(n)“ denken, dass die Produktivitaet Japans in der Zeit nicht oder nur sehr schwach gewachsen, ja mglw. sogar schlechter geworden ist. Leider habe ich Daten dafuer erst ab Anfang den 90’er Jahren. Ich kann das also nicht mit dem Zustand davor vergleichen. Aber das deckt auf jeden Fall den in Frage kommenden Zeitraum ab und so sieht die Entwicklung dieser Grøsze aus („gemessen“ im Vergleich zum Oktober 2023):

Mhmmm … also mit Augen zudruecken (damit ich den kleinen Buckel nicht sehe) wuerde ich vielleicht sagen, dass die Produktivitaet Anfang der 90’er Jahre flach verlaeuft. Das waere interessant gewesen zu sehen, wie das vorher aussieht. Aber ab 1994 setzte dann ein (ueber) zehn Jahre anhaltendes Wachstum ein … was ja øhm … æhm … *Papierraschel* … mittendrin in den „verlorene(n) Dekade(n)“ liegt.

Der starke Einbruch folgt den Geschehnissen der Finanzkrise 2007-2008, aber die Produktivitaet erholt sich dann schnell bis 2009 wieder auf (beinahe) „Vorkrisenniveau“ um seitdem (relativ) stabil zu bleiben. Letzteres ist im vorherschenden Wirtschaftsparadigma des ewigen Wachstums tatsaechlich beunruhigend, denn da passiert im Wesentlichen nix nun schon seit 1 1/2 Dekaden. Andererseits ist das ja ohnehin eine offene Frage, ob das anhaltende Wachstum immer so weiter gehen muss … es ist definitiv KEINE offene Frage, ob das immer so weiter gehen kann, denn die Antwort darauf ist definitiv ein klares NEIN! … Es sei denn es kommt wieder eine coole, in massiver Breite anwendbare Technologie von dir wir heute noch gar nix ahnen (wie der elektrische Strom vor ueber 100 Jahren, oder (mit signifikant minderer „Staerke“) der (Personal)Computer vor noch nicht ganz 50 Jahren).

Aber ich schweife ab. Die flache Kurve seit der Finanzkrise wuerde irgendwie in die „erweiterte“ Phrase der „verlorenen Dekaden“ (Plural) fallen. Das wuerde allerdings weiterhin voraussetzen, dass das schon vorher nicht so lief wie es „sollte“. Die Daten zeigen aber wiederum, dass dem nicht nur nicht so war, sondern dass es sogar innerhalb des vorherschenden Wirtschaftsparadigmas echt knorke lief in Japan.
Bei der Produktivitaet sehe ich (aufgrund des Datenmangels) keine seit langem anhaltenden Trends. Aber die Trends die ich sehe sind mitnichten kurzfristig und sprechen auch hier wieder weitestgehend gegen das Gebrabbel der Økonomen.

So, damit kann das auch „eingetuetet“ werden.

Im selben Supermarkt von neulich (der mit der Sitzmøglichkeit) gibt es auch eine supertolle Einrichtung, die von jung und alt mit groszer Freude benutzt wird:

Das ist der Korbfahrstuhl aus dem Titel. Den Korb (mit Rollen dran) schiebe ich rein und der faehrt ganz von alleine auf Arbeitshøhe. Fetzt wa! Leider gibt’s den nur an einer Kasse. Aber wenn da nicht zu viele Menschen anstehen, dann warte ich gerne etwas laenger um den benutzen zu kønnen :) .

Manche (viele?) Dinge die urspruenglich fuer alte Leute erdacht wurden sind auch voll toll fuer nicht ganz so alte Menschen :) .

Die beim letzten Mal vorgestellte Messstation stand dann auf dem Kuechentisch und ich liesz die ohne weitere Umschweife ueber ein paar Tage laufen um zu schauen ob das ueberhaupt funktioniert. Alle drei Minuten wurde eine Messung gemacht und das Ergebniss …

… uebertraf alle meine Erwartungen.

Das Gesamtbild ist schnell erklaert. Die Partikeldichtemessungen sind die schwarze (PM10) und die rote (PM2.5) Kurve. „PM“ steht fuer „Particular Matter“ und die Zahl gibt die Grøsze der gemessenen Partikel an. Wie man sieht, kann der Sensor Partikel zweier unterschiedlicher „Klassen“ messen. Man kønnte „Grøsze“ sagen, aber die Messung findet nicht nur fuer Partikel genau einer definierten Grøsze statt, sondern vielmehr werden bei PM10 (PM2.5) alle Partikel mit Grøszen unter 10 µm (2.5 µm) gemessen.
Und das ist alles was ich dazu fand … was total unbefriedigend ist, denn weder weisz ich ob die PM2.5 Partikel bei PM10 mit drin, wo die unteren Messgrenzen liegen. Die Nachteile eines kommerziellen Instruments, denn das soll halt nur eine Zahl ausspucken, damit durchschnittliche Nutzer und Nutzerinnen nicht verwirrt sind.

Letztlich ist’s auch nicht zu wichtig, ich will ja nur wissen, ob die (Fein)Partikeldichte bestimmte Grenzwerte ueberschreitet und wann dem so ist. Im obigen Diagramm sieht man, dass die Grenzwerte (nach europaeischem Standard) fuer moderate Luftqualitaet zwei Mal ueberschritten werden.
Mehr sage ich dazu heute nicht und ich schaue mir die Partikelereignisse in den naechsten Eintraegen genauer an um deren Ursachen herauszufinden.

Die Temperaturkurve ist von dem was gemessen wurde selbsterklaerend (… nun ja … unter Vorbehalt … aber das gehørt hier nicht her). Im Groszen und Ganzen liegt die Temperatur um ca. 22 °C. Die Spitzen nach unten sind schnell aufgeklaert, denn das ist wenn ich’s Fenster zum Lueften aufgemacht habe. Auch dazu erstmal nichts weiter, aber auch hier gibt es ein paar Detail die erklaerungswuerdig sind.

Die relative Luftfeuchte wurde auch gemessen, aber wegen verschiedenen (technischen) Gruende liefern  diese Messungen keine zusaetzlichen Informationen (bestaetigt aber in vielen Faellen die Ueberlegungen und Schluesse).

Alles in allem sind die zu diskutierenden Details fuer sich genommen nix Neues. Ich fand das aber recht spannend, weil dabei so schøn zu sehen ist, wie komplex das „Klima“ einer Wohnung ist und wie sehr das mit allem Møglichem interagiert, von dem man aber normalerweise (fast) nix mitbekommt. Deswegen geh ich da ab dem naechsten Mal etwas ins Detail..

Beim letzten Mal zeigte ich (unzureichend vereinfachend und zusammenfassend), dass Seiten mit wenigen Links im Durchschnitt laenger brauchen um zu einer beliebigen anderen Wikipediaseite zu gelangen als Seiten mit vielen Links. Unter Beruecksichtigung der „umgedrehten Situation“ gilt i.A. das Gleiche fuer Seiten mit vielen Zitaten.
Dafuer hatte ich alle Wikipediaseiten (paarweise) in Untergruppen eingeteilt und mir das Verhalten eben jener genauer angeschaut. Besagtes Verhalten ist wie erwartet, zeigt aber kleinere Abweichungen (und mindestens eine grøszere) die ich beim letzten Mal erwaehnte aber nicht weiter untersuchte (oder erklaerte).
Ebenso liesz ich (mit Absicht) einen wichtigen Vergleich weg, denn ich zeigte nicht, inwiefern die Resultate fuer die beiden „Richtungen“, aus denen das Verhalten des kumulativen Anteils der neuen Links bzw. der Linkfrequenz betrachtet werden muss, uebereinstimmen. Ueber alle Seiten betrachtet sind die entsprechenden Kurven (beinahe) deckungslgleich (und sollten es auch sein) … zumindest fuer die fruehen Linklevel bei denen „Mehrfachsichtungen“ in der Linkfrequenz noch (sehr) selten vorkommen und eben diese damit fuer einen solchen Vergleich noch nicht unbrauchbar gemacht haben.

Beide Sachen hole ich heute und beim naechsten Mal nach. Ich teile das auf zwei Artikel auf, denn ich beschraenke mich fuer diesen Artikel nur auf die Resultate fuer die Untergruppen mit wenigen Links bzw. Zitaten. Dies deswegen, weil ich zur Diskussion der Unterschiede (mal wieder) Verteilungen heranziehen muss, diese aber nicht auf die uebliche Art und Weise darstellen kann. Damit es dadurch nicht zu Verwirrungen kommt muss das genau diskutiert. Das macht den heutigen Artikel recht land und deswegen trenne ich das auf.

Aber nun Butter bei die Fische! Der Vergleich der kumulativen Kurven fuer die beiden „Richtungen“ fuer die Untergruppen mit wenigen Links (UWL) und wenigen Zitaten (UWZ):

AHA! Im Gegensatz zu dem was ich oben schrieb bzgl. aller Seiten, sind die Kurven hier definitv nicht (beinahe) deckungsgleich; nicht mal bis LL3! Ist ja interessant und daraus folgt, dass zwei Unterschiede in den Kurven erklaert werden muessen: 1. der Intragruppenabstand zwischen zwei Kurven die zu einer „Richtung“ gehøren und 2. der Intergruppenabstand zwischen den Kurven der zwei verschiedenen „Richtungen“.

Dafuer muessen wir zurueck zu den Verteilungen der Links und  Zitate gehen. Natuerlich nicht fuer alle Seiten sondern nur fuer die, die sich in den beiden Untergruppen befinden.
Hier tut sich nun aber ein Problem auf mit Hinblick auf die Unterguppen mit den vielen Links / Zitaten. Diese enthalten naemlich nur wenige Seiten. Die entsprechenden Verteilung bspw. fuer die UVZ waeren dann nur 703 Striche die alle nur bis eins gehen. Auszerdem erfahren diese Striche auch noch „logarithmische Komprimierung“ und „verschmieren ineinander“.

Das ist zunaechst nix Schlimmes, denn fuer Histogramme fasst man oft ohnehin alle Messungen mit Werten (einer bestimmten Charakteristik, hier bspw. der Anzahl der Links) die nahe beisammen liegen in einem „Eimer“ zusammen. Alle „Eimer“ sind gleich grosz (bspw. 1 bis 5 Links, 6 bis 10 Links usw.)  und das Histogramm selber zaehlt fuer jeden Balken dann wie viele Messungen in dem „Eimer“ sind.
Die Wahl der Grøsze dieser „Eimer“ kann mitunter trickreich sein. Bisher brauchte ich das nicht machen, weil es so viele Wikipediaseiten gibt und die entsprechenden Verteilungen auch ohne „Eimer“ aussagekraeftig waren. Bei nur (bspw.) 703 Seiten ist dem aber nicht mehr so.

Die „Eimer“ løsen das erste Problem, die Balken der Verteilung wuerden bei gut gewaehlter „Eimergrøsze“ unterschiedlich grosz ausfallen. Nun ist es aber so, dass die Abzsisse fuer die Histogramme (wie so oft) logarithmisch ist. Wenn man nicht gerade gigantische „Eimergrøszen“ heran zieht, tritt also weiterhin das Problem der „logarithmischen Komprimierung“ auf. Ganz davon abgesehen, dass wenn „Eimer“ fuer hohe Grøszenordnungen gewaehlt werden (bspw. von 100-tausend bis 110-tausend) die gleiche „Eimergrøsze“ sich ueber mehrere Grøszenordnungen bei kleinen Werten erstreckt (in diesem Fall vier von 1 bis 10k).
Die von mir gewaehlte Løsung besteht darin, dass ich die Grøsze der Eimer davon abhaengig mache, in welcher Grøszenordnung sie sich auf der Abzisse befinden. Ich nenne das „magnitudal bins“ oder „Grøszenordnungseimer“.

Das hørt sich vermutlich komplizierter an, als es ist. Kurzgesagt teile ich jede Grøszenordnung (also von 0 … 9, 10 … 99, 100 … 999 usw.) auf der Abzsisse in neun, jeweils gleich grosze „Eimer“  ein. In der ersten Grøszenordnung „fallen“ die Seiten in jeden „Eimer“ wie gehabt. In der zweiten Grøszenordnung „fallen“ in den ersten „Eimer“ alle Seiten die zehn oder mehr Links / Zitate haben, aber weniger als 20. Der zweite „Eimer“ ist entsprechend fuer alle Seiten mit 20 bis 29 Links / Zitaten und der neunte fuer alle Seiten mit 90 bis 99 Links / Zitate. Bei 100 erfolgt der Uebergang zur naechsten Grøszenordnung und der entsprechende erste „Eimer“ ist nun zehn Mal so grosz — also eine Grøszenordnung mehr — (denn dieser enthaelt alle Seiten mit 100 bis 199 Links / Zitaten).

Das løst alle Probleme fuehrt aber zu einer kleinen Verkomplizierung, die man im Hinterkopf behalten muss. Beim Uebergang von einer Grøszenordnung zur naechsten wachsen die Balken des Histogramms pløtzlich sprunghaft an. Der Grund liegt natuerlich darin, weil in besagten Balken pløtzlich zehn Mal mehr Seiten stecken als noch einen „Schritt“ vorher. Gedanklich muss man die Balken an solchen Grenzen also entsprechend verkleinern.
Im hiesigen Zusammenhang spielt das keine all zu grosze Rolle, denn es reicht zu sehen, ob eine Untergruppe mehr Seiten links (oder rechts) vom „Maximum“ der Verteilung der anderen Untergruppe hat. Letzteres ist auch der Grund, weswegen ich die Histogramme normiere.

Genug geredet, hier sind sie, die Verteilungen der Links und Zitate der UWL und UWZ:

Fetzt wa! Bei den grauen Balken (Verteilung der Links der UWZ) sieht man beim Wert 10 auf der Abzsisse deutlich das Phaenomen, was man im Hinterkopf behalten muss. Nicht ganz so deutlich sieht man es auch an dem entsprechenden roten Balken (Verteilung der Zitate der UWL). Aber eigentlich will ich damit ja die Intra- und Intergruppenabstaende erklaeren. Darum der Reihe nach.
Ach so, ich hab die Abzsisse bei 1000 abgeschnitten. Danach gibt es zwar noch ein paar Balken, die sind aber so klein, dass sie vøllig irrelevant sind.

Zunaechst der Intragruppenabstand. Die Kurve fuer den kumulativen Anteil der neuen Links der UWZ (schwarz) liegt unter der Kurve fuer die UWL (hellschwarz … vulgo: grau). Das geht natuerlich nur, wenn die Seiten in der UWZ mehr (neue) Links sehen als die Seiten in der UWL. An den Histogrammen sehen wir, dass dem tatsaechlich so ist.
Ist ja auch eigentlich auch ganz klar, denn die Seiten der UWL wurden deswegen in die UWL einsortiert, weil diese 5 Links oder weniger hatten. Deswegen gibt es im Histogramm keine schwarzen Balken bei Werten mit 6 oder mehr auf der Abzsisse.
Das spielte aber bei den Seiten in der UWZ ueberhaupt keine Rolle, denn diese wurden nach der Anzahl der Zitate (0 bis 3) ausgesucht. Deswegen sind die grauen Balken ueberall zu finden und das ist entscheidend fuer den Intragruppenabstand.

Weil die UWZ Seiten (als Ensemble) signifikant viel mehr Seiten schon „ab Start“ (also LL0) sehen (das ist was obiges Histogramm u.a. aussagt), verzweigt das Linknetzwerk auf kleinen Linkleveln schneller und somit ist die kumulative Kurve bzgl. der neuen Links der UWZ ueber der entsprechenden Kurve der UWL. Das macht auch nix, dass die beiden Untergruppen unterschiedlich viele Seiten enthalten, denn die kumulativen Kurven sind ja „normiert“.

Beim Intergruppenabstandes der kumulativen Kurven bzgl. der Linkfrequenz (die rote / hellrote Kurve(n)) geht die Argumentation genau so. Die Seiten der UWZ wurden danach ausgewaehlt, dass sie 3 oder weniger Links haben (deswegen keine rosa Balken rechts davon). Fuer die Seiten der UWL war das aber kein Kriterium und im Histogramm sehen wir an den roten Balken, dass diese von mehr Seiten gesehen werden, weswegen die entsprechende kumulative Kurve der UWL høher liegt als die der UWZ.

Nun zum Intergruppenabstand. Dafuer betrachte ich nur die hellrote und die graue Kurve (eigtl. muessten alle vier Kombinationen von (hell)rot zu (hell)schwarz untersucht werden, aber das ist immer das selbe Prinzip und gibt keinen weiteren Erkenntnissgewinn).

Die hellrote Kurve entsteht dadurch, dass die Seiten der UWZ (neue) Links sehen. Die graue Kurve entsteht dadurch, dass die Seiten der UWZ von anderen Seiten zitiert werden. Im Histogramm muessen fuer den Intergruppenabstand also die Balken der Links und der Zitate der UWZ verglichen werden. Man sieht nun, dass die UWZ sehr viele graue Balken rechts von den hellroten Balken hat. Die weitere Argumentation ist dann wie Oben.

Fuer die schwarze und rote kumulative Kurve(n) ist die Argumentation qualitativ die selbe. Quantitativ muss man aber im Histogramm etwas genauer hinschauen, denn die roten Balken erstrecken sich auch rechts von den schwarzen Balken (obwohl die schwarze Kurve ueber der roten liegt). In diesem Fall sieht man aber, dass der grøszte rote Balken definitiv links vom grøszten schwarzen Balken liegt und die roten Balken rechts vom letzten schwarzen Balken sind nicht sehr hoch. All das bedeutet, dass im Durchschnitt die Seiten der UWL NICHT von mehr Seiten gesehen werden als sie (neue) Links haben. Die zwei høchsten roten Balken sagen aus, dass die meisten Seiten nur ein bzw. zwei  Mal zitiert werden, waehrend die zwei høchsten schwarzen Balken aussagen, dass viele (mglw. gar die allermeisten) der selben Seiten mindestens vier oder fuenf Links haben. Die wenigen Seiten mit mehr als fuenf Zitaten spielen da dann auch keine Rolle mehr.

Jut … das soll reichen hierzu. Beim naechsten Mal das Gleiche fuer die anderen beiden Untergruppen und mit der ganzen Vorrede hier kann ich die Diskussion dort kuerzer halten :)

Vor einiger Zeit schrieb ich einen Artikel darueber, wie das beruehmte Milgram Experiment eigentlich zu interpretieren ist. Zur Erinnerung: es belegt NICHT das „inhaerent Bøse“ in jedem Menschen, sondern vielmehr, dass Menschen etablierten Autoritaeten folgen. In dem dazugehørigen wissenschaftlichen Artikel geht es auch im das beruehmte Stanford Prison Experiment. Da die Schlussfolerungen die gleichen (mich duenkt gar die selben) sind, ging ich darauf nicht weiter ein.

Nun stolperte ich vor Kurzem aber ueber den Artikel „Debunking the Stanford Prison Experiment“ von Thibault Le Texier in American Psychologist, 74(7), 2019, p. 823–839 … (hier in vollstaendig (PDF)). Dort legt der Autor dar, warum das gesamte Experiment mindestens wissenschaftlich fragwuerdig ist und mitnichten den hohen Stellenwert haben sollte den es sowohl in der Psychologie als auch in allgemeineren, gesellschaftlichen Kontexten hat.

Die ethischen Bedenken sind praktisch von Anfang an diskutiert worden.
Mir bisher nicht bekannt, wurde bereits 1975 bemaengelt, dass aus den Instruktionen an die Teilnehmenden vor dem eigentlichen Experiment, Letztere mit groszer Sicherheit erraten konnten, wie sie sich zu verhalten haben. Das fand man heraus, indem man Studenten besagte Instruktionen zu lesen gab (ohne weiteren Kontext) und diese sollten dann beschreiben, wie die Waechter bzw. Gefangenen sich zu verhalten haben:

[o]f the students tested, 81% accurately figured out […] that guards would be aggressive and that prisoners would revolt or comply […].

Das kann also definitiv NICHT mal als einfache Blindstudie angesehen werden.

Spaeter hinzu kamen Hinweise, dass die Teilnehmer vermutlich selbstselektiert waren (mit dem ganzen Rattenschwanz an Problemen fuer insb. psychologische Studien der daraus folgt). Ebenso nahm der Professor (namens Zimbardo, der natuerlich mit dem Experiment beruehmt wurde) die Rolle des Gefaengnisvorstehers (anstatt des auszenstehenden, neutralen Beobachters) an. Diesen Fakt liesz er aber wohl unter den Tisch fallen bei der Praesentation der Ergebnisse.

Der Verfasser des obigen Artikels hat sich nun durch die Originaldaten gearbeitet und weitere Hinweise darauf gefunden, dass dieses Experiment NICHT in die Psychologiebuecher gehørt sondern in die Geschichtsbuecher unter dem Stichpunkt „schlechte Wissenschaft“.
So zum Beispiel erzaehlten der Professor und seine Assistenten …

[…] the objectives of the experiment to the guards during their orientation day […].

Ebenso haben die Waechter die schlimme soziale Situation nicht spontan selbst „gebaut“ sondern …

[…] were given clear instructions for how to create it.

Im (verallgemeinerten) Sinne dessen was ich in meinem Artikel zum Milgram Experiment schrieb (Akzeptanz von Autoritaeten) ist die verherrschende Interpretation der Ergebnisse sehr sehr fragwuerdig, wenn man in Betracht zieht, dass …

[i]n order to get their full participation, Zimbardo intended to make the guards believe that they were his research assistants.

Aber nicht nur die Waechter wurden fuer ihre Rolle „praepariert“. Auch …

[t] he Prisoners were Conditioned by the Experimenters.

Und waehrend Zimbardo immer wieder behauptete, dass die Bedingungen urst realistisch waren (Zitate von ihm) …

[b]y the end of the week, the experiment had become a reality. […]

[I]n a very short time most of the subjects ceased distinguishing between their prison role and prior self-identities. […]

Findet der Autor des Artikels in den Rohdaten, dass …

[…] on the contrary, […] the participants almost never lost touch with reality and were conscious of participating in an experiment.

Da wundert es mich ueberhaupt nicht, dass Zimbardo sehr gerne mit den nicht-wissenschaftlichen Medien sprach war und die Schlussfolgerungen im Wesentlichen schon vor dem Ende des Experiments fertig geschrieben (und auf nichtakademische Ziele; Gefaengnisreform) gerichtet waren:

The press release that Zimbardo disseminated on the second [!] day of the experiment states in conclusion that it aimed at making us aware of the prison reforms needed […].

Und um die Liste voll zu machen wird auch noch Zimbardos Behauptung, dass die Resultate auf …

[…] systematic record keeping and data collection […]

beruhen zunichte gemacht. Der Autor fand vielmehr, dass die Daten …

[…] are neither complete nor uniform.

So fehlen Aufzeichnungen jeglicher Art (egal ob vom Professor selbst oder von seinen Assistenten) vom dritten Tag und von den 150 Stunden die das Experiment lief, gibt es weniger als 10 % auf Video- oder Tonaufnahmen. Und

[…] these 6 hr of video recorded during the experiment are unrepresentative […].

Das soll reichen. Alles in allem ist meine Interpretation, dass das Stanford Prison Experiment nicht nur fragwuerdig, sondern wissenschaftliche gesehen nutzlos, gar absichtlich irrefuehrend ist. Weil das aber so weit weg geht von der etablierten Meinung bin ich mehr als offen die Gegenargumente zu høren.
Hier gibt es wohl einige Gegenargumente von Zimbardo zu obigem Artikel. Leider habe ich darauf keinen Zugriff (und meine uebliche Quelle hat das leider auch nicht). Es gibt eine aeltere Version (PDF) die nicht direkt auf Le Texier eingeht (da vorher erschienen), aber einige der Punkte anspricht.
Le Texier gibt hier eine relativ bissige Antwort. Ich gebe zu, dass die nicht dem wissenschaftlichen Umgangston entspricht (weswegen das wohl auch nie offiziell in einem peer review Journal verøffentlicht wurde). Ich gehe aber nach dem was ich gelesen habe mit seiner Meinung mit, dass Zimbardo nur drumherum redet und die eigentlichen (wesentlichen!) wissenschafltichen Maengel nicht schafft auszuraeumen.

Der Artikel von Le Texier ist jetzt nur ein Artikel, scheint aber in einen grøszeren Zusammenhang zu fallen, in dem die Ergebnisse solcher (falschen!) Leuchtturmexperiment neu betrachtet und vøllig anders interpretiert werden. Es wird also nur noch ein paar Jahrzehnte dauern, bis sowohl das Milgram Experiment, als auch das Stanford Prison Experiment ihren verdienten Platz im wissenschaftlichen Kanon einnehmen … naemlich als Datenpunkte in der Sektion „(langsame) Selbstkorrektur der Wissenschaft“.

Eine ganz andere Sache noch zum Abschluss, weil mir das am Herzen liegt:

[…] the [Stanford Prison Experiment] survived for almost 50 years [among other things] because no researcher has been through its archives. This was, I must say, one of the most puzzling facts that I discovered during my investigation.

Das wundert mich ehrlich gesagt ueberhaupt nicht. Es ist viel „sexier“ neue Behauptungen raus zu hauen als sich alte Sachen mal genau anzuschauen. Insb. dann, wenn es um scheinbar vom ganzen wissenschaftlichen Feld etablierte Fakten geht.
Das ist in der Wissenschaft nicht anders als auszerhalb davon. Unter anderem auch deswegen lese ich Originalartikel und will ab und zu auch gerne die Rohdaten haben um die selbst zu analysieren. Weswegen mein Plan fuer die Rente ja auch ist, dass ich versuche werde in den Archiven von Museen zu forschen :)  … aber das war’s nun wirklich fuer heute.

Neulich stolperte ich ueber den sehr interessanten und ueberraschend spannend zu lesenden Artikel „Israel’s 1979 Nuclear Test and the U.S. Cover-Up“ von Leonard Weiss in Middle East Policy 18(4), 2011, pp. 83–95 … *hust* … *doppelhust*.
In kurz: darin geht es darum, wie der Vela-Zwischenfall „gehandhabt“ wurde. Aber der Reihe nach.

Besagter Zwischenfall kam durch ein Signal zustande welches verdaechtig (aber nicht eindeutig) nach einem Atomtest aussah. Die Nichteindeutigkeit ruehrte daher, dass die zwei, auf dem Satelliten nahe beieinander liegenden Sensoren deutlich unterschiedliche Signalkurven registrierten. Die plausible Annahme ist, dass der eine Sensor kaputt war. Andere Quellen (bspw. radioaktive Rueckstaende, andere Satellitenmessungen) fanden (zum Teil) nix was weiter zur Uneindeutigkeit beitrug (wobei der Konsens millterweile aber wohl ist, dass es sich dabei tatsaechlich um eine Atomexplosion handelte).

Der Zwischenfall erregt zum Teil noch heute die Gemueter, aber damals war das eine urst krasse Sache denn zum Einen waren die SALT II (Strategic Arms Limitation Talks) gerade zum Abschluss gekommen und zum anderen deutete alles auf einen Atomtest der Israelis hin. Ersteres war wichtig, denn Jimmy Carter baute seinen Wahlkampf unter anderem um die Nichtverbreitung und Abruestung von Kernwaffen auf … was nur funktioniert, wenn man „die Anderen“ kontrollieren kann und uneindeutige Signale sind nicht gerade førderlich um einen Eindruck zu erwecken, dass man das kønnte. Zweiteres war wichtig, denn … nun ja, die USA haben aus den verschiedensten (und im „intern System“ durchaus logischen und wichtigen) Gruenden lange Jahrzehnte hindurch die Politik gefahren, dass sie Israels Bombe nicht offiziell anerkennen … mich duenkt, dass sie bis heute so tun als ob sie von nichts wuessten.
Allerdings konnte das Alles nicht unter den Teppich gekehrt werden, weswegen eine offizielle Alternative zu den Geschehnissen her musste … das „Cover-Up“ im Titel des Artikels.

Auf all das geht der Artikel ein und ich haette mir durchaus gewuenscht mehr Details zu den vielen „Akten des Dramas“ zu erfahren. Leider darf so ein Artikel nicht all zu lang werden und trotz der Kuerze die dem Autor zur Verfuegung stand und der ziemlichen „Trockenheit“ des Themas hat dieser eine echt gute Arbeit abgeliefert, die sich durchaus lohnt zu lesen.

Ach ja #1, woher kommt der Titel dieses Beitrags? Das ist einfach zu erklaeren, denn ein Bhangmeter ist ein Spezialmessgeraet, mit dem man normale Lichtblitze (bspw. durch Reflexionen an Weltraumschrott) von solchen durch Atomexplosionen unterscheiden kann. Ich hatte vorher noch nie was davon gehørt (warum auch) und fand den Namen … nun ja … ich sag jetzt mal passend.

Ach ja #2, Ironie der Geschichte: am Ende von SALT II stand ein Vertrag der von beiden Parteien niemals unterschrieben wurde. Die Amerikaner taten es nicht wg. des Angriffs der Sowjetunion auf Afghanistan und entsprechend unterzeichneten die Russen den Vertrag auch nicht. Beide Parteien hielten sich dennoch an die waehrend der Gespraeche gemachten Absprachen. Es dauerte mehr als ein weiteres Jahrzehnt, bis endlich 1991 START I (Strategic Arms Reduction Treaty) ganz offiziell unterzeichnet wurde.

Die Frage „wie vielen Links muss eine Wikipediaseite im Durchschnitt folgen um eine andere Wikipediaseite zu sehen“ wurde sowohl von der einen Richtung (ausgehend von einer Seite), als auch von der anderen Richtung (kommend von anderen Seiten) beantwortet. Beide Ergebnisse stimmen ueber alle Wikipediaseiten gesehen ueberein (zumindest so lange, wie „Mehrfachsichtungen“ die Linkfrequenz nicht zu sehr dominieren).
Andererseits wissen wir, dass nicht alle Seiten gleich sind und es stellt sich dann die Frage, ob Seiten mit vielen Links (oder Zitaten) frueher beliebige andere Seiten sehen (von anderen Seiten gesehen werden), als Seiten mit wenigen Links (oder Zitaten). Rein logisch und auch intuitiv wuerde ich das mit Ja beantworten. Das will ich aber in den Daten sehen und deswegen arbeitete ich beim letzten Mal aus, wie bspw. „wenige Links“ oder „mittelviele Zitate“ objektiv zu interpretieren sind. Die entsprechenden Seiten wurden in die sechs Untergruppen UWL, UWZ, UML, UMZ, UVL und UMZ zusammengefasst.

In den Abkuerzungen steht das „U“ fuer „Untergruppe“, „W“, „M“ und „V“ fuer „wenige“, „mittelviele“ und „viele“ und „L“ und „Z“ ensprechend fuer „Links“ und „Zitate“. Das ist leicht verstaendlich; dennoch gebe ich zwei Beispiele, denn ich werde ab sofort nur noch diese Abkuerzungen verwenden.
Die Seiten in der „UWL“ kennzeichnen sich alle dadurch aus, dass sie … in der Tabelle vom letzten Mal nachschau … null bis maximal 5 … also Wenige, Links zu anderen Seiten haben. Wieviele Zitate die Seiten in der UWL haben ist aber NICHT festgelegt (das wird an spaeterer Stelle uebrigens nochmal wichtig).
Die Seiten in der „UMZ“ kennzeichnen sich alle dadurch aus, dass sie 20 bis maximal 1000, also Mittelviele, Zitate zu anderen Seiten haben. Wieviele Links die Seiten in der UMZ haben ist NICHT festgelegt.

Nach der Vorrede kann ich ohne weitere Abschwiffe gleich das erste Ergebniss zeigen. Dieses Diagramm zeigt, wie schnell die Seiten in den Untergruppen beliebige (!) andere Seiten (also auch die der eigenen Gruppe) sehen (die Linien dienen wieder nur der besseren Visualisierungen, denn es gibt keine gebrochenen Linklevel):

Die Kurven beginnen natuerlich bei LL0 und gehen deutlich weiter als bis LL6. Von Interesse ist aber nur der Punkt, an dem die Seiten in den Untergruppen (als (Untergruppen)Ensemble gesehen) im Durchschnitt die Haelfte aller Seiten gesehen haben. Zur Erinnerung: wenn man alle Seiten zusammen betrachtet, lag dieser Uebergang zwischen dem 3. und 4. Linklevel (aber etwas naeher an LL3 als an LL4).
Es gibt natuerlich kein „zwischen“ zwei Linkleveln. Das ist so zu verstehen, dass im Durchschnitt bis LL3 die meisten Seiten noch NICHT 50 % aller anderen Seiten gesehen haben, waehrend auf LL4 die meisten Seiten (im Durchschnitt) sehr wohl 50 % aller anderen Seiten gesehen haben.
„Naeher an LL3“ ist so zu verstehen wie der Ordinatenwert fuer diese Stelle ist: bis dahin wurden (im Durchschnitt) fast 40 % aller anderen Seiten schon gesehen. Es sollten also bereits merkbar viele Seiten auftreten (aber noch nicht die Mehrzahl), bei denen (im uebetragenen Sinne) bereits ein Muenzwurf ausreicht um zu entscheiden ob (im Durchschnitt) eine beliebige andere Seiten gesehen wurde oder nicht. Waehrend die ueber 80 % auf LL4 bedeuten, dass das Ensemble aller Seiten diesbezueglich einen riesigen Schritt gemacht hat und nun die Mehrzahl der Seiten (im Durchschnitt) vier von fuenf beliebigen andere Seiten gesehen hat.

Hier nun sehen wir zwei wichtige Dinge:
1.: die Ergebnisse fuer die Gruppen (wenige, mittelviele, viele Links / Zitate) unterscheiden sich wie erwartet; Seiten mit mehr Links sehen eine beliebige andere Seite eher als Seiten mit weniger Links. Das war erwartet (siehe oben). Dennoch freut es mich, dass die Unterschiede so deutlich sind … ich waere etwas ratlos gewesen, wenn dem nicht so gewesen waere.
2.: die Ergebnisse fuer die der paarweisen Untergruppen liegen nahe genug beisammen, sodass ich das als „das ist innerhalb des Fehlers gleich“ betrachten, und zunaechst nicht auseinanderklamuesern muss. Man sieht zwischen den paarweisen Untergruppen kleine Unterschiede (am grøszten sind die fuer die zwei Gruppen mit den wenigen Links / Zitaten), aber darauf gehe ich an anderer Stelle ein.

Prima! Nun andersrum: wie schnell werden die Seiten der Untergruppen von anderen Seiten gesehen:

Im linken Diagramm zunaechst eine „grøbere“ Uebersicht um zu zeigen, dass die Untergruppen bzgl. des kumulativen Anteils jeweils høhere „Schlussprozente“ erreichen. Zur Erinnerung: ueber alle Seiten gesehen wird im Durchschnitt ueber das gesamte Linknetzwerk aller Seiten jede Seite fast 2 1/2 Mal von jeder anderen Seite gesehen.
Fuer die Untergruppen war zu erwarten, dass die nach der Anzahl der (von anderen Seiten erhaltenen) Zitate sortierten Gruppen auch entsprechend høhere Schlussprozente haben. Ist ja logisch, eine Seite die nur ein Mal zitiert wird, wird letztlich auch nur ein Mal von allen anderen Seiten gesehen (wenn auch vermutlich auf unterschiedlichen Linkleveln). Eine Seite die 1000 Zitate von anderen Seiten erhaelt hat hingegen eine (hohe) Chance im Linknetzwerk einer Urpsrungsseite mehrfach aufzutreten und wird somit mehrfach von jeder (Ursprungs)Seite gesehen. Dieses Phaenomen spiegelt sich in den „Schlussplateaus“ der hellfarbigen Kurven im linken Diagramm wider.

Das gleiche Verhalten ist ebenso im Durchschnitt der Untergruppen zu erwarten, die nach der Anzahl der Links sortiert wurden. Zur Erinnerung: (im Durchschnitt!) gibt es (wie wir seit langem wissen) einen Zusammenhang zwischen der Anzahl der Links und der Anzahl der Zitate, welche mittels eines maechtigen Gesetzes mit positivem Exponenten beschrieben werden kann. Das bestaetigt sich in der (normal) roten und (normal) blauen Kurve.
Fuer die (normal) lila Kurve, also die Seiten der UVL, gilt dies jedoch nicht. Das ist ein wichtiger Unterschied und ich komme darauf an anderer Stelle zurueck.

Im rechten Diagramm zeige ich den hier und heute interessanten Bereich von Nahem. Von den Ergebnissen fuer die UVL abgesehen gilt i.A. das Gleiche was ich bzgl. den Ergebnissen zum kumulativen Anteil der neuen Links sagte. Die Unterschiede sind deutlich zu sehen und verhalten sich wie erwartet. Paarweise gesehen sind die Kurven fuer die UWL / UWZ bzw. UML / UMZ zwar nicht so schøn beisammen wie beim kumulativen Anteil der neuen Links aber hier und heute sind mir die Diskrepanzen klein enug genug um das innerhalb des Fehlers als das Gleiche zu betrachten. Letzteres gilt wie gesagt fuer die UVL und UVZ nicht.

Somit ist fuer heute festzuhalten: Seiten die bestimmten Untergruppen zuzuordnen sind, verhalten sich anders und die Andersartigkeit ist i.A. wie erwartet.
Nichtsdestotrotz gibt es unerwartete Unterschiede die erklaert gehøren. Das dauerte eine Weile bis ich die Erklaerung beisammen hatte und ist das was ich in diesem Beitrag schon mehrfach andeutete. Mehr dazu beim naechsten Mal.

Als ich die sog. „verlorene(n) Dekade(n)“ das erste Mal erwaehnte, zeigte ich Bilder von øffentlich zugaenglicher Infrastruktur und meinte, dass das fuer mich alles nach 30 Jahren (mehr oder weniger) normaler Entwicklung aussieht.

Infrastruktur muss aber auch gebaut werden und das Geld dafuer muss irgendwo herkommen. Letzteres sind die Gewinne privater Firmen oder Steuern … oder Kredite … mhmmmmm … Japan ist seit Jahrzehnten und mit weitem Abstand der Staat mit der grøszten Verschuldung der Welt (noch vor Griechenland) … und gerade die Leute in Dtschl. haben ja fast schon ’nen Fetisch diesbezueglich … andererseits habe ich nicht den Eindruck, dass die Glaeubiger (wer auch immer das ist) kein Vertrauen mehr in Japan haben was (nach herrschendem økonomischen Dogma) ganz schlecht waere (siehe Griechenland) … und die USA haben auch eine sehr hohe Staatsverschuldung … der Kosovo oder die (sog.) Demokratische Republik Kongo hingegen nicht … mhmmmm … also im Groben wird diese Kenngrøsze schon wichtig und richtig sein, aber im spezifischen muss man wohl genauer hinschauen … … …

OI, da bin ich aber abgeschwiffen … ich wollte darauf hinaus, dass Infrastruktur bezahlt werden muss und das Geld dafuer kommt i.A. aus dem von Arbeitern produzierten Mehrwert. Oder anders: „verlorene Dekade“ verbinde ich mit hoher Arbeitslosigkeit, weil weniger Arbeitsplaetze da sind, weswegen nix produziert wird und dadurch kein Geld fuer Infrastruktur vorhanden ist. Die Bilder im verlinkten voherigen Beitrag sprechen dagegen und bei der Betrachtung der Arbeits“losigkeit“ stellte sich heraus, dass sich dort ein langanhaltender Trend findet, der nix mit (einer oder mehreren) „verlorene(n) Dekade(n)“ zu tun hat.

Zwei andere Messgrøszen bzgl. des Vorhandenseins von Arbeit sind die offenen Arbeitsstellen und die offenen Stellen pro Bewerber; beide sind in diesem Diagramm dargestellt:

Im Wesentlichen sieht man bei den offenen Arbeitsstellen den gleichen, in den 70’er Jahren gestarteten, langanhaltenden Trend wie bei der Arbeitslosigkeit und die Stellen pro Bewerber sind seit den 70’er Jahren bis ungefaehr 2010 konstant bei einem Wert von ca. 0.7 .
Oder anders: auch hier ist wieder nix von einer „verlorenen Dekade“ (und schon gar nichts von mehreren) zu sehen.

Mglw. aendert sich das generelle Verhalten der roten Kurve ab 2010. Das ist in den groszen Schwankungen schwer auszumachen, weil noch nicht genug Zeit vergangen ist.
Sollte das eine tatsaechliche Aenderung im verherrschenden Trend sein, so faellt diese mit dem bereits mehrfach angesprochenen demografischen Wandel in Japan zusammen. Deswegen wuerde es mich nicht wundern, wenn die rote Kurve eine Weile grøszere Werte annimmt. Alte Leute konsumieren schlieszlich nicht weniger als vorher; wenn aber nicht so viele junge Leute nachkommen um die frei werdenden Stellen zu besetzen, nimmt das Verhaeltnis der Stellen pro Bewerbung zu.
Aber auch das hat natuerlich nix mit dem Gebrabbel der Økonomen zu tun … wobei ich annehme hoffe annehme, dass das nur solche Økonomen brabbeln, die Karl Marx so ganz vortrefflich als „Vulgaerøkonomen“ bezeichnete … aber das ist ein ganz anderes Thema.