Archive for Januar, 2025

Wie bereits beim vorletzten Mal versprochen (und dann aus organisatorischen und didaktischen Gruenden einmal verschoben), gehe ich heute auf die zweite Art der Komprimierung ein.

Anders als bei der vorher behandelten Bedeutungskomprimierung, ist die Wertekomprimierung sehr einfach zu verstehen. Hierbei schaut man naemlich nur auf den Gesamtinhalt einer Spalte (oder Zeile) und setzt den ins Verhaeltniss zum Inhalt der gesamten Matrix. Im weiteren spreche ich nur von Spalten, aber wie vormals gilt das Gleiche auch fuer die Zeilen (mutatis mutandis … und ja, ich such nach Gelegenheiten diesen Ausdruck so oft wie møglich zu verwenden … ich find den so fein).

Der Inhalt der gesamten Matrix ist die Summe ueber alle (Gesamt)Spalteninhalte. Oder anders: das ist die Summe aller Zitate die alle Seiten haben … was natuerlich der Summe aller Links aller Seiten entspricht … was natuerlich der Summe ueber alle (Gesamt)Zeileninhalte ist … was natuerlich bedeutet, dass diese Zahl komplett unabhangig von den Achsenbedeutungen ist und dieser eine Wert sowohl fuer die Spalten- als auch die Zeilenkomprimierung zu benutzen ist.

Der Gesamtinhalt einer Spalte ist die Summe ueber alle Zellen der gegebenen Spalte. Es ist zu beachten, dass diese Werte davon abhaengig sind, welche Bedeutung die Abzsisse und Ordinate haben, obwohl es sich hierbei NICHT um eine Bedeutungkomprimierung handelt. Ich gehe darauf weiter unten etwas genauer ein.
Fuer jede Spalte wird dann der Anteil berechnet, den diese am Inhalt der gesamten Matrix hat und dieser Wert wird dann wie bei der Bedeutungskomprimierung herangezogen um zu ermitteln, wie wieviele Spalten aufaddiert werden muessen, um den festgelegten Komprimierungswert zu erreichen.

Insgesamt hat man also vier verschiedene Komprimierungen fuer die Spalten und Zeilen. Wenn die Abzsisse die Anzahl der Zitate (die eine Seite erhalten hat) repraesentiert, dann ist der Gesamtinhalt einer gegebenen Spalte unabhaengig davon, ob die Ordinate das Selbe repraesentiert, oder die Anzahl der Links einer Seite. Es gibt also nur zwei unterschiedliche Komprimierungen fuer die Spalten, entsprechend den zwei møglichen Bedeutungen; nennen wir diese hier mal kurz A und B. Das Gleiche gilt natuerlich fuer die Zeilen und diese zwei Komprimierungen nenn ich mal kurz 1 und 2. Beides kombiniert ergibt am Ende vier Falschfarbenbilder, mit den Komprimierungskombinationen A1, A2, B1 und B2.

Hier muss ich etwas weiter ausholen, denn auf den ersten Blick scheint das wie bei der Bedeutungskomprimierung zu sein; dort gab es auch vier Falschfarbenbilderkomprimierungskombinationen. Der wichtige Unterschied ist aber, dass die Bedeutungskomprimierung nur fuer eine Achse ausgerechnet werden muss und dann auch fuer die andere Achse gilt (so diese dann die selbe Bedeutung hat). Bei der Wertekomprimierung gilt das nicht und kurz gesagt liegt das daran, dass die Seiten auf der Abzsisse von den Seiten auf der Ordinate zitiert werden.
Oder anders: bei der Bedeutungskomprimierung hat man nur zwei Komprimierungen (A & 1) und die Kombinationen waeren AA, A1, 1A und 11. Es ist zu beachten, dass es bei der Wertekomprimierung KEINE AA-, BB-, 11-, oder 22-Komprimierungskombinationen gibt.

Ein Beispiel macht das hoffenlich anschaulicher. Man denke sich eine Seite die 5 Mal zitiert wird und selber 23 Zitate hat. Wenn die Abzsisse die Anzahl der Zitate repraesentiert wird diese Seite in Spalte 5 gezaehlt und wenn die Bedeutung der Abzsisse die Anzahl der Links ist in Spalte 23. Qualitativ ist das bei beiden Komprimierungsarten im Wesentlichen das Gleiche (auch wenn quantitativ was anderes bei raus kommt). Wichtig ist nun, dass, wie auch immer die Bedeutung der Abzsisse ist, diese Seite in jedem Fall zu der jeweiligen Spalte immer nur 5 „Punkte“ beitraegt, denn (und ich wiederhole mich hier) in den Falschfarbenbildern ist dargestellt, wie oft die Seiten auf der Abzsisse von den Seiten auf der Ordinate zitiert werden.
Nun wende man sich zur Ordinate. Hier findet sich diese Seite in Zeile 5 oder 23 wieder. Soweit erstmal kein Unterschied und das ist der Grund, warum man die Bedeutungskomprimierung nur fuer eine Achse ausrechnen musste. Weil diese Seite aber 23 andere Seiten zitiert, ist der Beitrag dieser Seite zur jeweils gegebenen Zeile 23 „Punkte“. Oder anders: ein und die selbe Seite traegt zu den Spalten anders bei als zu den Zeilen. Deswegen muss man jeweils zwei Anteilverteilungen (der jeweiligen Spalte / Zeilen) pro Achse berechnen.

Und jetzt passiert was kurioses … ist aber logisch, wenn man mal drueber nachdenkt, was ich euch, meinen lieben Leserinnen und Lesern als Hausaufgabe ueberlasse. Wenn die Abzsisse die Anzahl der Zitate repraesentiert so ist der SPALTENanteil identisch mit der Bedeutungskomprimierung, bezogen auf die ZITATE. Das gilt nicht, wenn die Abzsisse die Anzahl der Links repraesentiert.
Der ZEILENanteil wird identisch mit der Bedeutungskomprimierung, bezogen auf die LINKS, wenn die Ordinate die Anzahl der Links repraesentiert. Das passiert aber nicht wenn die Ordinate die Anzahl der Zitate repraesentiert.
Oder anders: wenn ich die Links ueber Zitate darstelle, so sollten die Falschfarbenbilder der Bedeutungs- und Wertekomprimierung identisch sein … da muss ich dran denken, dass beim naechsten Mal zu kontrollieren.

Ich erwaehne das, denn dieser Umstand ist hier und heute von Vorteil. Anstatt vier Anteilsverteilungen (und deren Komprimierungen) muss ich nur zwei zeigen, denn die anderen beiden sind ja schon im Beitrag vom vorletzten Mal zu sehen … man muss dann in Gedanken nur die Beschriftung der Ordinate aendern, aus „Anteil an allen Zitaten / Links (%)“ wird „Spaltenanteil (%)“ bzw. „Zeilenanteil (%)“ (ditomutatis mutandis … hehe … bei den Anteilen der komprimierten Gruppen).

Nun muss ich gar nicht mehr all zu viel sagen zu den folgenden Diagrammen, denn beim Beitrag zur Bedeutungskomprimierung hatte ich ausfuehrlich besprochen, wie man solche Diagramme liest und deren Informationsinhalt betrachtet.
Hier die Diagramme mit der neuen Information bzw. des Spalten- bzw. Zeilenanteils (bei entsprechender Bedeutung der jeweiligen Achse):

Form und Maximum der Kurve des Spaltenanteils (wenn die Abzsisse die Linksgruppen repraesentiert, linkes Diagramm) sind qualitativ wie bei der Bedeutungskomprimierung (aber quantitativ natuerlich anders). Das Einzige was (sogar im Wortsinne) heraus sticht ist der von der Wikipedia Hauptseite verursachte Punkt in den 2023 Daten. Das ist ja nun nicht mehr unerwartet, aber dieser macht den Unterschied in den beiden Komprimierungsmethoden deutlich, trotz aller qualitativen (und bei entsprechenden Achsenbedeutungen auch quantitativen) Aehnlichkeiten.

Die Kurve fuer den Zeilenanteil (wenn die Ordinate die Zitategruppen repraesentiert, rechtes Diagramm) ist hingegen vøllig anders; wenn man aber mal drueber nachdenkt dennoch logisch.
Hier sieht man auch, warum solche Diagramme wichtig sind, um die komprimierten Falschfarbenbilder vernuenftig zu interpretieren. Ich werde naemlich wieder ein Komprimierungsintervall von einem Prozent waehlen, aber die ersten zehn Zitategruppen liegen da extrem deutlich drueber.

Viel mehr gibt’s hierzu nicht zu sagen und ich kann ohne Umschweife zu den (auf ca. 1 %) komprimierten Gruppen kommen:

Hier muss ich nun fast gar nix mehr sagen, denn die Spruenge, warum einige Punkte unter, bzw. ueber ein Prozent liegen und wieso die Anzahl der komprimierten Gruppen nicht 100 betraegt, wurde ausfuehrlich beim letzten Mal diskutiert. Was ich im letzten Abschnitt bzgl. den extrem-deutlich-ueber-1-%-Anteilen der ersten zehn Zeilen sagte spiegelt sich natuerlich im rechten Diagramm wieder und ist der Grund, warum es hier gerade mal 66 komprimierte Gruppen gibt.

Alright … wenn’s nix zu sagen gibt, dann will ich das auch nicht unnøtig in die Laenge ziehen. Beim naechsten Mal gibt’s die dazugehørigen Falschfarbenbilder.

Ich bin so sehr mit Kevin Bacon beschaeftigt, dass ich gerade keine richtige Lust habe, lange Sachen fuer die Artikel dazwischen zu schreiben. Zum Glueck hab ich noch ’n paar Bilder in denen ich vor … bzw. in diesem Falle AUF …

… Dingen stehe. Das hier ist ’ne originale Appollo(leider-nur-test)kapsel mit mir oben drauf. Aber die Grøszenverhaeltnisse und so stimmen.

Arschcool wie ich bin … Wortspielkasse … warum wird gleich klar… hab ich natuerlich auch in der Wueste von Arizona (wo die Kapsel rum lag) schwarze Kleidung an. Es ist festzuhalten: ich war schon immer ziemlich fesch … auszerdem, ist die Kapsel echt winzig.

Beim letzten Mal schrieb ich, dass ich …

[…] die zweite Art der Komprimierung auf’s naechste Mal [verschiebe].

Als ich mir alles anschaute dachte ich mir allerdings dass es besser ist, wenn ich zunaechst die bedeutungskomprimierten Falschfarbenbilder zeige.

Wie immer „huepfen“ die Bilder zwischen den 2020-Daten und den 2023-Daten. Weil ich damals ein Prozent als Wert fuer die Komprimierung benutzte, tat ich das auch hier wieder. Vom letzten Mal wissen wir, dass das NICHT zu notwendigerweise zu 100 komprimierten Bedeutungsgruppen und zu „Spruengen zwischen einigen Spalten“ fuehrt. Auszerdem kann die Anzahl der komprimierten Gruppen bei den verschiedenen Datensaetzen unterschiedlich sein. Es ist wichtig dies im Hinterkopf zu haben, damit die dadurch verursachten „Effekte“ in den Bildern nicht die Interpretation der eigentlichen Information støren. So fuehren die besagten „Spruenge zwischen den Spalten“ zu Streifenstrukturen und die Unterschiede in der Anzahl der Gruppen zu Spruengen bei den Skalen der Achsen).
Und nicht vergessen: die durch die Abszisse repraesentierten Seiten werden von den durch die Ordinate repraesentierten Seiten zitiert.

(Auch) Wie immer fange ich mit dem Reproduzierbarkeitsteil an und der ist hier im linken Falschfarbenbild zu sehen, in dem die bedeutungskomprimierte Zitategruppe ueber der bedeutungskomprimierten Zitategruppe abgetragen ist:

Huch! Im Vergleich zu damals sieht man ja nuescht! … nun ja … wenn man genau hinschaut sieht man schon die gleichen Merkmale wie damals … aber noch viel besser sieht man, warum ich die Farbpalette wechselte; wie gesagt, meine Lieblingsfarbpalette „luegt“ und gaukelt mir Informationen vor die eigentlich gar nicht da sind.
Ansonsten sieht man wieder die gewaltige Dominanz der Wikipedia-Hauptseite in den 2023-Daten.

Im rechten Bild ist die bedeutungskomprimierte Linksgruppe ueber der bedeutungskomprimierten Zitategruppe abgetragen. Interessant ist der helle Punkt in der rechten unteren Ecke. Der tritt in beiden Datensaetzen auf und kommt deswegen NICHT durch die Wikipedia Hauptseite zustande. Als einzelner Punkt „ueberstraehlt“ dessen Intensitaet diese sogar! (Wobei die Summe ueber die gesamte Spalte sicherlich grøszer ist fuer die Hauptseite). Aber wie so oft in dieser Phase des bereits so lange andauernden Kevin-Bacon-Projekts: ich hab keine Lust (mehr) zu schauen, was das ist.
Ich weise nur darauf hin, dass dort in der Ecke anscheinend noch mehr passiert, denn dort treten etliche andere Pixel aus dem Schwarz hervor (wenn auch nicht ganz so deutlich) … eine weitere Erfolgsgeschichte fuer das neue Werkzeug :).

Weiter zu den Falschfarbenbildern, bei denen die Abszisse die komprimierten Linksgruppen repraesentiert:

Im linken Bild passiert nichts Unerwartetes. Dass die Hauptseite nicht am Ende der Abzsisse liegt (wie bei der Anzahl der Zitate), ist von vorher bekannt. Im Vergleich mit dem rechten Diagramm im oberen Bild spiegelt sich hier schøn wieder, dass die Information in diesen Bildern nicht symmetrisch ist und die Achsen nicht vertauscht werden kønnen.

Etwas spannender ist das rechte Falschfarbenbild. Sofort ins Auge fallen die hellen Punkte, welche alle in der selben Reihe liegen, und sowohl bei den 2020- als auch den 2023-Daten vorhanden sind (wenn auch an anderen Positionen auf der Abzsisse). Diese Punkte sind bereits vorher aufgetreten und ich wuerde spekulieren, dass die mit dem „helle[n] Punkt in der rechten unteren Ecke“ von weiter oben zu tun haben … ohne weitere Untersuchungen wuerde ich aber nicht drauf wetten. Falls dem so ist, ist es interessant, dass die zwar alle unterschiedliche Links, aber anscheinend (ungefaehr) gleich viele Zitate haben. Ihr meine lieben Leserinnen und Leser ahnt es sicherlich bereits: (i) ein weiteres Merkmal, enthuellt durch das neue Werkzeug, und (ii) ich werde das nicht weiter untersuchen.
Ansonsten sieht man hier deutlich, warum ich ueberhaupt erst auf die Idee der Komprimierung gekommen bin; hatte ich doch damals bereits in dem vielen Schwarz der unkomprimierten Daten doch noch Informationen vermutet. Die lila Tøne oberhalb der unteresten Reihen bestaetigen diese Vermutung. Das trifft uebrigens fuer alle Falschfarbenbilder zu, man sieht das nur nicht ueberall so gut (insb. bei den 2023-Daten, bei denen die hohe Intensitaet der Hauptseite die Farbskala festlegt und deswegen (fast) alles andere in den dunklen Bereich draengt).

Juti … ging ja schnell heute. Ich kann mich nur zitieren und sagen, dass …

[…] die zweite Art der Komprimierung […] [beim] naechste[n] Mal [behandelt wird].

Die Simpsons waren in den 90’er Jahren des vorigen Jahrhunderts der Knaller! Und als die dann auch als Comic heraus kamen hab ich den natuerlich gekauft. Von allen Comics die ich habe, kønnten die ersten Ausgaben einige der extrem wenigen Comics sein die ich besitze, welche heutzutage einen (deutlich, wenn auch nicht gigantisch) høheren Wert haben … wenn ich die damals super ordentlich behandelt haette … hab ich aber nicht … und das ist auch nicht so schlimm, denn Comics sollten gelesen werden und nur in Ausnahmefaellen in versiegelten Plastikschalen ihr Dasein fristen.

Soweit dazu, nun zu etwas ganz Anderem. Mir ist es schwer gefallen, Cover fuer den heutigen Beitrag zu finden, die ich ohne weitere Worte einfach so „reinklatschen“ kønnte, weil sie in ihrer Form fuer sich stehen. Die Cover der Simpsons Comics sind zwar immer passend und gut, haben bei mir aber nicht so’n „COOL“-Gefuehl verursacht (wie bspw. das hier). Aus der „Not“ heraus nahm ich dann solche, die ein paar der Dinge illustrieren die ich hier ansprechen werde.

Genug der Vorrede!

Wie erwaehnt, waren Die Simpsons super populaer als sie urspruenglich erschienen und es gibt genuegend Untersuchungen und Aufsaetze die erklaeren warum (siehe bspw. hier … ich hab das nicht gelesen, der Titel klingt aber interessatn und das poppte auf der ersten Seite einer schnellen Suche auf). Relevant finde ich hier, dass ich schon damals irgendwie nicht das URST lustig fand, was alle anderen URST lustig fanden. Homer war witzig, ich fand ihn aber jetzt nicht sooo witzig. Dito bzgl. Bart oder Itchy & Scratchy. Insb. bei Letzteren tat mir die arme Katze voll leid …

… und dass ich mich nicht wirklich mit Bart identifizieren konnte muss wohl nicht weiter erklaert werden.
Seine Schwester Lisa hingegen verdient etwas mehr Worte, denn damals fand ich die langweilig … aber beim nochmaligen Lesen fand ich sie (und Marge) in der ganzen Serie am Besten. Das liegt daran, dass diese beiden Figuren die „Vernuenftigen“ sind. Lisa versucht rational zu handeln und die Welt aktiv zu verbessern, trotz der ewigen Rueckschlaege und der „Sabotage“ aller anderen. Und auch wenn ich mich heutzutage (meiner eigenen geistig / emotionalen Gesundheit wegen) mit den Weltverbesserungsversuchen sehr zurueck halte, so erinnert mich das doch eher an mich, als die „witzigen“ Streiche von Bart. Dies Alles wird sehr schøn durch dieses Cover illustriert:

In diesem Sinne scheint mir, dass viel zu viele Menschen wie Homer sind: nicht nachdenkend, zuallererst auf den eigenen und unmittelbaren Lustgewinn aus und vøllig ignorant, dass es noch den Rest des Universums gibt … siehe hier:

Homer kennt Mr. Burns (der ihn schon mehrfach als Versuchkaninchen benutzte) und sollte wissen, nicht in irgendwelche Raeume zu gehen nur weil da Sandwichutensilien drin rumliegen. Aber der unmittelbare Drang zu essen ueberwiegt und er bekommt die Mordmaschinen des Mr. Burns gar nicht mit. Ist natuerlich alles vøllig ueberspitzt und (irgendwie) witzig dargestellt, aber erinnert mich doch eher an die ewig gleichen Verdaechtigen mit ihren ewige gleichen Argumenten, bei all zu vielen Themen (Klimakatastrophe, (Elektro)Individualmobilitaet, Erbschaftssteuer etc. pp.).

Ueberhaupt sehe ich jetzt, wieviel „Realitaet“ in den Simpsons steckt. Das ist so’n bisschen wie „The Kids aren’t alright“ von The Offspring, voll das tanzbare Lied … aber die Lyrics sind niederschmetternd und lassen einen an bspw. die Opioidepidemie in den USA denken … nur dass The Offspring da in den 90’ern mit dem Finger drauf zeigt.
Zum Einen ist da natuerlich die Karikatur eines Ultrakapitalisten ohne schlechtes Gewissen oder Moral in der Form von Mr. Burns und seines Handlangers Smithers. Auszerdem waere da noch der ultrakorrupte Buergermeister Quimby (der trotz allem immer wiedergewaehlt wird). Aber beim nochmaligen Lesen habe ich das alles, vor allem in der Figur von Marge gesehen. Sie ist die Frau und Mutter die sich um alles kuemmert. Homer schafft zwar das Geld ran, aber viel mehr auch nicht. Marge ist die Person, welche die Welt der Simpsons im Hintergrund zusammen und am laufen haelt … was waeren Bart oder Homer ohne Marge?

Ueberhaupt ist Homer weder ein guter Ehemann noch ein guter Vater. Dieser Meinung bin ich trotz all der Sachen die ihn letztlich als liebevollen Menschen darzustellen versuchen, der gut im Herzen ist und der sich auch entschuldigen und Fehler eingestehen, und Dinge (meist im Nachhinein) besser machen kann. Das mag alles stimmen, und gute Ehemaenner und Vaeter sind keine Supermaenner die niemals Fehler machen … aber die machen ganz sicher nicht den ganzen Scheisz den Homer immerzu anstellt. … … … Andererseits waren das die 90’er Jahre … vermutlich war ein Vater / Ehemann wie Homer ein krasser Fortschritt zu dem was man vorher als Normal bzgl. dieser Rollen angesehen hat und erst jetzt, 30 Jahre spaeter, halte ich das nicht (mehr) fuer gut genug sondern als das absolute Minimum wie man sich als Mensch (Mann / Vater) gegenueber anderen Menschen (seiner Familie) verhalten sollte.

Deswegen hab ich beim nochmaligen Durchlesen auch viel mehr Verstaendniss fuer die Schwestern von Marge. Die lassen sich vom „Charme“ eines Homer naemlich nicht einlullen und stehen dagegen … auch hierzu ein Cover (man beachte das all zu passende Grinsen im Gesicht von Patty und Selma):

Die Bouvier-Zwilinge finde ich, der ich jetzt Mitte 40 bin, auch sympathisch wg. ihrer No-Bullshit-Attituede bzgl. dem Rest der Welt … Arbeit? Man muss ja leider. Rauchen? Mir doch egal was du davon haeltst. Zu Hause sitzen und MacGyver gucken anstatt ins Fitnessstudio zu gehen? Klar gerne! … Ist zwar das „Umgekehrte“ von „Søren, willst du nicht Projektleiter werden?“ UÆRGS! Bleib mir weg mit „Karriere“ … „Ist das ’ne Milch die du da an der Bar trinkst?“ … *hust* zocken *hust* … aber im Prinzip das Gleiche.

Lange Rede kurzer Sinn … Die Simpsons waren voll gut und die fruehen Sachen sind echt gut geaeltert … aber waehrend ich es immer noch sehr wertschaetze, so ist es doch nicht das Selbe wie zu der Zeit als ich noch ’n Teenager war … und trotz aller Nostalgie und der Wehmut, dass man die Zeit des „jung seins“ nicht wieder haben kann, ist das ist natuerlich gut so … denn dies erlaubt es mir andere Dinge darin zu sehen und zu entdecken :) .