Eine kleine Vorwarnung, der folgende Artikel hat wahrscheinlich nur sentimentalen Wert für mich. Ich möchte mich erst einmal bei Martin bedanken, dass er mich via Jabber ausgehalten hat. Es ist etwas über 10 Jahre her, dass ich mein Diplomarbeit mit dem Thema Vergleich von kommunizierenden Prozessen und Kaktusstack auf Mehrkernarchitekturen abgeben habe. Eines Abends bin ich auf die Idee gekommen, dass ich den meine Lösungen mit dem Kaktusstack auf heutigen Prozessoren noch einmal ausprobiere.
Ich habe für meine Diplomarbeit die Matrixmultiplikation nach Strassen implementiert. Das ganze habe ich mit Cilk++ implementiert. Ich war recht erstaunt, als ich diese Ergebnisse gesehen habe. Es ist erklärbar, weswegen ich einen superlinearen Speedup erreicht habe. Wenn ich auf 4 CPUs rechne habe ich mehr Cache zur Verfügung. Diesen hohen Speedup kann man nur durch Caching Effekte erreichen.