Das mit den Elo-Listen ist ein Problem und wird immer eines bleiben. Das muss auch so sein. Die ELO-Listen - und da ist es relativ egal ob es die Listen der SSFD, CEGT, IPON oder auch unsere eigene Aktiv-Elo Liste sind - haben alle ein Problem. Sie geben eine Relation zu einer gewissen Gegnerschaft wider. Sieht man sich z.B. die CEGT-Liste an und nimmt den Wert von "Stockfish 10.0 x64 4CPU"
Die Wertung basiert auf den Ergebnissen gegen ganze 10 Gegner
http://www.cegt.net/40_40%20Rating%2...ersions/2.html
Die Werung von Houdini 6.0 x64 8CPU sogar nur gegen 5 Gegner
http://www.cegt.net/40_40%20Rating%2...ersions/4.html
wobei zum Zeitpunkt dieses Posts gegen den Gegner, gegen den Houdini am schlechtesten performed hat, mehr als doppelt so viele Partien gespielt wurden, als gegen die anderen 4 Gegner, womit die Elo-Wertung bereits wieder verfälscht ist. Jeder Mensch der in einem Verein und von mir aus für den Verein noch in irgendeiner Liga spielt hat eine größere Gegnerschaft.
Die SSDF-Liste kränkelte an genau demselben Effekt. Und das geht jeder anderen Elo-Liste genauso, wobei ich denke, dass wir mit unserer Aktiv-Liste durch die Vielzahl der verschiedenen Turniere und Wettkämpfe durchaus auf eine breite Gegnerschaft pro Gerät blicken und dadurch recht genau sein dürften.
Bei Vergleich zwischen Menschen sieht es nicht viel anders aus, gerade bei denen mit einer niedrigeren Elo (oder DWZ) tritt der Effekt auf, dass die meisten Partien in der Regel im eigenen Verein gespielt (und ausgewertet) werden gegen Gegner die in etwa zwar dasselbe Level haben, aber meistens sind es auch hier eben immer wieder dieselben Gegner. Aber eben auch gegen Gegner, die ich kenne (ebenso wie ich meinen eigenen Schachcomputer kenne). Wenn ich aber im Verein einen Gegner mit sagen wir mal ELO 1800 immer wieder schlagen kann, heisst das aber eben nicht, dass ich grundsätzlich in der Lage bin jeden mit ELO 1800 immer wieder zu schlagen. Ganz im Gegenteil kann es gegen einen ELO 1800 aus einem anderen Verein genau umgekehrt sein.
Da hilft dann auch das ganze Auf- und Abwerten der Listen (wie bei der SSDF geschehen) nichts. Man verschiebt nur die Relationen, man bekommt dann vielleicht auch einen Wert wo ein beliebig gewähltes Referenzgerät (sagen wir mal ein Mephisto Roma) dann in ungefähr ein gleichwertiger Gegner für einen Elogleichen "Referenz-" Menschen ist. Es heisst aber eben deswegen eben noch lange nicht, dass ein in derselben Liste befindlicher Fidelity Elite V11 mit einem beliebigen Elogleichen Menschen genauso auf Augenhöhe spielt.
Gleichwertigkeit und Vergleichbarkeit bezieht sich bei einer statistischen Auswertung (und nichts anderes ist der Elo-Wert) immer nur auf den Pool aus dem ausgewertet wurde, auf den Referenzwert, der für die Auswertung herangenommen wurde, und andere statistische Spielereien. Da kann man solche Listen auf- und abwerten soviel man will. Man wird nie ein "richtiges" Ergebnis bekommen. Auf jeden Fall keines, dass einen Vergleich zwischen 2 verschiedenen Listen erlaubt.