
Zitat von
Chessguru
Aber eine andere Frage. Kann es sein, dass die Art der Elo Berechnung durch die 3 bekannten Programme an ihre Grenzen stößt und deshalb das Geschrei beginnt? Da die PC-Engine Listen ja aufgrund der Vielzahl an Partien gegen 3100 Elo Spielern extrem groß ist, können die Listen nicht falsch sein.
Früher war die Computerliste durch Partien gegen Menschen in ihrem Leistungsbereich sehr gut mit der menschlichen Elozahl vergleichbar. Auch passten die Elowerte durch die Aktualität gut dazu.
Wenn heute die Spitze der Computerliste Werte von gut über 3000 erreicht, dann liegt das über 1000 Punkte über dem Niveau der Vergleichspartien. Wir befinden uns hier deutlich außerhalb des Bereichs, den Arpad Elo damals für seine Berechnungen zur Verfügung stand.
Kern der Eloberechnungen sind zwei Annahmen: Bei einer Differenz von x Punkten kann ein guter Erwartungswert von y% angegeben, unabhängig vom Niveau der Spieler. Und es ist unabhängig vom genauen Pool der Gegner, solange dieser ausreichend groß ist.
Wir haben es aber in den letzten Jahren erlebt, dass Spieler aus einzelnen Ländern Schwierigkeiten beim Nachweis ihrer Elozahl bei Spielen gegen andere Regionen der Welt hatten. Und es hat einen kräftigen Zuwachs bei den Elozahlen an der Spitze gegeben. Allerdings ist das Schachspiel auch besser geworden, so dass hier keine numerische Bewertung dieses Effekts möglich ist. Es kann halt kein Großmeister heute gegen einen Großmeister von vor 30 Jahren mit dessen damaliger Leistung spielen.
Also ist die Elozahl für Menschen gut und wir haben nichts besseres. Aber es ist nicht perfekt. In den ersten Jahren war die Übereinstimmung zwischen der Computerliste und den Ergebnissen gegen Menschen gut genug um ebenfalls diese Berechnung zu nehmen. Aber es gab schon immer Zweifel und die statistischen Unsicherheiten machen es schwer diese Annahme (Verwendung des Elomodells für Menschen auch für Computer) zu widerlegen.

Zitat von
Chessguru
Verwende ich ORDO (mittlerweile Standard bei vielen Ranglisten) für die Berechnung der Aktivliste und setze die Traumwerte von 2000 Elo für den R30 an (MM V hätte dann ~1590), so lande ich am Ende der Liste sogar im negativen Bereich. Was nun? Heißt das, die Geräte am Ende der Liste spielen einfach unterirdisch? Oder ist die ganze Wahrscheinlichkeitsrechnung am Ende wahrscheinlich unwahrscheinlich?
Der negative Bereich sieht nur unschön aus, spielt aber für den praktischen Einsatz für die Berechnung von Erwartungswerten keine Rolle.