Einzelnen Beitrag anzeigen
  #9  
Alt 09.06.2005, 19:52
Benutzerbild von Stefan
Stefan Stefan ist offline
Mephisto Wundermaschine
 
Registriert seit: 01.07.2004
Ort: Dresden
Alter: 58
Land:
Beiträge: 495
Abgegebene Danke: 2
Erhielt 10 Danke für 9 Beiträge
Aktivitäten Langlebigkeit
0/20 20/20
Heute Beiträge
0/3 ssssss495
AW: 1. Aktivschachliste

Hallo Hans-Jürgen,

zunächst einmal vielen Dank für Deinen ausführlichen Beitrag, auch von mir noch ein paar Anmerkungen (Micha hat vieles ja schon dargelegt):

 Zitat von CC 7

...
Womit wir beim springenden Punkt wären: die extrem niedrigen Werte der Oldies haben mich sehr überrascht - 352 für einen Mini Chess alias SciSys Junior Chess halte ich auch für ziemlich lächerlich.

Wohingegen Elo 500 - viel besser ist er wirklich nicht - er übersieht schon mal auf der höchsten Stufe ein Matt in 1...
...

Für mich ebenso unglaublich, dass Mephisto I und Mephisto Junior die Schallmauer von 1000 Elo nicht durchbrechen können - und jetzt das Kuriose: in meiner persönlichen ELo-Liste liegen sie darüber...dabei benutze ich das gleiche Programm Elostat und auch die Partienbasis ist dieselbe !

Wie das ??
Es macht meiner Ansicht nach nicht allzuviel Sinn über absolute ELO-Werte zu sprechen bzw. diese mit anderen Listen zu vergleichen. ELO-Stat funktioniert mit einem rein mathematischen Näeherungsverfahren, mit dem man durch geeignete Wahl des Startwerts JEDE ELO-Zahl erzeugen kann. Wenn wir 1900 als Startwert gewählt hätten, wäre halt jedes Gerät um 100 Punkte höher eingestuft worden. Der aus meiner Sicht geeignetere Diskusionsansatz ist der direkte Vergleich zweier Geräte, also wenn man darüber philisophiert, daß z. B. in einer Liste X der Abstand zwischen zwei Geräten A und B 50 Punkte beträgt, in Liste Y hingegen 100 Punkte.

Die Frage was 350 ELO-Punkte schachlich bedeuten vermag ich nicht zu beantworten, aber mahr als ein Zuggenerator kann das nicht sein.
 Zitat von CC 7

(Anmerkung: ich benutzte Elostat 1.3, laut Liste wurde Elostat 1.1 verwendet, aber auch diese Version liefert praktisch identische Werte +/- 1. Auch das geringfügig grössere offset -4,58 kann nicht als Begründung dienen).
Ich habe es gecheckt beide Versionen erzeugen dieselben ELO-Zahlen, lediglich die Schwankungsbreite ist in der neuen Version anders. Das liegt wohl an dem neu implementierten Berechnungsverfahren nichtparametrische ABC-Methode (Approximated Bootstrap Confidence)) nach Efron und Tibshirani, welches ab Version 1.3 implementiert wurde. Wir werden aber ab sofort die neueste Version verwenden, das ist kein Problem.
 Zitat von CC 7

Sehr gut korrelieren allerdings die gehobeneren Werte von meiner Liste mit der einzig wahren offiziellen Liste, auch stimmen hier die Gesamtpartien meist völlig überein, also kein Störfaktor. Aber die Werte der underdogs laufen gewaltig aus dem Ruder:

offiziell privat Differenz

Mythos 1941 1935 +6
Igor 1767 1771 -4
Excellence 1753 1740 +13
Europa A 1570 1593 -23
Merlin 16k 1470 1502 -32
Companion III 1159 1264 -105
Junior 936 1070 -134
Mephisto I 890 1029 -139
CC 7 759 908 -149
Equinox 759 905 -146
Prelude 671 824 -153
Pocket Chess 656 807 -168
Calculator 614 764 -150
Teufelchen 598 747 -149
Toytronic 593 743 -150
MK 7 550 701 -151
MK I 444 593 -149
Mini Chess 352 503 -151

Ist das ein Bug im Elostat-Programm - oder kann Herr Schubert das erklären ? Ich kapiers nicht.
...
Mir gefallen die Oldie-Werte meiner privaten Liste erheblich besser...
vielleicht finden wir ja den Grund für die doch gravierende Abwertung in der offiziellen Liste.
Ist eigentlich ganz einfach, wir haben nicht die gleiche Partienbasis, Du hast in Deiner Datei nur Deine Partien während wir halt ca. 2600 Partien haben. Ich zitiere nochmal aus der Programmbeschreibung zu ELO-Stat:

"Die Leistungsfähigkeit des oben beschriebenen Iterationsalgorithmus beruht u.a. darauf, dass zwischen zwei Programmen A und C ein indirekter Spielstärkebezug hergestellt werden kann, selbst wenn A und C nie direkt gegeneinander gespielt haben. Hat z.B. das Programm A meh-rere Partien gegen B gespielt und B wiederum einige Partien gegen C, so reicht dies aus, um die Elozahlen aller drei beteiligten Programme im Sinne des Iterationsverfahrens konvergie-ren zu lassen. A, B, und C bilden somit einen zusammenhängenden Cluster. Die oben im Bei-spiel behandelte Datenbank ‘wb_elo.pgn’ besteht aus einem einzelnen Cluster, d.h. geht man von einem beliebigen Programm aus, so läß sich zu JEDEM anderen Programm der Daten-bank ein Spielstärkebezug im obigen Sinne ableiten. Jede gute Datenbank sollte daher aus einem einzelnen Programmcluster bestehen und somit unfragmentiert sein (im Idealfall hat jeder gegen jeden gespielt)."

Die Lösung ist, daß wir zwei völlig verschiedene Cluster verwenden, das kann nicht zu identischen Ergebnissen führen. Der letzte Satz beantwortet übrigens auch die Frage (zumindest aus mathematischer Sicht), ob ein Gerät möglichst gegen viele Geräte oder nur gegen gleichwertige Geräte spielen sollte, um zu einem brauchbaren Ergebnis zu kommen. Ob das aus schachlicher Sicht Sinn macht, ist natürlich eine andere Frage...

Ich hoffe mit diesem kleinen Exkurs noch einmal ein wenig zum Verständnis unseres Ansatzes beigetragen zu haben.

Viele Grüße
Stefan

Geändert von Stefan (09.06.2005 um 22:25 Uhr)
Mit Zitat antworten