Einzelnen Beitrag anzeigen
  #5  
Alt 09.04.2012, 03:11
Benutzerbild von Chessguru
Chessguru Chessguru ist offline
Administrator
 
Registriert seit: 29.06.2004
Ort: Rostock
Alter: 55
Land:
Beiträge: 6.522
Abgegebene Danke: 1.659
Erhielt 4.698 Danke für 1.404 Beiträge
Member Photo Albums
Aktivitäten Langlebigkeit
6/20 20/20
Heute Beiträge
0/3 sssss6522
AW: Mephisto Brikett 3,5 oder 6,1 MHZ

Hallo Matthias,

 Zitat von Solwac Beitrag anzeigen
Die Veränderungen im Lauf der Zeit kommen durch neuere Geräte, die gegen ihre direkten Vorgänger getunt wurden (Eröffnungsbibliotheken, Spieltests) und teilweise gegen schwächere Geräte zwei Generationen vorher unterschiedlich viel Punkte verloren haben. Einzelne Geräte haben dadurch viel profitiert, zu Lasten anderer.

Die Berechnung an sich ist schon in Ordnung, dies konnte man immer mit den vollständigen Daten nachvollziehen.
Nein, es passt eben nicht. Einige Werte lassen sich nicht auf die von dir beschriebene Aussage anpassen. Das Programm zur Berechnung stammt(e) von dem ungarischen Programmierer Lars Hjorth und es kam der Iterationsalgorithmus zum Einsatz. Der Iterationsalgorithmus beruht u.a. darauf, dass zwischen zwei Programmen A und C ein indirekter Spielstärkebezug hergestellt werden kann, selbst wenn A und C nie direkt gegeneinander gespielt haben. Hat z.B. das Programm A mehrere Partien gegen B gespielt und B wiederum einige Partien gegen C, so reicht dies aus, um die Elozahlen aller drei beteiligten Programme im Sinne des Iterationsverfahrens konvergieren zu lassen. A, B, und C bilden somit einen zusammenhängenden Cluster. Besteht eine Datenbank aus einem einzelnem Cluster, d.h. geht man von einem beliebigen Programm aus, so läßt sich zu jedem anderen Programm der Datenbank ein Spielstärkebezug im obigen Sinne ableiten. Jede gute Datenbank sollte daher aus einem einzelnen Programmcluster bestehen und somit unfragmentiert sein (im Idealfall hat jeder gegen jeden gespielt).
Spielt man allerdings mit zahlreichen Programmen, so kann es passieren, dass die Datenbank unbemerkt fragmentiert, d.h. in einzelne unabhängige Cluster zerfällt, zwischen denen kein Spielstärkebezug mehr existiert. Dieser Fall tritt z.B. dann ein, wenn man zu den Programmen A,B,C drei weitere Programme D,E,F, hinzufügen würde, die zwar jeweils unmittelbar gegeneinander spielen (also etwa D-E, D-F, E-F), aber keine einzige Partie gegen die anderen Programme austragen. In diesem Fall handelt es sich streng genommen nicht um eine einzige, sondern um zwei voneinander unabhängige Datenbestände. Bei der Eloberechnung laufen somit zwei ebenfalls unabhängige Iterationsverfahren ab und die ermittelten Elozahlen in beiden Clustern haben keinen Bezug mehr zueinander.

Und genau das scheint bei einigen Geräten der SSDF der Fall gewesen zu sein. Geräte, die im Jahr 1986 bereits eine sehr hohe Anzahl an Partien aufzuweisen hatten, verloren teilweise ~100 Punkte im Vergleich zum Jahr 1992. Andere Geräte hingegen stagnieren förmlich. Da sehe ich einen klaren Widerspruch. Diese Auffälligkeiten lassen aus meiner Sicht auf den oben beschriebenen Effekt schließen.


 Zitat von Solwac Beitrag anzeigen
Nein, nur wurden die alten Geräte nicht mehr mit abgedruckt. In die Bewertung sind sie aber sehr wohl eingeflossen, der Einfluss auf die Rangliste wurde aber im Laufe der Zeit immer geringer.
Nein, sehe ich nicht so. Ein Einfluss auf den entsprechenden Elo-Wirkungskreis ist aufgrund der hohen Partienanzahl zwangsläufig vorhanden und nimmt auch nicht im Laufe der Zeit ab. Der Einfluss würde sich nur dann vermindern, wenn sich etliche neue Geräte inkl. überproportional viele neue Partien im entsprechenden Elo-Bereich einfinden würden, was aber nicht der Fall war.


 Zitat von Solwac Beitrag anzeigen
Die Berechnung an sich ist für mich kein Problem, wohl aber die Auswahl der Gegner. Die verschiedenen Topprogramme von Mephisto haben selten gegen Angstgegner antreten müssen, die kamen erst in die Wertung nachdem bereits das nächste Programm draußen war und das Interesse schon wieder nachgelassen hat. So wurde starken Programmen noch das ein oder andere extra Quäntchen an Elo geschenkt.
Volle Zustimmung, was deine Aussage zur Auswahl der Gegner betrifft. Auch kann ich es nicht verstehen, warum fragwürdige Ergebnisse, wie 20:0, 19:1 etc. in die Liste mit aufgenommen worden sind. Solche Ergebnisse verfälschen aus meiner Sicht bzw. Erfahrung eine Liste.


 Zitat von Solwac Beitrag anzeigen
Von daher sind die Listen der SSDF schon das Beste verfügbare aber eben nur mit dem Blick in die Einzelergebnisse zu gebrauchen.
Jein. Die Liste grundsätzlich zu verteufeln, wäre wohl zu heftig. Aber ich bleibe dabei, bei einigen Geräten / Herstellern (Novag, Mephisto) zeigen sich Auffälligkeiten, die ich nicht nachvollziehen kann, um es sehr freundlich auszudrücken. Auch einige fragwürdige Aktionen (MM IV Turbo, Rebell, Polgar + MMV EInstiegswerte, Novag Geräte, Abwertungen...) der SSDF lassen mich immer wieder an der "heiligen" Liste zweifeln.

Gruß
Micha
Mit Zitat antworten