|
||||||||||||
![]() Hallo allerseits,
wir haben es geschafft die neue Elo-Liste gemäß unserem vor einiger Zeit vorgestellten Bewertungs- und Kalibrierungsverfahren mit dem Programm ELO-Stat 1.1 fertigzustellen. Insgesamt sind 1206 doublettenfreie Partien eingeflossen, gespielt von 30 Geräten, bzw. Geräten mit unterschiedlichen Einstellungen, eine stolze Zahl wie wir finden. Es sind einige, sagen wir mal provokante Einordnungen ![]() An dieser Stelle sei allen Beteiligten bedankt, die in Form der ausgetragenen Partien zum Gelingen diese Unternehmens beigetragen haben. Wir hoffen natürlich auch zukünftig auf solcherlei Zuarbeit und vielleicht findet sich ja auch noch der ein oder andere neue, alte Schachcomputefreund, der seine Kisten wieder auspackt und die eine Partie wagt. Der Grundstein für eine Geräteauswahl ist mit 30 Schachcomputern jedenfalls gelegt. Aprpos Geräteauswahl: Bei der Zusammenstellung zukünftiger Matches/Turniere sollte darauf geachtet werden, daß mindestens ein Gerät aus der aktuellen Liste mitspielt. Geräte, bisher nicht in der Liste vorhanden sind und z. B. direkt gegeneinander antreten würden, sind schwierig einzurechnen. Sie bilden dann nämlich einen neuen, eigenen aus zwei Geräten bestehenden Cluster, der in keinem Zusammenhang mit den restlichen Geräten stehen würde. Abhilfe schafft hier, wie schon erwähnt, nur ein Spiel gegen ein schon in der Liste aufgeführtes Gerät. Also viel Spaß beim Studieren der Liste und Anmerkungen, Meckereien Hinweise auf Fehler sind selbstverständlich Willkommen ![]() Gruß Stefan Toll, danke für die Arbeit, die ihr euch da gemacht habt! (wahrscheinlich habe ich deshalb so lange nichts mehr von dir gehört, oder? ![]() Interessant finde ich, dass der Vancouver16 nur 5 Punkte hinter seinem 32bit-Bruder liegt, aber dazu habt ihr in den Anmerkungen ja schon etwas geschrieben. Die 2168 des Vancouver32 sind von der SSDF-Liste (2161) ja nicht so weit entfernt; da wird der V16 wohl etwas nachgeben müssen! Aber der Designer 2265 ist mit 1800 wohl doch noch sehr unterbewertet. Und das der Diablo so deutlich unter seinem "kleinen" Bruder SFC liegt, liegt hoffentlich an der noch zu geringen Anzahl von Partien! ![]() viele Grüsse, Robert |
|
||||||||||||
![]() Aber der Designer 2265 ist mit 1800 wohl doch noch sehr unterbewertet.
Und das der Diablo so deutlich unter seinem "kleinen" Bruder SFC liegt, liegt hoffentlich an der noch zu geringen Anzahl von Partien! ![]() viele Grüsse, Robert ich denke auch, dass in beiden Fällen (Designer und Diabolo) die sehr geringe Partienanzahl die entscheidende Rolle spielt. Die Schwankungsbreite ist sehr gross, da ist noch alles drin... Danke im übrigen für das Lob und das Feedback, es ist in der Tat auf unserer Seite in der letzten Zeit viel Arbeit investiert worden, deswegen freut es umso mehr wenn sich dann auch wirklich jemand dafür interessiert ![]() Gruss Stefan |
|
||||||||||||
![]() Wow!
1206 Partien? Die muß man erst mal spielen. Wenn ich mich da mal selber angucke: Aus Zeitgründen mache ich immer nur 30min-Partien; Turnierpartien durchzuführen kommt mir fast undenkbar vor. Da kann ich nur meinen Hut ziehen vor all den fleißigen Testern. Vielleicht nehme ich mir ja doch mal ein Beispiel an Euch... Und dann die Liste selber: Die steckt dokumentationsmäßig ja die schwedische Referenz völlig in die Tasche! Besonders gut hat mir die Liste der Paarungsergebnisse gefallen und auch, daß die jeweiligen Match-Ergebnisse auch direkt mit der Liste verlinkt sind. Schön auch die grafische Aufarbeitung. Dazu nur eine Frage: Wozu taugt die Regressionsgerade? Und das 0,9019 -- ist das der Regressionskoeffizient? Ein linearer Zusammenhang zwischen den Modellen und ihren Ratingzahlen scheint mir in der Tat nicht leicht zu belegen zu sein... ![]() Unter dem Strich eine tolle Aktion, diese Liste! Und wir können alle nur hoffen, daß Ihr nicht so schnell die Lust daran verliert! Viele Grüße, Dirk |
|
||||||||||||
![]() Wow!
Schön auch die grafische Aufarbeitung. Dazu nur eine Frage: Wozu taugt die Regressionsgerade? Und das 0,9019 -- ist das der Regressionskoeffizient? Ein linearer Zusammenhang zwischen den Modellen und ihren Ratingzahlen scheint mir in der Tat nicht leicht zu belegen zu sein... ![]() Unter dem Strich eine tolle Aktion, diese Liste! Und wir können alle nur hoffen, daß Ihr nicht so schnell die Lust daran verliert! Viele Grüße, Dirk Danke Dirk für das Feedback! Kurz zu Deiner Frage: Es ist in der Tat der Regresionnskoeffizient. Ich habe es mit der SSDF versucht zu vergleichen (einfach mal schauen, ob die bei den gleichen Geräten auf ähnliche Parameter kommen). Das ganze macht aber ehrlich gesagt nicht allzuviel Sinn (es gibt natuerlich auch keinen linearen Zusammenhang!), ausserdem soll es ja auch nicht darum gehen die SSDF abzubilden, sondern etwas eigenes auf die Beine zu stellen. Ich denke in der nächsten Liste wird die Gerade verschwinden... Gruss Stefan |
![]() |
Themen-Optionen | |
Ansicht | |
|
|
![]() |
||||
Thema | Erstellt von | Forum | Antworten | Letzter Beitrag |
Turnier-ELO-Liste 02-05 fertig! | Stefan | Teststellungen und Elo Listen / Test positions and Elo lists | 21 | 28.10.2005 23:02 |
Neue ELO-Liste | Stefan | Teststellungen und Elo Listen / Test positions and Elo lists | 20 | 13.04.2005 14:35 |
Review: Neue Elo-Liste | Björn | Teststellungen und Elo Listen / Test positions and Elo lists | 2 | 10.11.2004 12:37 |
Neue Elo-Liste | Björn | Teststellungen und Elo Listen / Test positions and Elo lists | 0 | 27.07.2004 14:06 |