Schachcomputer.info Community
  #1  
Alt 07.06.2005, 21:00
Benutzerbild von Stefan
Stefan Stefan ist offline
Mephisto Wundermaschine
 
Registriert seit: 01.07.2004
Ort: Dresden
Alter: 58
Land:
Beiträge: 495
Abgegebene Danke: 2
Erhielt 10 Danke für 9 Beiträge
Aktivitäten Langlebigkeit
0/20 20/20
Heute Beiträge
0/3 ssssss495
1. Aktivschach-Liste

Hallo allerseits,

als kleine Ergänzung noch ein paar Anmerkungen zur Berechnung dieser Liste und der Hinweis, daß die pdf Version in den kommenden Tagen nachgereicht wird.

Zunächst war angedacht, den Startwert wieder anhand eines gewichteten ELO-Mittelwertes aller in der SSDF gelisteten Geräte zu erstellen (siehe auch unsere Regeln zur Berechnung der Liste für weitere Details). Dies erschien plausibel, auch wenn die SSDF ja die Werte auf der Basis von Turnierprtien ermittelt. Herausgekommen wäre ein ELO-Startwert von ca. 2030 Punkten.

Mitte Mai, also kurz vor Toresschluß, flatterten uns aber über 600 Partien von Hans-Jürgen Schäfer ins Haus. Dieser hatte sich die außerordentliche Mühe gemacht, insbesondere die sogenannten kleinen und z. T. unbekannten Geräte gegeneinander antreten zu lassen. „Klein“ meint im Wesentlichen z. T. recht unbekannte Singlechip-Geräte und Reiseschachcomputer, für die nirgendwo Referenzwerte vorliegen.

Schachlich war von diesen Kisten nicht allzuviel zu erwarten, aber wir waren natürlich sehr gespannt und starteten die Berechnung...

... und wir staunten schließlich nicht schlecht über das Ergebnis (wir meinen jetzt nicht unbedingt den ersten Platz!) und darüber, daß zwischen den bekannten Geräten und den sogenannten „Kleinen“ eine riesige Lücke klaffte und die Liste ziemlich auseinander gezogen wurde. Die Spitzenreiter hätten über 2600 Punkte gehabt, wenn wir die oben erwähnte Methode des gewichteten Mittelwertes für den ersten Startwert verwendet hätten.

Wir haben uns dann kurzerhand entschlossen einen fiktiven Startwert von 1800 Punkten zu wählen, von dem wir glauben, daß er einigermaßen die Spielstärke der Geräte im Aktivschach wiedergibt. Natürlich kann man sich fragen, was ELO-Werte von weniger als 600 oder in einem Fall sogar 352 überhaupt aussagen. Mehr als ein Zuggenerator, der legale Züge ermittelt, kann man das eigentlich nicht nennen (Ist ein ELO-Wert von < 400 überhaupt definiert?). Das zeigt noch einmal mehr die Geduld, die der arme Hans-Jürgen Schäfer beim Spielen dieser Partien wohl gehabt haben muß. Man sollte aber nicht vergessen, daß es bei unserer Art der Berechnung mit ELO-Stat 1.1 mehr auf die relativen Abstände der Geräte untereinander als auf absolute Zahlen ankommt.

Zukünftig werden wir dann wieder unser gewichtetes Verfahren anwenden, da wir ja jetzt eine Basis inclusive eines Startwertes erstellt haben.

Es darf diskutiert werden...

Viele Grüße
Stefan

Geändert von Stefan (07.06.2005 um 21:42 Uhr)
Mit Zitat antworten
  #2  
Alt 07.06.2005, 22:53
kosakenzipfel kosakenzipfel ist offline
SPARC
 
Registriert seit: 12.08.2004
Beiträge: 229
Abgegebene Danke: 1
Erhielt 29 Danke für 5 Beiträge
Aktivitäten Langlebigkeit
0/20 20/20
Heute Beiträge
0/3 ssssss229
Daumen hoch AW: 1. Aktivschachliste

Hallo Stefan und Micha,

Glückwunsch und Dank an Euch für die Erstellung der Liste. Bei der Vielzahl der Geräte und Ergebnisse war das sicher eine Heidenarbeit.

Für alle Tester gibt es nun eine prima Basis für die weiteren Aktiv-Matches. Neben dem Stoff für die Diskussion bietet sich sicher auch der Anreiz, eine ganze Reihe von Kandidaten einer Prüfung auf höherem Zeitlevel zu unterziehen, was wiederum der Turnierliste zugute kommen dürfte.

Ein paar allgemeine Fragen hätte ich auch noch :

1. Welche Möglichkeit gibt es für den Zugriff auf die Partien?
2. Gibt es eine (groben) Zeitplan für die Aktualisierung?
3. Wie hoch war denn der Anteil der Dubletten?

Beste Grüße
kosakenzipfel
Mit Zitat antworten
  #3  
Alt 08.06.2005, 20:20
Benutzerbild von Paisano
Paisano Paisano ist offline
Schachcomputer Koryphäe
 
Registriert seit: 15.12.2004
Ort: Borken-Singlis (Hessen)
Alter: 65
Land:
Beiträge: 1.247
Abgegebene Danke: 87
Erhielt 273 Danke für 76 Beiträge
Aktivitäten Langlebigkeit
1/20 20/20
Heute Beiträge
0/3 sssss1247
AW: 1. Aktivschachliste

 Zitat von kosakenzipfel
Für alle Tester gibt es nun eine prima Basis für die weiteren Aktiv-Matches.
Hallo zusammen,

Robert hat ja in dem anderen Aktivschach-Thread die fehlenden 16-Bitter schon angesprochen, ich werde so schnell wie möglich dafür sorgen, dass der Vancouver 68000 schnellstmöglich sein Plätzchen findet

Danke noch an alle, die dazu beigetragen haben, dass wir diese Liste haben

Viele Grüße
Uwe
Mit Zitat antworten
  #4  
Alt 08.06.2005, 20:37
CC 7 CC 7 ist offline
Chess Machine
 
Registriert seit: 10.12.2004
Land:
Beiträge: 345
Abgegebene Danke: 0
Erhielt 316 Danke für 140 Beiträge
Aktivitäten Langlebigkeit
6/20 20/20
Heute Beiträge
0/3 ssssss345
AW: 1. Aktivschachliste

Hallo !

Toll, diese erste Aktivschach-Eloliste ! Bravo !

Mit jeder Menge Spannung an der Spitze - so ein enges Gerangel um Platz 1 sieht man selten.

Aber auch im unscheinbaren Mittelfeld gibt es etliche Elo-Einstufungen, die jede Menge Diskussionsstoff beeinhalten.
So haben Star Sapphire und Sapphire II eine genaue Punktlandung hingelegt. Erstaunlich, dass sich der Turquoise mit 2021 vor Geräten tummelt wie Milano und Centurion - ich hätte eher eine umgekehrte Reihenfolge erwartet.

Zündstoff bietet das bisher so vernachlässigte Ende der Elo-Liste, die private Turnierschach-Eloliste endet leider relativ früh im gehobenen Elo-Mittelfeld...und auch die alten SSDF-Listen halte ich in diesem "low-end"-Bereich für ziemlich ungenau.
Gerade deshalb hab ich mich ja bemüht endlich mal halbwegs verlässliche Referenzwerte zu liefern - ich wollte keineswegs die Aktivschachliste sprengen.

Womit wir beim springenden Punkt wären: die extrem niedrigen Werte der Oldies haben mich sehr überrascht - 352 für einen Mini Chess alias SciSys Junior Chess halte ich auch für ziemlich lächerlich.

Wohingegen Elo 500 - viel besser ist er wirklich nicht - er übersieht schon mal auf der höchsten Stufe ein Matt in 1...

Der Chess Challenger 7 wird in der aktuellen Aktiv-Liste mit 759 aufgeführt (um nicht zu sagen vorgeführt) - der alte SSDF-Turnierwert betrug ungefähr 1300 - eine erkleckliche Diskrepanz.

Mir schienen diese Werte für den CC 7 stets viel zu hoch - meine Einschätzung der Turnierelo des CC 7 liegt bei ca. 1000, auf Aktivschachstufe Level 2 etwas niedriger, da auf dieser Stufe die durchschnittliche Bedenkzeit weit unter 30 Sekunden liegt (das Handicap ist aber unvermeidbar, die nächsthöhere Stufe bringt Rechenzeiten über 1 Minute).

Für mich ebenso unglaublich, dass Mephisto I und Mephisto Junior die Schallmauer von 1000 Elo nicht durchbrechen können - und jetzt das Kuriose: in meiner persönlichen ELo-Liste liegen sie darüber...dabei benutze ich das gleiche Programm Elostat und auch die Partienbasis ist dieselbe !

Wie das ??

(Anmerkung: ich benutzte Elostat 1.3, laut Liste wurde Elostat 1.1 verwendet, aber auch diese Version liefert praktisch identische Werte +/- 1. Auch das geringfügig grössere offset -4,58 kann nicht als Begründung dienen).

Ich habe zwar eine andere Eichung vorgenommen (Bezugspunkt war für mich der Mephisto Rebell 5.0 mit Fixpunkt 1800 Elo), er erscheint in der offiziellen Aktivliste mit 1827. Dieser Unterschied kann natürlich auch auf die zusätzlichen 60 Partien zurückzuführen sein - soll hier aber vernachlässigbar sein.
Sehr gut korrelieren allerdings die gehobeneren Werte von meiner Liste mit der einzig wahren offiziellen Liste, auch stimmen hier die Gesamtpartien meist völlig überein, also kein Störfaktor. Aber die Werte der underdogs laufen gewaltig aus dem Ruder:

offiziell privat Differenz

Mythos 1941 1935 +6
Igor 1767 1771 -4
Excellence 1753 1740 +13
Europa A 1570 1593 -23
Merlin 16k 1470 1502 -32
Companion III 1159 1264 -105
Junior 936 1070 -134
Mephisto I 890 1029 -139
CC 7 759 908 -149
Equinox 759 905 -146
Prelude 671 824 -153
Pocket Chess 656 807 -168
Calculator 614 764 -150
Teufelchen 598 747 -149
Toytronic 593 743 -150
MK 7 550 701 -151
MK I 444 593 -149
Mini Chess 352 503 -151

Ist das ein Bug im Elostat-Programm - oder kann Herr Schubert das erklären ? Ich kapiers nicht.

Besitzt jemand ein anderes Elo-Programm ? Welche Werte liefert dieses ? Ich hab mir mal das Elo-Berechnungsprogramm von Remi Coulom Bayesian Elo besorgt, bin damit aber noch nicht vertraut und hab mit dem Programm so
meine liebe Mühe (http://remi.coulom.free.fr/Bayesian-Elo).
Gibt es noch andere (ist z.B. jemand im Besitz des alten SSDF-Programms) ?

Mir gefallen die Oldie-Werte meiner privaten Liste erheblich besser...
vielleicht finden wir ja den Grund für die doch gravierende Abwertung in der offiziellen Liste.
Das Spielen mit den Oldies war zum Teil schon nervenaufreibend - meist
jedoch sehr amüsant - ich hab dazu einen kleinen Artikel verfasst, wer möchte, kann sich dazu "Der schlechteste Zug" ansehen.

Nicht schlecht gestaunt habe ich auch über das m.E. viel zu hohe Einstiegsrating des Excalibur Grandmaster, besonders über den riesigen Ratingvorsprung des Grandmasters gegenueber dem realtiv unbekannten
und vielfach unterschätzten Excalibur Igor. Grandmaster steht mit 1929
zu Buche gegenüber eher bescheidenen 1767 seitens Igor - das sind satte 162 Punkte Differenz.
Das mag zum Teil an der Unzuverlässigkeit der Werte liegen - es sind einfach noch zu wenig Partien gespielt...ich bin mir sicher dass sich diese Werte noch annähern werden...wenn nicht gar eine Zusammenlegung erfolgt... denn m.E. sind Excalibur Grandmaster und Excalibur Igor zu 98% programmgleich. Grandmaster ist ca 3-4% schneller als Igor und die Mattankündigung wurde kosmetisch korrigiert...mehr Unterschiede im Programm kenne ich nicht.

Daher würde ich für eine Zusammenlegung der beiden plädieren - aber da sie nicht 100% identisch sind, kann ich auch mit einer getrennten Bewertung leben...

Kleiner Exkurs: was macht man beim Mephisto II ? Den gibt es serienmässig in 2 Geschwindigkeitsversionen mit 3,5 MHz bzw. 6,1 MHz - selbst die Geschwindigkeit bei Batteriebetrieb unterscheidet sich wesentlich vom Netzbetrieb. Getrennt werten oder alles zusammenlegen ?

Ich hatte gedacht, dass eine solche Zusammenbewertung auch beim Mythos erfolgen würde, ist er doch laut thread in der community mit dem GK 2000 baugleich. Dieser residiert aber mit einem Abstand von 59 Punkten dahinter
(Mythos 1941 - GK 2000 mit Elo 1882). Kann gut sein, dass hier die Wahrheit in der Mitte liegt.
Wenn ich richtig informiert bin ist der Kishon Chesster mit dem Designer 2000 programmgleich, auch hier finden sich beachtliche 79 Punkte Elo-Differenz(Designer 2000 mit Elo 1916 - Kishon Chesster 1837). Sollten sie wirklich programmgleich sein, scheint mir der Wert des Kishon Chesster realistischer.

Bau- bzw. Programmgleichheit ist auch ein ganz heisses Eisen im low-budget-Bereich: wer bisher vergeblich sein kostengünstiges Gerät in der Liste sucht, muss nicht verzweifeln. Es gibt da ein unscheinbares Mauerblümchen, das die vielfältigsten Blüten treibt: der Schneider Pocket Chess.

Ich habe den Verdacht, dass der Schneider Pocket Chess womöglich programmgleich ist mit vielen anderen "Spielzeuggeräten", (geringfügige Unterschiede in der Taktfrequenz möglich): z.B.

Fidelity Micro Chess Challenger
Sphinx Royal
Sphinx Supra
CXG Granada
CXG Pocket Chess
Fidelity Tiny Chess
Womöglich ein wahres Chamäleon dieser Schneider Pocket Chess - da gibt`s einiges zu testen... und bei positivem Befund viele neue Programme in der Aktivschach-Eloliste !
Wo ich gerade dabei bin...der Toytronic Chess Electronics ist meines Wissens identisch mit Fidelity Chess Challenger 10A und Caissa Chess Mate.

Ich fände es gut wenn man bei gesicherter Programmgleichheit auch die "verwandten" Brettcomputer mit in die Liste aufnehmen würde.

Noch zwei - zugegebenermassen - extrem pedantische Anmerkungen zur Aktivschach-Eloliste: Rebell 5.0 - das Modul schreibt sich - im Gegensatz zum PC Programm mit Doppel-l. Noch kritikastischer: bei Kishon Chesster sollte bei 88 Partien ein F statt des P stehen.

Bitte als Kompliment auffassen : mehr gibt es nicht zu kritisieren an Eurer 1. Aktivschach-Eloliste !

In diesem Zusammenhang: vielleicht sollte man das Vergabekriterium für
R und M auflockern, stattdessen nur abhängig machen von der Anzahl der Spiele (wenn ein Computer 150 oder 300 Partien in der Liste absolviert hat -zeigt die Erfahrung dass dies gegen mehrere Gegner geschehen ist - und somit genügend stabil. Ich würde da keine bestimmte Prozentzahl mehr fordern (30% bzw. 60% Limit), erscheint mir unnötig kompliziert und überfrachtet.
Je grösser die Liste wird umso unsinniger wird diese Forderung - was sollte
z.B. ein Wettkampf Resurrection gegen Mini Chess bringen - elomässig absolut unergiebig, nur um das utopische Prozent M-Kriterium zu erfüllen ?
Sehr wünschenswert wäre die Veröffentlichung der programm.dat im Statistikteil, um zu sehen welche Wettkämpfe schon (komplett) absolviert wurden - eine wichtige Orientierungshilfe.

Interessant wäre auch eine Liste der "Überhangmandate" - welche Geräte
haben zwar schon gespielt - aber noch nicht genügend Partien - sie könnte man mit Leichtigkeit in die nächste Liste schubsen...
SuperSensor IV, Boris Diplomat und Super VIP sind 3 der Kandidaten, die ich bereits kenne...Boris haette ich gern in der ersten Liste gesehen, aber ach, mein Diplomat tut's leider nicht mehr...vielleicht erbarmt sich jemand und spielt noch 5 Partien gegen einen anderen Listen-Oldie.

Uff - dies meine Anmerkungen zur 1. Aktivschach-Eloliste - fast so lang
wie diese selbst... (das kommt davon wenn man die Diskussion eröffnet...)
Ich freue mich schon auf die 2. !!


Viele Grüße

Hans-Jürgen




Mit Zitat antworten
  #5  
Alt 08.06.2005, 20:47
Benutzerbild von Chessguru
Chessguru Chessguru ist offline
Administrator
 
Registriert seit: 29.06.2004
Ort: Rostock
Alter: 55
Land:
Beiträge: 6.478
Bilder: 1
Abgegebene Danke: 1.589
Erhielt 4.587 Danke für 1.381 Beiträge
Member Photo Albums
Aktivitäten Langlebigkeit
10/20 20/20
Heute Beiträge
0/3 sssss6478
AW: 1. Aktivschachliste

Hallo kosakenzipfel (wie bis du eigentlich auf diesen Namen gekommen? Loriot? Oder hast etwa einem armen Kosaken den, naja wie auch immer ),

ja, ich finde auch, der Auftakt sieht nicht schlecht aus. Wie man ja an der Vielzahl der Partien sieht, wird diese Liste wohl sehr viel schneller wachsen, als unsere Turnierliste. Zumal aus meiner Sicht der Anreiz gegenüber neuen Partien doch etwas größer geworden ist. Irgendwie macht es die Sache einfach noch unterhaltsamer.

Womit wir auch schon bei dem Thema Updates wären. Einen festen Zeitplan haben wir nicht. Es hängt einfach davon ab, wie schnell bzw. wie viele neue Partien wir bekommen. Aber das sollte ja kein Problem darstellen, du bist ja einer der vielen aktiven Spieler in unseren Reihen. Ich glaube, dass erste Update wird schon sehr bald kommen.
Wenn du an allen Partien interessiert bist, kann ich dir die Datenbank gerne zuschicken. Wie viele Dubletten es am Ende waren, weiß ich ehrlich gesagt nicht mehr, vielleicht weiß das Stefan noch. Im Grunde haben wir alles was wir finden konnten in eine Datenbank geworfen und dann auf Dubletten überprüft. Dabei wurden einige doppelte Partien gefunden, aber wie viele es waren, ich weiß es nicht mehr.

Viele Grüße,
Micha
Mit Zitat antworten
  #6  
Alt 09.06.2005, 01:46
Benutzerbild von Chessguru
Chessguru Chessguru ist offline
Administrator
 
Registriert seit: 29.06.2004
Ort: Rostock
Alter: 55
Land:
Beiträge: 6.478
Bilder: 1
Abgegebene Danke: 1.589
Erhielt 4.587 Danke für 1.381 Beiträge
Member Photo Albums
Aktivitäten Langlebigkeit
10/20 20/20
Heute Beiträge
0/3 sssss6478
AW: 1. Aktivschachliste

Hallo Hans-Jürgen,

vielen Dank für die kurzen Anmerkungen.
 Zitat von CC 7
Zündstoff bietet das bisher so vernachlässigte Ende der Elo-Liste, die private Turnierschach-Eloliste endet leider relativ früh im gehobenen Elo-Mittelfeld...und auch die alten SSDF-Listen halte ich in diesem "low-end"-Bereich für ziemlich ungenau.
Gerade deshalb hab ich mich ja bemüht endlich mal halbwegs verlässliche Referenzwerte zu liefern - ich wollte keineswegs die Aktivschachliste sprengen.
nun ja, wir würden ja sehr gerne auch genannte Klassiker in unsere Turnierliste aufnehmen. Es fehlt aber an den nötigen Partien. Hinzu kommt die Tatsache, dass einige dieser Geräte keine Turnierstufe bieten. Die Werte in der SSDF sind für mich immer schwer zu beurteilen, da mir entsprechendes Partienmaterial nicht zur Verfügung steht. Somit kann ich nicht erkennen, ob sich um Schätzwerte handelt oder diese Zahlen auf tatsächlich gespielten Partien basieren. Daher finde ich es wirklich klasse, das du dir die Zeit genommen hast und diese schon in Vergessenheit geratenen Klassiker neu belebt hast.

Zitieren:
Womit wir beim springenden Punkt wären: die extrem niedrigen Werte der Oldies haben mich sehr überrascht - 352 für einen Mini Chess alias SciSys Junior Chess halte ich auch für ziemlich lächerlich.
Wohingegen Elo 500 - viel besser ist er wirklich nicht - er übersieht schon mal auf der höchsten Stufe ein Matt in 1...
Tja, da sind wir genau bei dem Knackpunkt. Wie spielt ein Spieler mit 352 Elo bzw. 500 Elo? Gibt es da überhaupt einen Unterschied? Die FIDE Elo Zahlen beginnen z.B. erst bei 1200.
Die ermittelten Elo Zahlen sind aus meiner Sicht als rein statistische Werte anzusehen, die sich halt aus den vorliegenden Partien errechnen.

Zitieren:
Der Chess Challenger 7 wird in der aktuellen Aktiv-Liste mit 759 aufgeführt (um nicht zu sagen vorgeführt) - der alte SSDF-Turnierwert betrug ungefähr 1300 - eine erkleckliche Diskrepanz.
Schwierig. Versuchen wir die Sache mit einem kleinen Beispiel zu erläutern. OK, schauen wir uns einfach einmal die gespielten Partien bzw. deren Ergebnisse an. CC7 spielte z.B. gegen den Mephisto Junior (Elo 936) 10 Partien. Davon verlor er 9. Der Mephisto Junior hingegen verlor gegen Merlin 16K (Elo 1470) 0:10 und gegen Chess Companion III (1159) 2:8. Diese Quervergleiche kann man weiter fortführen. Wenn CC7 wirklich eine Elo von ca. 1300 haben sollte, müsste er diese Zahl in Partien auch nachweisen, d.h. er sollte gegen Geräte wie Junior oder Chess Companion III auch entsprechend punkten können. Dem ist aber nicht so. Somit ergibt sich halt rein rechnerische die Zahl von 759. Wobei immer wieder darauf hingewiesen werden muss, dass es um die Abstände zwischen den Geräte geht.

Zitieren:
Mir schienen diese Werte für den CC 7 stets viel zu hoch - meine Einschätzung der Turnierelo des CC 7 liegt bei ca. 1000, auf Aktivschachstufe Level 2 etwas niedriger, da auf dieser Stufe die durchschnittliche Bedenkzeit weit unter 30 Sekunden liegt (das Handicap ist aber unvermeidbar, die nächsthöhere Stufe bringt Rechenzeiten über 1 Minute).
Hierbei sollte nicht vergessen werden, dass sich die Turnierstufe deutlich von der Aktivstufe unterscheidet. An die 1300 Elo in der SSDF kann ich nicht glauben. Ich halte es für einen Schätzwert. Wie gesagt, ohne auswertbare Partien bringen diese Zahlen in der SSDF nichts.

Zitieren:
Für mich ebenso unglaublich, dass Mephisto I und Mephisto Junior die Schallmauer von 1000 Elo nicht durchbrechen können - und jetzt das Kuriose: in meiner persönlichen ELo-Liste liegen sie darüber...dabei benutze ich das gleiche Programm Elostat und auch die Partienbasis ist dieselbe !

Wie das ??
Der Vergleich hinkt gewaltig. Die Partienbasis ist eben nicht identisch. Identisch sind nur die von dir gespielten Partien, aber nicht die Partienbasis. Denn als Basis dienen uns über 3000 Partien. Aufbauend auf dieser Basis von ca. 3000 Partien wurden diese Werte ermittelt. Das ist der entscheidende Unterschied, denn die Referenzwerte der anderen Geräte verändern sich doch dadurch massiv. Hinzu kommt das Problem, dass "deine" Geräte fast nur untereinander gespielt haben, was eine Auswertung erschwert. Wenn du möchtest, kannst du dir ein Posting von mir dazu anschauen. Dort sind wir auf eben diese Punkte schon einmal eingegangen.

Das Problem lässt sich aber recht einfach lösen. Lass einfach den CC7 gegen Geräte antreten, die sich in dem von dir erwarteten Elo Bereich tummeln. Wenn der CC7 ca. 1000 Elo hat, sollte er gegen den Chess Companion III (1159 Elo) einen Vergleich entsprechend Gewinnerwartungsliste (3:7 lt. Theorie) gestalten können. Partien sind aus meiner Sicht das sicherste Argument.

Wie viele Partien bzw. Geräte finden sich in deiner Datenbank?

Zitieren:
Sehr gut korrelieren allerdings die gehobeneren Werte von meiner Liste mit der einzig wahren offiziellen Liste, auch stimmen hier die Gesamtpartien meist völlig überein, also kein Störfaktor. Aber die Werte der underdogs laufen gewaltig aus dem Ruder:
Welche ist denn für dich die einzige wahre Liste?

Zitieren:
Nicht schlecht gestaunt habe ich auch über das m.E. viel zu hohe Einstiegsrating des Excalibur Grandmaster, besonders über den riesigen Ratingvorsprung des Grandmasters gegenueber dem realtiv unbekannten
und vielfach unterschätzten Excalibur Igor. Grandmaster steht mit 1929
zu Buche gegenüber eher bescheidenen 1767 seitens Igor - das sind satte 162 Punkte Differenz.
Das mag zum Teil an der Unzuverlässigkeit der Werte liegen - es sind einfach noch zu wenig Partien gespielt...ich bin mir sicher dass sich diese Werte noch annähern werden...wenn nicht gar eine Zusammenlegung erfolgt...
Daher würde ich für eine Zusammenlegung der beiden plädieren - aber da sie nicht 100% identisch sind, kann ich auch mit einer getrennten Bewertung leben...
Schau dir einfach mal die angegebenen Schwankungsbreiten bzw. Partienanzahl an. GM hat erst 46 und Igor gar erst 30 Partien. Es ist doch unsere erste Liste, es ist ein Anfang, mehr nicht. Die Sache wird sich im Laufe der Zeit ganz von alleine richten. Je mehr Partien wir bekommen, um so besser oder genauer wird die Liste. Es liegt doch nur an uns.
Sollten GM und Igor identisch sein, werden wir sie natürlich zusammenlegen. Das haben wir in der Turnierliste doch auch schon gemacht. Dafür sind doch diese Diskussionen gedacht. Unsere Elo Listen basieren auf der Arbeit aller Community Mitglieder und sollte jemand aus unseren Reihen Fehler, Anregungen, Ideen, Kritik, was auch immer zu diesen Listen äußern, ist das grundsätzlich erwünscht bzw. wird sogar erwartet. Noch mal, wir sind eine Community, nicht eine Ein-Mann-Show. Das habe ich aber schon sehr häufig geäußert. Diese Seiten, unsere Seiten leben nur durch die Mitarbeit aller Mitglieder.

Zitieren:
Kleiner Exkurs: was macht man beim Mephisto II ? Den gibt es serienmässig in 2 Geschwindigkeitsversionen mit 3,5 MHz bzw. 6,1 MHz - selbst die Geschwindigkeit bei Batteriebetrieb unterscheidet sich wesentlich vom Netzbetrieb. Getrennt werten oder alles zusammenlegen ?
Das ist einfach zu beantworten. Wenn ein deutlicher Unterschied besteht, sollten die Geräte getrennt bewertet werden.

Zitieren:
Ich hatte gedacht, dass eine solche Zusammenbewertung auch beim Mythos erfolgen würde, ist er doch laut thread in der community mit dem GK 2000 baugleich. Dieser residiert aber mit einem Abstand von 59 Punkten dahinter
(Mythos 1941 - GK 2000 mit Elo 1882). Kann gut sein, dass hier die Wahrheit in der Mitte liegt.
Wenn ich richtig informiert bin ist der Kishon Chesster mit dem Designer 2000 programmgleich, auch hier finden sich beachtliche 79 Punkte Elo-Differenz(Designer 2000 mit Elo 1916 - Kishon Chesster 1837). Sollten sie wirklich programmgleich sein, scheint mir der Wert des Kishon Chesster realistischer.
Ich kenne den Mythos nicht. Wenn er baugleich mit dem GK2000 ist, legen wir die Geräte natürlich zusammen, guter Hinweis.
Beim Kishon Chesster bin ich mir nicht sicher. Ich glaube der Chesster ist etwas schneller, bin mir aber nicht sicher. Vielleicht können andere Mitglieder dazu etwas sagen. Sollten sie baugleich sein, dann, wie gesagt, werden sie zusammengelegt.

Zitieren:
Ich fände es gut wenn man bei gesicherter Programmgleichheit auch die "verwandten" Brettcomputer mit in die Liste aufnehmen würde.
Das machen wir zum Teil doch schon. Bei einigen Geräten findest du mehrere Bezeichungen, sowohl in der Turnier-, als auch in der Aktiv-Liste. Wenn du weitere baugleiche Geräte kennst bzw. vermutest, dann immer raus damit.

Zitieren:
Bitte als Kompliment auffassen : mehr gibt es nicht zu kritisieren an Eurer 1. Aktivschach-Eloliste !
Ach das ist schon ok. Wie gesagt, wenn dir Sachen auffallen, immer raus damit. Konstruktive Kritik ist bei uns immer willkommen.

Zitieren:
In diesem Zusammenhang: vielleicht sollte man das Vergabekriterium für
R und M auflockern, stattdessen nur abhängig machen von der Anzahl der Spiele (wenn ein Computer 150 oder 300 Partien in der Liste absolviert hat -zeigt die Erfahrung dass dies gegen mehrere Gegner geschehen ist - und somit genügend stabil. Ich würde da keine bestimmte Prozentzahl mehr fordern (30% bzw. 60% Limit), erscheint mir unnötig kompliziert und überfrachtet.
Ja und Nein. Eine breit gestreute Gegnerschar mit vielen Partien gegen eben diese Auswahl, sollte es schon sein. Wobei natürlich der Elo Durchschnitt entsprechend berücksichtig werden muss, völlig klar.
Wobei ich die Prozentzahlen als nicht so unnötig ansehe. Ob es nun zwingend 30 oder 60 % sein müssen, darüber lässt sich sicherlich diskutieren, aber um eine gefestigte Aussage hinsichtlich einer Elo Zahlen machen zu können, sollte der Gegnerschnitt eben nicht nur auf ein paar Geräte beschränkt bleiben. 300 Partien gegen 60% der Geräte, halte ich in der Turnierliste unter den momentanen Voraussetzungen für durchaus sinnvoll. Ob es für die Aktivschach Liste unter den jetzigen Bedingungen sinnvoll ist, wird sich zeigen. Die Schwankungsbreite an Spielstärke ist dort doch ziemlich groß.

Zitieren:
Je grösser die Liste wird umso unsinniger wird diese Forderung - was sollte
z.B. ein Wettkampf Resurrection gegen Mini Chess bringen - elomässig absolut unergiebig, nur um das utopische Prozent M-Kriterium zu erfüllen ?
Naja, gefodert sind solche Vergleiche ja nicht. Das Kriterium besagt nur, 300 Partien gegen 60% (momentan 47) der Geräte. Und so utopisch ist das gar nicht. Der Milano z.B. hat schon 201 Partien gegen 37 Gegner gespielt, ist also nicht mehr weit von dieser Marke entfernt.

Zitieren:
Sehr wünschenswert wäre die Veröffentlichung der programm.dat im Statistikteil, um zu sehen welche Wettkämpfe schon (komplett) absolviert wurden - eine wichtige Orientierungshilfe.


Hm, also eigentlich erreicht man durch Anklicken der entsprechenden Geräte genau das. Sowohl in der Turnier-, als auch in der Aktiv-Liste ist die programm.dat mit eingearbeitet. Schau dir das noch einmal an. Das macht die ganze Sache ja so aufwendig.

Zitieren:
Interessant wäre auch eine Liste der "Überhangmandate" - welche Geräte
haben zwar schon gespielt - aber noch nicht genügend Partien - sie könnte man mit Leichtigkeit in die nächste Liste schubsen...
SuperSensor IV, Boris Diplomat und Super VIP sind 3 der Kandidaten, die ich bereits kenne...Boris haette ich gern in der ersten Liste gesehen, aber ach, mein Diplomat tut's leider nicht mehr...vielleicht erbarmt sich jemand und spielt noch 5 Partien gegen einen anderen Listen-Oldie.
Ja richtig. Das habe ich vor der ersten Liste auch schon mal gemacht. Wir können das gerne beibehalten. Ich werde in den kommenden Tagen eine entsprechende Liste veröffentlichen. Wobei du nicht vergessen darfst, dass 15 Partien gegen Geräte gespielt werden müssen, die sich schon in der Liste befinden, Ansonsten wird eine Auswertung per EloStat nicht (sinnvoll) möglich .

Zitieren:
Uff - dies meine Anmerkungen zur 1. Aktivschach-Eloliste - fast so lang
wie diese selbst... (das kommt davon wenn man die Diskussion eröffnet...)
Ich freue mich schon auf die 2. !!
Na das war doch super. Bitte mehr Diskussionen dieser Art.

Viele Grüße,
Micha

Geändert von Chessguru (09.06.2005 um 17:13 Uhr)
Mit Zitat antworten
  #7  
Alt 09.06.2005, 11:51
Benutzerbild von Robert
Robert Robert ist offline
Lebende Foren Legende
 
Registriert seit: 30.06.2004
Ort: Regensburg
Alter: 60
Land:
Beiträge: 4.179
Abgegebene Danke: 1.782
Erhielt 783 Danke für 464 Beiträge
Aktivitäten Langlebigkeit
6/20 20/20
Heute Beiträge
0/3 sssss4179
AW: 1. Aktivschachliste

 Zitat von CC 7
[size=2]Hallo !

Nicht schlecht gestaunt habe ich auch über das m.E. viel zu hohe Einstiegsrating des Excalibur Grandmaster, besonders über den riesigen Ratingvorsprung des Grandmasters gegenueber dem realtiv unbekannten
und vielfach unterschätzten Excalibur Igor. Grandmaster steht mit 1929
zu Buche gegenüber eher bescheidenen 1767 seitens Igor - das sind satte 162 Punkte Differenz.
Das mag zum Teil an der Unzuverlässigkeit der Werte liegen - es sind einfach noch zu wenig Partien gespielt...ich bin mir sicher dass sich diese Werte noch annähern werden...wenn nicht gar eine Zusammenlegung erfolgt... denn m.E. sind Excalibur Grandmaster und Excalibur Igor zu 98% programmgleich. Grandmaster ist ca 3-4% schneller als Igor und die Mattankündigung wurde kosmetisch korrigiert...mehr Unterschiede im Programm kenne ich nicht.
Ich denke, am einfachsten kann man Programmgleichheiten dadurch entdecken, indem man versucht, komplette Partien mit dem jeweils anderen Gerät nachzuvollziehen. Und sollten >95(?)% der Züge identisch sein, kann man wohl von identischen Programmen und Hardware ausgehen. Abweichungen könnten natürlich durch pB oder einen übereifrigen Zufallsgenerator hervorgerufen werden (mal abgesehen von diesem minimalen Geschwindigkeitsunterschied)

Ich würde also vorschlagen, Partien dieser beiden hier zu veröffentlichen!
Zitieren:
Wenn ich richtig informiert bin ist der Kishon Chesster mit dem Designer 2000 programmgleich, auch hier finden sich beachtliche 79 Punkte Elo-Differenz(Designer 2000 mit Elo 1916 - Kishon Chesster 1837). Sollten sie wirklich programmgleich sein, scheint mir der Wert des Kishon Chesster realistischer.
Würde ich eigentlich auch meinen; allerdings sollten wir uns hier nicht unbedingt automatisch an den Werten der SSDF- bzw. Turnier-Liste orientieren; ein Gerät kann ja im Schnellschach besser oder schlechter sein als auf Turnierstufe!

Übrigens soll auch der Excellence das gleiche Programm beinhalten wie der D2000 (was sich bei mir in einem (allerdings nur oberflächlichen Test) auch bestätigt hat); allerdings gab es den Excellence ja auch als 4 Mhz-Version, was die Sache etwas schwierig macht...
Zitieren:
Wo ich gerade dabei bin...der Toytronic Chess Electronics ist meines Wissens identisch mit Fidelity Chess Challenger 10A und Caissa Chess Mate.
Ist der nicht etwas langsamer getaktet (wegen des Batteriebetriebs) oder verwechsle ich das jetzt mit dem Boris/Boris Diplomat?
Zitieren:
SuperSensor IV, Boris Diplomat und Super VIP sind 3 der Kandidaten, die ich bereits kenne...Boris haette ich gern in der ersten Liste gesehen, aber ach, mein Diplomat tut's leider nicht mehr...vielleicht erbarmt sich jemand und spielt noch 5 Partien gegen einen anderen Listen-Oldie.
Mal sehen, ob's meiner noch tut!


viele Grüße,
Robert
Mit Zitat antworten
  #8  
Alt 09.06.2005, 18:01
kosakenzipfel kosakenzipfel ist offline
SPARC
 
Registriert seit: 12.08.2004
Beiträge: 229
Abgegebene Danke: 1
Erhielt 29 Danke für 5 Beiträge
Aktivitäten Langlebigkeit
0/20 20/20
Heute Beiträge
0/3 ssssss229
AW: 1. Aktivschachliste

Hallo Micha,

 Zitat von Chessguru
Hallo kosakenzipfel (wie bis du eigentlich auf diesen Namen gekommen? Loriot? Oder hast etwa einem armen Kosaken den, naja wie auch immer ),
natürlich Loriot! Da ich weder ein Hals-, noch ein Ehr-, noch ein Abschneider von Sonstigem bin, bitte schön!

Auch ich hätte ein/ zwei Fragen zur Liste. Ich bin aber dafür, das per Mail zu machen. Nicht, um was zu tuscheln, sondern um das Forum nicht mit zahlreichen Kleinigkeiten aufzublasen, die dann nach der Korrektur eh Schnee von gestern sind. Der Webspace kostet schließlich Geld, das der Admin zahlen muss.

In diesem Zusammenhang hätte ich einen Wunsch an die anderen Poster: Wenn schon die Zitatfunktion benutzt wird, beschränkt euch doch auf die Stellen, zu denen ihr tatsächlich was anzumerken habt. Die komplette Wiederholung ganzer, vor allem langer Postings inklusive Gruß und Abschied, zumal wenn die Antwort ohnehin direkt auf das Zitierte folgt, ist nicht nur für den Leser nervig. Die Threads und das Forum insgesamt werden nur unnötig aufgebläht. Wenn Micha Partien, also nützliche Infos, nicht mehr online stellen kann, weil der Webspace eben teuer ist, sollte das Forum nicht mit überflüssigen MB´s nutzloser Wiederholungen aufgeblasen werden.

 Zitat von Chessguru
Wenn du an allen Partien interessiert bist, kann ich dir die Datenbank gerne zuschicken.
Wie groß ist die DB jetzt?

Viele Grüße
kosakenzipfel
Mit Zitat antworten
  #9  
Alt 09.06.2005, 19:52
Benutzerbild von Stefan
Stefan Stefan ist offline
Mephisto Wundermaschine
 
Registriert seit: 01.07.2004
Ort: Dresden
Alter: 58
Land:
Beiträge: 495
Abgegebene Danke: 2
Erhielt 10 Danke für 9 Beiträge
Aktivitäten Langlebigkeit
0/20 20/20
Heute Beiträge
0/3 ssssss495
AW: 1. Aktivschachliste

Hallo Hans-Jürgen,

zunächst einmal vielen Dank für Deinen ausführlichen Beitrag, auch von mir noch ein paar Anmerkungen (Micha hat vieles ja schon dargelegt):

 Zitat von CC 7

...
Womit wir beim springenden Punkt wären: die extrem niedrigen Werte der Oldies haben mich sehr überrascht - 352 für einen Mini Chess alias SciSys Junior Chess halte ich auch für ziemlich lächerlich.

Wohingegen Elo 500 - viel besser ist er wirklich nicht - er übersieht schon mal auf der höchsten Stufe ein Matt in 1...
...

Für mich ebenso unglaublich, dass Mephisto I und Mephisto Junior die Schallmauer von 1000 Elo nicht durchbrechen können - und jetzt das Kuriose: in meiner persönlichen ELo-Liste liegen sie darüber...dabei benutze ich das gleiche Programm Elostat und auch die Partienbasis ist dieselbe !

Wie das ??
Es macht meiner Ansicht nach nicht allzuviel Sinn über absolute ELO-Werte zu sprechen bzw. diese mit anderen Listen zu vergleichen. ELO-Stat funktioniert mit einem rein mathematischen Näeherungsverfahren, mit dem man durch geeignete Wahl des Startwerts JEDE ELO-Zahl erzeugen kann. Wenn wir 1900 als Startwert gewählt hätten, wäre halt jedes Gerät um 100 Punkte höher eingestuft worden. Der aus meiner Sicht geeignetere Diskusionsansatz ist der direkte Vergleich zweier Geräte, also wenn man darüber philisophiert, daß z. B. in einer Liste X der Abstand zwischen zwei Geräten A und B 50 Punkte beträgt, in Liste Y hingegen 100 Punkte.

Die Frage was 350 ELO-Punkte schachlich bedeuten vermag ich nicht zu beantworten, aber mahr als ein Zuggenerator kann das nicht sein.
 Zitat von CC 7

(Anmerkung: ich benutzte Elostat 1.3, laut Liste wurde Elostat 1.1 verwendet, aber auch diese Version liefert praktisch identische Werte +/- 1. Auch das geringfügig grössere offset -4,58 kann nicht als Begründung dienen).
Ich habe es gecheckt beide Versionen erzeugen dieselben ELO-Zahlen, lediglich die Schwankungsbreite ist in der neuen Version anders. Das liegt wohl an dem neu implementierten Berechnungsverfahren nichtparametrische ABC-Methode (Approximated Bootstrap Confidence)) nach Efron und Tibshirani, welches ab Version 1.3 implementiert wurde. Wir werden aber ab sofort die neueste Version verwenden, das ist kein Problem.
 Zitat von CC 7

Sehr gut korrelieren allerdings die gehobeneren Werte von meiner Liste mit der einzig wahren offiziellen Liste, auch stimmen hier die Gesamtpartien meist völlig überein, also kein Störfaktor. Aber die Werte der underdogs laufen gewaltig aus dem Ruder:

offiziell privat Differenz

Mythos 1941 1935 +6
Igor 1767 1771 -4
Excellence 1753 1740 +13
Europa A 1570 1593 -23
Merlin 16k 1470 1502 -32
Companion III 1159 1264 -105
Junior 936 1070 -134
Mephisto I 890 1029 -139
CC 7 759 908 -149
Equinox 759 905 -146
Prelude 671 824 -153
Pocket Chess 656 807 -168
Calculator 614 764 -150
Teufelchen 598 747 -149
Toytronic 593 743 -150
MK 7 550 701 -151
MK I 444 593 -149
Mini Chess 352 503 -151

Ist das ein Bug im Elostat-Programm - oder kann Herr Schubert das erklären ? Ich kapiers nicht.
...
Mir gefallen die Oldie-Werte meiner privaten Liste erheblich besser...
vielleicht finden wir ja den Grund für die doch gravierende Abwertung in der offiziellen Liste.
Ist eigentlich ganz einfach, wir haben nicht die gleiche Partienbasis, Du hast in Deiner Datei nur Deine Partien während wir halt ca. 2600 Partien haben. Ich zitiere nochmal aus der Programmbeschreibung zu ELO-Stat:

"Die Leistungsfähigkeit des oben beschriebenen Iterationsalgorithmus beruht u.a. darauf, dass zwischen zwei Programmen A und C ein indirekter Spielstärkebezug hergestellt werden kann, selbst wenn A und C nie direkt gegeneinander gespielt haben. Hat z.B. das Programm A meh-rere Partien gegen B gespielt und B wiederum einige Partien gegen C, so reicht dies aus, um die Elozahlen aller drei beteiligten Programme im Sinne des Iterationsverfahrens konvergie-ren zu lassen. A, B, und C bilden somit einen zusammenhängenden Cluster. Die oben im Bei-spiel behandelte Datenbank ‘wb_elo.pgn’ besteht aus einem einzelnen Cluster, d.h. geht man von einem beliebigen Programm aus, so läß sich zu JEDEM anderen Programm der Daten-bank ein Spielstärkebezug im obigen Sinne ableiten. Jede gute Datenbank sollte daher aus einem einzelnen Programmcluster bestehen und somit unfragmentiert sein (im Idealfall hat jeder gegen jeden gespielt)."

Die Lösung ist, daß wir zwei völlig verschiedene Cluster verwenden, das kann nicht zu identischen Ergebnissen führen. Der letzte Satz beantwortet übrigens auch die Frage (zumindest aus mathematischer Sicht), ob ein Gerät möglichst gegen viele Geräte oder nur gegen gleichwertige Geräte spielen sollte, um zu einem brauchbaren Ergebnis zu kommen. Ob das aus schachlicher Sicht Sinn macht, ist natürlich eine andere Frage...

Ich hoffe mit diesem kleinen Exkurs noch einmal ein wenig zum Verständnis unseres Ansatzes beigetragen zu haben.

Viele Grüße
Stefan

Geändert von Stefan (09.06.2005 um 22:25 Uhr)
Mit Zitat antworten
  #10  
Alt 10.06.2005, 22:33
Benutzerbild von Chessguru
Chessguru Chessguru ist offline
Administrator
 
Registriert seit: 29.06.2004
Ort: Rostock
Alter: 55
Land:
Beiträge: 6.478
Bilder: 1
Abgegebene Danke: 1.589
Erhielt 4.587 Danke für 1.381 Beiträge
Member Photo Albums
Aktivitäten Langlebigkeit
10/20 20/20
Heute Beiträge
0/3 sssss6478
AW: 1. Aktivschachliste

Hallo Jungs,

momentan überarbeiten wir die erste Aktivschach Elo Liste. Dabei werden einige Geräte aufgrund von diversen Postings zusammengefasst. Bei diesen Geräten können wir wohl von gesicherten Erkenntnissen ausgehen.

Als da wären:

Designer 2000 - Kishon Chesster
GK 2100 - Centurion
Europa - Europa A

Weitere Verdächtige (Mythos-GK 2000 ?) wurden ja schon genannt. Bitte schaut euch die Liste noch einmal an und wenn von gesicherten Ergebnissen ausgegangen werden kann, dann meldet euch bitte.

Vielen Dank.

Gruß,
Micha
Mit Zitat antworten
Antwort

Themen-Optionen
Ansicht

Forumregeln
Du bist nicht berechtigt, neue Themen zu erstellen.
Du bist nicht berechtigt, auf Beiträge zu antworten.
Du bist nicht berechtigt, Anhänge hochzuladen.
Du bist nicht berechtigt, deine Beiträge zu bearbeiten.

BB code ist An
Smileys sind An.
[IMG] Code ist An.
HTML-Code ist An.

Gehe zu

Ähnliche Themen
Thema Erstellt von Forum Antworten Letzter Beitrag
Überarbeitete Aktivschachliste Robert Teststellungen und Elo Listen / Test positions and Elo lists 6 20.06.2005 20:38


Alle Zeitangaben in WEZ +1. Es ist jetzt 06:42 Uhr.



Powered by vBulletin (Deutsch)
Copyright ©2000 - 2024, Jelsoft Enterprises Ltd.
©Schachcomputer.info