Einzelnen Beitrag anzeigen
  #6  
Alt 09.06.2005, 01:46
Benutzerbild von Chessguru
Chessguru Chessguru ist offline
Administrator
 
Registriert seit: 29.06.2004
Ort: Rostock
Alter: 55
Land:
Beiträge: 6.519
Abgegebene Danke: 1.652
Erhielt 4.691 Danke für 1.402 Beiträge
Member Photo Albums
Aktivitäten Langlebigkeit
9/20 20/20
Heute Beiträge
0/3 sssss6519
AW: 1. Aktivschachliste

Hallo Hans-Jürgen,

vielen Dank für die kurzen Anmerkungen.
 Zitat von CC 7
Zündstoff bietet das bisher so vernachlässigte Ende der Elo-Liste, die private Turnierschach-Eloliste endet leider relativ früh im gehobenen Elo-Mittelfeld...und auch die alten SSDF-Listen halte ich in diesem "low-end"-Bereich für ziemlich ungenau.
Gerade deshalb hab ich mich ja bemüht endlich mal halbwegs verlässliche Referenzwerte zu liefern - ich wollte keineswegs die Aktivschachliste sprengen.
nun ja, wir würden ja sehr gerne auch genannte Klassiker in unsere Turnierliste aufnehmen. Es fehlt aber an den nötigen Partien. Hinzu kommt die Tatsache, dass einige dieser Geräte keine Turnierstufe bieten. Die Werte in der SSDF sind für mich immer schwer zu beurteilen, da mir entsprechendes Partienmaterial nicht zur Verfügung steht. Somit kann ich nicht erkennen, ob sich um Schätzwerte handelt oder diese Zahlen auf tatsächlich gespielten Partien basieren. Daher finde ich es wirklich klasse, das du dir die Zeit genommen hast und diese schon in Vergessenheit geratenen Klassiker neu belebt hast.

Zitieren:
Womit wir beim springenden Punkt wären: die extrem niedrigen Werte der Oldies haben mich sehr überrascht - 352 für einen Mini Chess alias SciSys Junior Chess halte ich auch für ziemlich lächerlich.
Wohingegen Elo 500 - viel besser ist er wirklich nicht - er übersieht schon mal auf der höchsten Stufe ein Matt in 1...
Tja, da sind wir genau bei dem Knackpunkt. Wie spielt ein Spieler mit 352 Elo bzw. 500 Elo? Gibt es da überhaupt einen Unterschied? Die FIDE Elo Zahlen beginnen z.B. erst bei 1200.
Die ermittelten Elo Zahlen sind aus meiner Sicht als rein statistische Werte anzusehen, die sich halt aus den vorliegenden Partien errechnen.

Zitieren:
Der Chess Challenger 7 wird in der aktuellen Aktiv-Liste mit 759 aufgeführt (um nicht zu sagen vorgeführt) - der alte SSDF-Turnierwert betrug ungefähr 1300 - eine erkleckliche Diskrepanz.
Schwierig. Versuchen wir die Sache mit einem kleinen Beispiel zu erläutern. OK, schauen wir uns einfach einmal die gespielten Partien bzw. deren Ergebnisse an. CC7 spielte z.B. gegen den Mephisto Junior (Elo 936) 10 Partien. Davon verlor er 9. Der Mephisto Junior hingegen verlor gegen Merlin 16K (Elo 1470) 0:10 und gegen Chess Companion III (1159) 2:8. Diese Quervergleiche kann man weiter fortführen. Wenn CC7 wirklich eine Elo von ca. 1300 haben sollte, müsste er diese Zahl in Partien auch nachweisen, d.h. er sollte gegen Geräte wie Junior oder Chess Companion III auch entsprechend punkten können. Dem ist aber nicht so. Somit ergibt sich halt rein rechnerische die Zahl von 759. Wobei immer wieder darauf hingewiesen werden muss, dass es um die Abstände zwischen den Geräte geht.

Zitieren:
Mir schienen diese Werte für den CC 7 stets viel zu hoch - meine Einschätzung der Turnierelo des CC 7 liegt bei ca. 1000, auf Aktivschachstufe Level 2 etwas niedriger, da auf dieser Stufe die durchschnittliche Bedenkzeit weit unter 30 Sekunden liegt (das Handicap ist aber unvermeidbar, die nächsthöhere Stufe bringt Rechenzeiten über 1 Minute).
Hierbei sollte nicht vergessen werden, dass sich die Turnierstufe deutlich von der Aktivstufe unterscheidet. An die 1300 Elo in der SSDF kann ich nicht glauben. Ich halte es für einen Schätzwert. Wie gesagt, ohne auswertbare Partien bringen diese Zahlen in der SSDF nichts.

Zitieren:
Für mich ebenso unglaublich, dass Mephisto I und Mephisto Junior die Schallmauer von 1000 Elo nicht durchbrechen können - und jetzt das Kuriose: in meiner persönlichen ELo-Liste liegen sie darüber...dabei benutze ich das gleiche Programm Elostat und auch die Partienbasis ist dieselbe !

Wie das ??
Der Vergleich hinkt gewaltig. Die Partienbasis ist eben nicht identisch. Identisch sind nur die von dir gespielten Partien, aber nicht die Partienbasis. Denn als Basis dienen uns über 3000 Partien. Aufbauend auf dieser Basis von ca. 3000 Partien wurden diese Werte ermittelt. Das ist der entscheidende Unterschied, denn die Referenzwerte der anderen Geräte verändern sich doch dadurch massiv. Hinzu kommt das Problem, dass "deine" Geräte fast nur untereinander gespielt haben, was eine Auswertung erschwert. Wenn du möchtest, kannst du dir ein Posting von mir dazu anschauen. Dort sind wir auf eben diese Punkte schon einmal eingegangen.

Das Problem lässt sich aber recht einfach lösen. Lass einfach den CC7 gegen Geräte antreten, die sich in dem von dir erwarteten Elo Bereich tummeln. Wenn der CC7 ca. 1000 Elo hat, sollte er gegen den Chess Companion III (1159 Elo) einen Vergleich entsprechend Gewinnerwartungsliste (3:7 lt. Theorie) gestalten können. Partien sind aus meiner Sicht das sicherste Argument.

Wie viele Partien bzw. Geräte finden sich in deiner Datenbank?

Zitieren:
Sehr gut korrelieren allerdings die gehobeneren Werte von meiner Liste mit der einzig wahren offiziellen Liste, auch stimmen hier die Gesamtpartien meist völlig überein, also kein Störfaktor. Aber die Werte der underdogs laufen gewaltig aus dem Ruder:
Welche ist denn für dich die einzige wahre Liste?

Zitieren:
Nicht schlecht gestaunt habe ich auch über das m.E. viel zu hohe Einstiegsrating des Excalibur Grandmaster, besonders über den riesigen Ratingvorsprung des Grandmasters gegenueber dem realtiv unbekannten
und vielfach unterschätzten Excalibur Igor. Grandmaster steht mit 1929
zu Buche gegenüber eher bescheidenen 1767 seitens Igor - das sind satte 162 Punkte Differenz.
Das mag zum Teil an der Unzuverlässigkeit der Werte liegen - es sind einfach noch zu wenig Partien gespielt...ich bin mir sicher dass sich diese Werte noch annähern werden...wenn nicht gar eine Zusammenlegung erfolgt...
Daher würde ich für eine Zusammenlegung der beiden plädieren - aber da sie nicht 100% identisch sind, kann ich auch mit einer getrennten Bewertung leben...
Schau dir einfach mal die angegebenen Schwankungsbreiten bzw. Partienanzahl an. GM hat erst 46 und Igor gar erst 30 Partien. Es ist doch unsere erste Liste, es ist ein Anfang, mehr nicht. Die Sache wird sich im Laufe der Zeit ganz von alleine richten. Je mehr Partien wir bekommen, um so besser oder genauer wird die Liste. Es liegt doch nur an uns.
Sollten GM und Igor identisch sein, werden wir sie natürlich zusammenlegen. Das haben wir in der Turnierliste doch auch schon gemacht. Dafür sind doch diese Diskussionen gedacht. Unsere Elo Listen basieren auf der Arbeit aller Community Mitglieder und sollte jemand aus unseren Reihen Fehler, Anregungen, Ideen, Kritik, was auch immer zu diesen Listen äußern, ist das grundsätzlich erwünscht bzw. wird sogar erwartet. Noch mal, wir sind eine Community, nicht eine Ein-Mann-Show. Das habe ich aber schon sehr häufig geäußert. Diese Seiten, unsere Seiten leben nur durch die Mitarbeit aller Mitglieder.

Zitieren:
Kleiner Exkurs: was macht man beim Mephisto II ? Den gibt es serienmässig in 2 Geschwindigkeitsversionen mit 3,5 MHz bzw. 6,1 MHz - selbst die Geschwindigkeit bei Batteriebetrieb unterscheidet sich wesentlich vom Netzbetrieb. Getrennt werten oder alles zusammenlegen ?
Das ist einfach zu beantworten. Wenn ein deutlicher Unterschied besteht, sollten die Geräte getrennt bewertet werden.

Zitieren:
Ich hatte gedacht, dass eine solche Zusammenbewertung auch beim Mythos erfolgen würde, ist er doch laut thread in der community mit dem GK 2000 baugleich. Dieser residiert aber mit einem Abstand von 59 Punkten dahinter
(Mythos 1941 - GK 2000 mit Elo 1882). Kann gut sein, dass hier die Wahrheit in der Mitte liegt.
Wenn ich richtig informiert bin ist der Kishon Chesster mit dem Designer 2000 programmgleich, auch hier finden sich beachtliche 79 Punkte Elo-Differenz(Designer 2000 mit Elo 1916 - Kishon Chesster 1837). Sollten sie wirklich programmgleich sein, scheint mir der Wert des Kishon Chesster realistischer.
Ich kenne den Mythos nicht. Wenn er baugleich mit dem GK2000 ist, legen wir die Geräte natürlich zusammen, guter Hinweis.
Beim Kishon Chesster bin ich mir nicht sicher. Ich glaube der Chesster ist etwas schneller, bin mir aber nicht sicher. Vielleicht können andere Mitglieder dazu etwas sagen. Sollten sie baugleich sein, dann, wie gesagt, werden sie zusammengelegt.

Zitieren:
Ich fände es gut wenn man bei gesicherter Programmgleichheit auch die "verwandten" Brettcomputer mit in die Liste aufnehmen würde.
Das machen wir zum Teil doch schon. Bei einigen Geräten findest du mehrere Bezeichungen, sowohl in der Turnier-, als auch in der Aktiv-Liste. Wenn du weitere baugleiche Geräte kennst bzw. vermutest, dann immer raus damit.

Zitieren:
Bitte als Kompliment auffassen : mehr gibt es nicht zu kritisieren an Eurer 1. Aktivschach-Eloliste !
Ach das ist schon ok. Wie gesagt, wenn dir Sachen auffallen, immer raus damit. Konstruktive Kritik ist bei uns immer willkommen.

Zitieren:
In diesem Zusammenhang: vielleicht sollte man das Vergabekriterium für
R und M auflockern, stattdessen nur abhängig machen von der Anzahl der Spiele (wenn ein Computer 150 oder 300 Partien in der Liste absolviert hat -zeigt die Erfahrung dass dies gegen mehrere Gegner geschehen ist - und somit genügend stabil. Ich würde da keine bestimmte Prozentzahl mehr fordern (30% bzw. 60% Limit), erscheint mir unnötig kompliziert und überfrachtet.
Ja und Nein. Eine breit gestreute Gegnerschar mit vielen Partien gegen eben diese Auswahl, sollte es schon sein. Wobei natürlich der Elo Durchschnitt entsprechend berücksichtig werden muss, völlig klar.
Wobei ich die Prozentzahlen als nicht so unnötig ansehe. Ob es nun zwingend 30 oder 60 % sein müssen, darüber lässt sich sicherlich diskutieren, aber um eine gefestigte Aussage hinsichtlich einer Elo Zahlen machen zu können, sollte der Gegnerschnitt eben nicht nur auf ein paar Geräte beschränkt bleiben. 300 Partien gegen 60% der Geräte, halte ich in der Turnierliste unter den momentanen Voraussetzungen für durchaus sinnvoll. Ob es für die Aktivschach Liste unter den jetzigen Bedingungen sinnvoll ist, wird sich zeigen. Die Schwankungsbreite an Spielstärke ist dort doch ziemlich groß.

Zitieren:
Je grösser die Liste wird umso unsinniger wird diese Forderung - was sollte
z.B. ein Wettkampf Resurrection gegen Mini Chess bringen - elomässig absolut unergiebig, nur um das utopische Prozent M-Kriterium zu erfüllen ?
Naja, gefodert sind solche Vergleiche ja nicht. Das Kriterium besagt nur, 300 Partien gegen 60% (momentan 47) der Geräte. Und so utopisch ist das gar nicht. Der Milano z.B. hat schon 201 Partien gegen 37 Gegner gespielt, ist also nicht mehr weit von dieser Marke entfernt.

Zitieren:
Sehr wünschenswert wäre die Veröffentlichung der programm.dat im Statistikteil, um zu sehen welche Wettkämpfe schon (komplett) absolviert wurden - eine wichtige Orientierungshilfe.


Hm, also eigentlich erreicht man durch Anklicken der entsprechenden Geräte genau das. Sowohl in der Turnier-, als auch in der Aktiv-Liste ist die programm.dat mit eingearbeitet. Schau dir das noch einmal an. Das macht die ganze Sache ja so aufwendig.

Zitieren:
Interessant wäre auch eine Liste der "Überhangmandate" - welche Geräte
haben zwar schon gespielt - aber noch nicht genügend Partien - sie könnte man mit Leichtigkeit in die nächste Liste schubsen...
SuperSensor IV, Boris Diplomat und Super VIP sind 3 der Kandidaten, die ich bereits kenne...Boris haette ich gern in der ersten Liste gesehen, aber ach, mein Diplomat tut's leider nicht mehr...vielleicht erbarmt sich jemand und spielt noch 5 Partien gegen einen anderen Listen-Oldie.
Ja richtig. Das habe ich vor der ersten Liste auch schon mal gemacht. Wir können das gerne beibehalten. Ich werde in den kommenden Tagen eine entsprechende Liste veröffentlichen. Wobei du nicht vergessen darfst, dass 15 Partien gegen Geräte gespielt werden müssen, die sich schon in der Liste befinden, Ansonsten wird eine Auswertung per EloStat nicht (sinnvoll) möglich .

Zitieren:
Uff - dies meine Anmerkungen zur 1. Aktivschach-Eloliste - fast so lang
wie diese selbst... (das kommt davon wenn man die Diskussion eröffnet...)
Ich freue mich schon auf die 2. !!
Na das war doch super. Bitte mehr Diskussionen dieser Art.

Viele Grüße,
Micha

Geändert von Chessguru (09.06.2005 um 17:13 Uhr)
Mit Zitat antworten