
Zitat von
applechess
Hallo Egbert
Das sollte doch selbstverständlich sein.

Alles andere ist schlicht MUMPITZ (Unsinn) wie vor allem auch unnötig, keinem Zweck dienend und die Ergebnisse/Stärkevergleiche der Engines verfälschend.
Mfg
Kurt
Es kommt darauf an...
In diesem Thread wurden genau genommen zwei Situationen angesprochen:
1. Die Situation beim Spielen einer Partie. Ich gebe zu, daß ich es hier ebenfalls so halte, daß ich nach Bibliotheksende beider Geräte die Partie abbreche, wenn ich eine Partie dieser Geräte mit der aktuellen Position und gleicher Bedenkzeit bereits in der Datenbank habe. Die Chance, daß sich später eine Abweichung ergibt, erscheint mir einfach zu klein, als daß ich mir dafür die nächsten Stunden um die Ohren schlage. Ich versuche lieber sofort, einen neue Partie zu bekommen.
2. Die Situation beim Auswerten der Partien, d.h. wenn Micha von uns allen Partien zusammenträgt, die dann sicherlich Dubletten enthalten können, auch wenn sie wie in Punkt 1 beschrieben entstanden sind (weil ich ja nur meine eigenen Partien kenne und nicht weiß, ob jemand anderes eine Partie bereits gespielt hat).

Zitat von
applechess
keinem Zweck dienend und die Ergebnisse/Stärkevergleiche der Engines verfälschend.
Ich denke, hier sollten wir uns einmal zurücklehnen und darüber nachdenken, woraus ELO-Zahlen entstehen und was sie ausdrücken sollen.
Vielerorts werden sie ja als Synonym für Spielstärke angesehen. In der Realität ergibt sich eine Elo-Zahl aus den Ergebnissen gespielter Partien. Und zwar lediglich aus den Ergebnissen - es ist völlig irrelevant, wie ein Ergebnis zustandekommen ist. Ob ich gegen einen überlegenen Gegner durch eine auswendiggelernte Eröffnungsfalle gewinne, oder weil ich wirklich überlegen gespielt habe, ob er in überlegener Stellung Material eingestellt hat oder am Brett eingeschlafen ist und meine Leistung darin bestand, andere daran zu hindern, ihn zu wecken, ist alles egal: Ich habe den Punkt und bekomme entsprechend Elo. Und das ist richtig so: Streng genommen soll eine Elo-Zahl ja nicht die Spielstärke messen, sondern eine Vorhersage ermöglichen, wie ein Match- oder Turnierergebnis in der Zukunft aussehen kann. Und dort gilt die gleiche Realität, in der ich die Elo-Zahl "erkämpft" habe.
Halten wir uns an dieser Stelle bitte vor Augen, daß es nicht direkt um (normierte) Spielstärke geht, sondern nur um zu erwartende Punkte aus Schachpartien gegen eine Gegnerschaft mit ebenfalls bekannten Elo-Zahlen - egal wie sie errungen werden.
Früher gab es oft Kommentare zur Wiki-Elo-Liste in der Art "Wie kann ein Schachcomputer mit einem derart schlechten Endspiel eine so hohe Elo-Zahl haben?" oder "Der Schachcomputer X ist strategisch so schlecht, der kann doch niemals 2000 Elo haben". Der Grund, warum diese Computer so unerwartet abgeschnitten haben, ist natürlich, daß wir in der Elo-Liste nur die reinen Ergebnisse betrachten, und nicht einzelne Partiephasen oder Fähigkeiten analysieren. Es gibt z.B. keine separate Endspiel-Elo-Liste.
Ein Bestandteil eines Schachcomputers ist die Eröffnungsbibliothek. Ich denke, es besteht Konsens darüber, daß die Bibliotheken in unserer Elo-Liste mit einbezogen werden, denn sonst würden wir ja alle Partien ohne Eröffnungsbibliothek aus speziellen Stellungen (z.B. den Nunn-Stellungen) heraus spielen.
Wenn wir die Bibliotheken aber mit betrachten, spielt es eigentlich schon eine Rolle, ob gute oder schlechte Varianten häufiger oder seltener gespielt werden. Stellt Euch vor, wir haben ein richtig langes Match zwischen zwei Geräten, bei dem tatsächlich alle durch die jeweiligen Bibliotheken möglichen Partien gespielt sind. Um mal ein Beispiel zu nennen, sagen wir mal, wir haben 50 Partien mit der gleichen Farbverteilung - ohne Dubletten natürlich. Dann geht eine bestimmte Variante, die ganz häufig gespielt wird, sagen wir mal in 50% der Fälle, nur zu 2% in das Ergebnis ein.
Besinnen wir uns zurück auf die Idee, daß Elo-Zahlen eine Vorhersage für die Punktausbeute in einem Match oder Turnier erlauben sollen, und halten wir uns die Situation in einem Turnier wie z.B. Kaufbeuren vor Augen, wo ja niemand in Echtzeit in einer Datenbank nach Dubletten forschen kann, wird klar, daß die im letzten Abschnitt genannte häufige Variante im Turnier viel wahrscheinlicher ist, als es in der Elo-Zahl wegen der Streichung der Dubletten seinen Niederschlag gefunden hat.
Die Aussagekraft der Elo-Zahl wird also tatsächlich durch das Streichen der Dubletten verwässert.
Nun kann man natürlich dagegenhalten, daß man den Einfluß der Eröffnungsbibliothek auf die Elo-Zahl doch lieber nicht so groß haben möchte; ich denke da an die legendären Killervarianten einiger Geräte, die rein theoretisch im Sinne der Elo-Zahl natürlich dazugehören, obwohl sie bezüglich der Spielstärke der reinen "Engine" keinerlei Aussagekraft besitzen.
Für uns ist die Sache vermutlich allein deshalb noch nicht so ernst, weil wir von der skizzierten Situation, (nahezu) alle möglichen Partien zwischen zwei Geräten bereits gespielt zu haben, noch weit entfernt sind. In der Realität haben wir statt 50 verschiedener Partien bei gleicher Farbverteilung vielleicht 5, und dann ginge unsere häufige Variante auch unter Streichung der Dubletten immerhin noch mit 20% statt 2% in das Ergebnis ein. Der Fehler ist also nicht so groß.
Viele Grüße,
Dirk