Schachcomputer.info Community - Einzelnen Beitrag anzeigen

#30

03.09.2004, 18:05

Chessguru

Administrator

Dabei seit 19 Jahren, 10 Monaten und 16 Tagen.

Registriert seit: 29.06.2004

Ort: Rostock

Alter: 55

Land:

Beiträge: 6.514

Abgegebene Danke: 1.645

Erhielt 4.678 Danke für 1.400 Beiträge

Frage an Kosakenzipfel

Hallo Jungs,

irgendwie reden wir aneinander vorbei. Ich dachte, dass mein langes Posting die Sache geklärt hat. Scheint aber nicht so. Ich versuche es noch einmal ganz einfach darzustellen bzw. auszudrücken. Diesmal mit einer Frage zum Schluß. Vielleicht versteht man es ja so besser.

Aber zuerst noch einmal die Ausgangspunkte.

Zitat von Martin

Mir scheint, ein Teil des Problems hängt mit einer kleinen Verwechslung des Modells mit der Realität zusammen - oder wenn man es etwas philosophischer formulieren wollte, mit der Frage "Was ist die 'wahre' Spielstärke?".

Das ist eben nicht die Frage bei unserer Liste. Es geht nicht um die Spielstärke, sondern um die Abstände der Geräte untereinander. Anhand dieser Abstände können dann Elo Zahlen erzeugt werden.

[Quote=Martin]Die Elo-Zahl bzw. genauer die Differenz zweier solcher Zahlen soll, wenn ich es recht verstehe, die (statistisch ermittelte) Gewinnerwartung/Punkteverteilung zwischen zwei Kontrahenten angeben. Wie aber die Experimente von Stefan und Herrn Sonas zeigen, ist dummerweise diese Größe nicht über alle Gegner-Spielstärken konstant, vielleicht ist sie nicht einmal exakt transitiv (A ist besser als B, B ist besser als C, also muss A deutlich besser als C sein...?).
Im Grunde ist also die ELO-Zahl ein Gewinnerwartungs-Modell, das bei großen Differenzen die Zähigkeit des schwächeren Partners - oder die Remistendenz des Schachspiels generell - offenbar unterschätzt. Um diesen Sachverhalt genauer abzubilden, müsste man einem Spieler daher statt einer einzigen Zahl eher einen n-dimensionalen Vektor, oder gar eine Funktion zuordnen.[/Martin]

Ja genau Martin, du hast das Prinzip erkannt.

Nur machen einige immer den Fehler, die Elo Zahlen in unserer Liste mit den eigenen Elo Zahlen zu vergleichen. Dieser Vergleich hat aber einen Haken. Ein Schachcomputer hat eine feste "Spielstärke". Die Spielstärke eines menschlichen Spielers kann ständigen Schwankungen unterworfen sein.

Zitat von Martin

Im Endeffekt wird also eine ELO-Zahl, selbst bei Schachcomputern, immer, weil prinzipbedingt nur eine Näherung an die 'tatsächliche' Gewinnerwartung unserer Protagonisten sein. So gesehen und weil 'die Spielstärke' eines R30 auch aus einem Vergleich gegen den MMII resultiert (natürlich nicht nur), sind m.E. etwaige Ungereimtheiten wie sie im obigen Experiment auftreten, leicht zu verkraften. Zumindest weit leichter als die Verzerrungen wie sie in der SSDF-Liste offenbar vorkommen.

Endlich. Genau so sehe ich die Sache aus. Grundsätzlich ist nur eine Näherung möglich. Die Frage ist jetzt nur, wie kommen wir dieser Zahl am Nächsten?

Unser Ansatz bzw. der von EloStat sieht so aus. Wie gesagt, wir gehen davon aus, dass ein Schachcomputer eine feste "Spielstärke" hat. Wobei wir wieder bei dem Punkt ankommen, ob ein Vergleich z.B. zwischen R30 und MMII sinnvoll ist. Aus meiner Sicht ja. Unter folgenden Voraussetzungen.

Wenn man es wirklich korrekt angehen will, müssen sogar alle Geräte gegeneinander antreten. Wenn alle Geräte die gleiche Gesamtanzahl an Partien aufweisen
und dabei gewährleistet ist, dass jedes Gerät gegen alle anderen Vertreter die gleichen Anzahl an Vergleichspartien gespielt hat, ist eine relative
statistische Auswertung möglich. Wobei die Gesamtanzahl der Partien ins Unendliche tendieren müßte, um der Wahrheit nahe zu kommen.

Aufgrund dieser Partien, entsteht so ein Tabelle, sozusagen eine riesige Turniertabelle, welche die Abstände der Geräte darstellt. Und aufgrund dieser Abstände können wir den einzelnen Geräten Werte zuordnen.

Jetzt das Beispiel. Und ich hoffe diesmal nicht auf Antworten, sondern ich erwarte welche, damit wir das Thema "ausdiskutieren" können. Daher ist diese Diskussion schon sinnvoll.

Wir nehmen mal das Beispiel mit den 18:2 Ergebnissen. Bei diesem Turnier spielten 2 Geräte. Wenn wir das Turnier jetzt auswerten (Startwert z.B. 2000) bekommen wir nach z.B. 20 Partien und einem Ergebnis von 18:2, diese Liste:

Code:

    Program                     Elo    +   -   Games   Score   Av.Op.  Draws

  1 Vancouver 68000           : 2191  115 391    20    90.0 %   1809    0.0 %
  2 Elite Privat              : 1809  391 115    20    10.0 %   2191    0.0 %

Gehen wir weiter davon aus, dass sich dieses Turnier jedes Jahr wiederholt und auch die Ergebnisse immer die Gleichen (bitte jetzt nicht fragen warum, ist nur ein Beispiel zur Demonstration der geposteten 18:2 Problematik) sind.

Jetzt meine Frage vor allem an Kosakenzipel, aber auch an alle anderen. Wie verändern sich die Elo-Zahlen der beiden Geräte nach 100 Partien? Wie viel gewinnt und verliert ein Gerät und warum?

Gruß,
Micha