Schachcomputer.info Community - Einzelnen Beitrag anzeigen

#37

04.09.2004, 17:50

Chessguru

Administrator

Dabei seit 20 Jahren, 10 Monaten und 26 Tagen.

Registriert seit: 29.06.2004

Ort: Rostock

Alter: 56

Land:

Beiträge: 6.613

Abgegebene Danke: 1.866

Erhielt 4.910 Danke für 1.481 Beiträge

AW: ELO-Liste 02-2004

Hallo Martin,

Zitat von Martin

Darauf wollte ich doch hinaus: Die abstrakte Größe 'Spielstärke' ist eben nur als eine Gewinnerwartungsgröße zwischen je zwei Geräten sinnvoll.

Das ist mir schon klar gewesen. Deshalb sagte ich doch, dass ich mich deiner Meinung anschließe. Du siehst die Sache genauso wie wir.

Zitat von Martin

Vielmehr meinte ich folgendes: Die realen Gewinnerwartungen z.B. eines R30 entsprechen u.U. unterschiedlichen Elozahlen, je nach Gegner-Gerät. Nehmen wir an, der Sparc und der MMII haben innerhalb eines Clusters schon ihre Elo-Zahlen erhalten (etwa wie in Deinem Beispiel der Vancouver und der Elite Privat) und es kommt nun der R30 hinzu. Dann ist es möglich (oder sogar wahrscheinlich), dass die Partien des R30 gegen den Sparc alleine jetzt vielleicht einer Gewinnerwartung eines 2400er entsprechen würden, gegen den MMII alleine aber eher eines 2330er, weil dieser deutlich schwächer ist und trotzdem noch (aus Zähigkeitsgründen oder warum auch immer) noch z.B. 10% holt.

Ja, genau. Kein Einspruch, dem kann ich wiederum nur zustimmen.

Zitat von Martin

D.h. es gibt so gesehen in Wahrheit keine einzelne Zahl, eine "feste abstrakte Spielstärke", der man sich annähern kann und dazu nur ein hinreichend gutes Verfahren braucht. Eine einzelne Zahl kann offenbar nicht gleichzeitig vorhersagen wie der R30 gegen den Sparc und wie er gegen den MMII im Duell abscheidet. Ebenso würden sich die Zahlen der beiden (Sparc und MMII) nach der Hinzunahme des R30 verändern müssen und damit i. Allg. auch die Differenz ihrer Elo-Zahlen. Die Frage ist also bestenfalls wie man aus der besagten Situation trotzdem die verschiedenen 'wahren' einzelnen Duell-Elo-Zahlen am besten in eine Gesamt-Zahl gießen kann, ohne zu viel an Vorhersagekraft zu verlieren.

Hmm, ja und nein. Es kann schon eine wahre Zahl geben. Die Frage muss anderes gestellt werden. Was meinst du mit "feste abstrakte Spielstärke"? Worauf möchtest du dich beziehen? Es kommt auf die Definition an. Wenn du ein Gerät über "unendlich" viele Partien gegen alle anderen Gegner spielen läßt, kann man daraus eine Zahl (oder auch nicht) definieren, welche die vermeintliche Spielstärke gegenüber ALLEN Geräten darstellt. Diese Zahl wiederum, kann aber nicht zwangsläufig etwas über die statistische Wahrscheinlichkeit eines einzelnen Vergleiches gegen nur einen Gegner aussagen.
Aber in deinem letzten Satz gehst du darauf ja schon ein. Unser Ansatz bzw. die Idee von Elo Listen versucht die Spielstärke eines Spieler gegenüber der Allgemeinheit darzustellen. Aber mir ist schon klar, dass dies im Grunde nicht möglich ist. Keine Liste, kein Verfahren kann eine exakte Zahl ermitteln, weder für einen Computer noch für einen menschlichen Spieler. Es bleiben immer Schätzungen, Stichproben, Näherungen wie auch immer man es nennen will.

So langsam kommen wir aber jetzt in einen Bereich, der nicht mehr mit dem Begriff Hobby vereinbar ist.

Zitat von Martin

Dazu könnte man z.B. die Meinung vertreten, dass im Grunde die Gewinnerwartung gegen den MMII nicht wirklich interessiert und in der Berechnung weggelassen werden sollte, weil sie den R30 unfair benachteiligt und er ohnehin klar besser ist oder die 10% nur vernachlässigbare Ausreißer sind.

Man kann aber auch der Auffassung sein, dass beide Gewinnerwartungen sich trotzdem in einer ELO-Zahl niederschlagen müssten (solange die Anzahl der Partien des R30 über alle Gegner-Spielstärken halbwegs gleichmäßig verteilt ist und nicht etwa 100 Partien gegen den MMII in die Berechnung eingehen und nur 2 gegen den Sparc, aber das ist ja klar).

Ich persönlich teile, wie schon angedeutet - offenbar ähnlich wie ihr - diese zweite Meinung.

Ich stimme, wie du, der zweiten Hypothese zu. Aber unter den geäußerten Voraussetzungen.

Zitieren:

Wenn man es wirklich korrekt angehen will, müssen sogar alle Geräte gegeneinander antreten. Wenn alle Geräte die gleiche Gesamtanzahl an Partien aufweisen und dabei gewährleistet ist, dass jedes Gerät gegen alle anderen Vertreter die gleichen Anzahl an Vergleichspartien gespielt hat, ist eine relative statistische Auswertung möglich. Wobei die Gesamtanzahl der Partien ins Unendliche tendieren müßte, um der Wahrheit nahe zu kommen.

Nur fehlen uns halt noch die Partien. Aber ich hoffe, dass sich das mit der Zeit regelt.

Zitat von Martin

Natürlich sollte sich nichts an den Elo-Zahlen ändern. Hoffentlich macht ELO-Stat das auch so. Der prozentuale Anteil an den Siegen der beiden Kontrahenten bleibt ja gleich und damit auch die jeweilige Gewinnerwartung, also auch die Elo-Zahl. Lediglich die Partien-Basis wird breiter.

Natürlich ändert sich nichts. Genau so ist es. Die Elo-Zahlen müssen konstant bleiben. Ob es in meinem Beispiel nun 20 oder 20.000 Partien sind, das Prinzip bleibt unverändert. EloStat macht nichts anderes. Wenn ein drittes, viertes, fünftes... Gerät hinzukommt sieht es anders aus, logisch.
Vielleicht ist es jetzt zu verstehen, warum das von mir angeführte 20:0 und 30:0 Ergebnis (RISC 2500 / MMII) in unserer momentanen Liste zu den vielleicht auf den ersten Blick nicht sofort nachvollziehbaren Veränderungen führt. Ein bevorteilen eines Gerätes kann ich bei diesem Ansatz nicht erkennen, da die Gesamtheit aller Partien betrachtet wird.

Vielen Dank für deine anschaulichen Ausführungen.

Zitat von Martin

...bis auf ein paar kleine Missverständnisse scheint ja alles ausgeräumt zu sein, wenn ich nicht irre. Ist doch schonmal schön.

Das hoffe ich auch.

Viele Grüße,
Micha