Einzelnen Beitrag anzeigen
  #27  
Alt 03.09.2004, 13:51
Benutzerbild von Martin
Martin Martin ist offline
Fidelity Elite 68030
 
Registriert seit: 01.07.2004
Ort: Bonn
Beiträge: 173
Abgegebene Danke: 5
Erhielt 4 Danke für 3 Beiträge
Aktivitäten Langlebigkeit
0/20 20/20
Heute Beiträge
0/3 ssssss173
Daumen hoch AW: ELO-Liste 02-2004

Hallo Jungs,

eine sehr interessante Diskussion. Auch wenn ich kein Statistiker, sondern nur ein "gemeiner" Mathematiker bin, erlaubt mir vielleicht eine kleine Bemerkung.

Mir scheint, ein Teil des Problems hängt mit einer kleinen Verwechslung des Modells mit der Realität zusammen - oder wenn man es etwas philosophischer formulieren wollte, mit der Frage "Was ist die 'wahre' Spielstärke?".

Die Elo-Zahl bzw. genauer die Differenz zweier solcher Zahlen soll, wenn ich es recht verstehe, die (statistisch ermittelte) Gewinnerwartung/Punkteverteilung zwischen zwei Kontrahenten angeben. Wie aber die Experimente von Stefan und Herrn Sonas zeigen, ist dummerweise diese Größe nicht über alle Gegner-Spielstärken konstant, vielleicht ist sie nicht einmal exakt transitiv (A ist besser als B, B ist besser als C, also muss A deutlich besser als C sein...?). Jeder der selbst Turnierschach spielt, hat dies wahrscheinlich auch schon am eigenen Leibe erleben dürfen.

Im Grunde ist also die ELO-Zahl ein Gewinnerwartungs-Modell, das bei großen Differenzen die Zähigkeit des schwächeren Partners - oder die Remistendenz des Schachspiels generell - offenbar unterschätzt. Um diesen Sachverhalt genauer abzubilden, müsste man einem Spieler daher statt einer einzigen Zahl eher einen n-dimensionalen Vektor, oder gar eine Funktion zuordnen. Statt also

Code:
Eigene Elo-Zahl
^
|
|
|*************
|
|
---------------> Gegner-Spielstärke
hätte man dann vielleicht so etwas:

Code:
Eigene Elo-Zahl
^
|          ****
|         *
|  *******    
| *
|*
|
---------------> mittlere Gegner-Spielstärke
Oder noch etwas komplizierteres, da die Ergebnisse vermutlich auch noch davon abhängen, welchen Spielstil der Gegner oder man selbst hat: Gegen Angriffsspieler selbst hoher Spielstärke könnte man z.B. eine gute Performance haben, weil man sich gut verteidigt, aber gegen positionelle Schieber, selbst wenn sie normalerweise (gegen andere) recht schwach sind, bringt man kein Bein auf den Boden... Auch solche Dinge wie "Angstgegner" hätte man dabei immer noch nicht im Modell berücksichtigt.

Nun sehen wir daran, dass es nicht so ganz praktikabel sein kann, all' diese Dinge in einem einfach anzuwendenen System unterzubringen. Da wir Menschen gerne Aussagen am besten in einer einzigen Zahl zusammengefasst sehen möchten, muss man dabei zwangsläufig gewisse Informationen weglassen oder zumindest wegmitteln (Über den generellen Sinn eines solchen Wunsches kann man natürlich diskutieren: Zahlen suggerieren oft eine Aussagekraft, die Ihnen eigentlich nicht immer zusteht. Fakt ist allerdings, dass dieser Umstand gerne und (zu) oft ignoriert wird).

Im Endeffekt wird also eine ELO-Zahl, selbst bei Schachcomputern, immer, weil prinzipbedingt nur eine Näherung an die 'tatsächliche' Gewinnerwartung unserer Protagonisten sein. So gesehen und weil 'die Spielstärke' eines R30 auch aus einem Vergleich gegen den MMII resultiert (natürlich nicht nur), sind m.E. etwaige Ungereimtheiten wie sie im obigen Experiment auftreten, leicht zu verkraften. Zumindest weit leichter als die Verzerrungen wie sie in der SSDF-Liste offenbar vorkommen.

Viele Grüße,
Martin

P.S. @Micha: Iterative Verfahren werden nicht nur bei nicht-linearen Gleichungen angewendet. Wenn ich mich recht erinnere, gibt es so etwas z.B. auch für die Bestimmung von Eigenwerten linearer Abbildungen (Matrizen). Im Grunde sind das allgemein (meist numerische) Verfahren, die eine wiederholte Anwendung von festen Algorithmen beinhalten...

Geändert von Martin (03.09.2004 um 14:31 Uhr)
Mit Zitat antworten