Einzelnen Beitrag anzeigen
  #4  
Alt 31.08.2004, 20:18
kosakenzipfel kosakenzipfel ist offline
SPARC
 
Registriert seit: 12.08.2004
Beiträge: 229
Abgegebene Danke: 1
Erhielt 29 Danke für 5 Beiträge
Aktivitäten Langlebigkeit
0/20 20/20
Heute Beiträge
0/3 ssssss229
Im Fadenkreuz

Eine kritische Anmerkung zur neuen Liste

Gerätepaarungen von weit auseinander liegenden Geräten scheinen mir sehr fragwürdig, sowohl im Aussagewert für das betreffende Gerät als auch in ihrem Einfluss auf die Liste.
Als Beispiel sei der MMII aufgeführt, der in dieser Liste neu vertreten ist. Hier einige der Paarungen (Opponenten):

Atlanta/Magellan, Meph. 2 + 0 = 0 - 2 0.0 %
Dallas 68000/Mondial XL 2 + 0 = 0 - 2 0.0 %
Lyon 68000, Mephisto 2 + 0 = 0 - 2 0.0 %
Polgar 10 MHz, Mephisto 2 + 0 = 0 - 2 0.0 %
Roma 68020, Mephisto 2 + 0 = 0 - 2 0.0 %
Berlin Pro 68020, Meph. 2 + 0 = 0 - 2 0.0 %
R30 V 2.5, TASC 2 + 0 = 0 - 2 0.0 %
RISC 2500, Saitek 2 + 0 = 0 - 2 0.0 %

Alle diese Gegner spielen in einer anderen Liga. Die Ergebnisse sind ebenso vorhersehbar wie nichtssagend.

M. E. sprechen 3 Gründe gegen solche Paarungen, auch wenn sie nach der Elo-Formel korrekt ausgewertet sind:

1.) Zu den Qualitäten des schwächeren Geräts sagen sie nichts aus. Will ich einen Elo 2000-Spieler einschätzen, bringt es nichts ihn gegen Kasparov, Anand oder Kramnik spielen zu lassen. Das gleiche Problem gibt es bei Teststellungen wie dem BT-Test. Ein Gerät, das keine Aufgabe löst, erhält nach der korrekten Anwendung der Formel einen Grundwert zugemessen. Dieser ist aber durch nichts belegt und abhängig vom eingesetzten Grundwert. Erhöht man den Grundwert der Formel, erhöht sich (bei gleichbleibend „Nichts“) auch der zugemessene Elowert, ohne dass es dafür eine Basis gäbe.

2.) Zu den Qualitäten des stärkeren Gerätes sagt der Vergleich auch nichts aus. Das Kasparov gegen einen 2000-Elo Spieler gewinnt ist klar. Niemand würde aber aus 20 oder mehr solcher Partien eine Aussage zu seiner Leistung treffen. Es tritt aber noch ein Problem hinzu. Das Elo-stärkere Gerät sammelt trotzdem Punkte an. Das mögen vielleicht nur 1 oder 2 Punkte sein. Über 20/30 solcher Partien sind das aber auch 30 Punkte Und das macht im Vergleich mit benachbarten Geräten in der Spitze, wo die Differenzen klein und die Luft dünn wird, eben deutliche Unterschiede in der Platzierung aus. Ein Effekt, wenn man neutral, oder ein „Verfahren“, wenn man unfreundlich sein will, was leider in der SSDF schon zu sehen war.

3.) In Anbetracht der mangelnden Verwendbarkeit der Ergebnisse ist die Ausführung solcher Partien auch Zeitverschwendung.

Ich halte es daher für geboten, solche Paarungen jetzt, wo die Liste noch im Anfang steckt, zu vermeiden bzw. wieder zu entfernen, um verzerrende Effekte von vornherein auszuschließen. Die geht nicht darum , möglichst schnell viele Partien abzureißen, sondern für jedes Gerät eine möglichst nahekommende Einschätzung zu erreichen. Ich schlage dafür zwei Punkte vor:

A) Keine Paarungen mit einem Abstand von mehr als 100-150 Elo.

B) Neue Geräte werden durch die Paarungen gezielt eingekreist. Das heißt: Ausgehend von bereits gelisteten, gesicherten Geräten wird eine Gegnerliste erstellt, die sich in 10-20Elopunkten Abstand beidseitig nähert,

also –60;-40;-20; X; +20;+40;+60 (oder feiner). Als grobe Anhaltspunkte für die Opponenten von „X“ dienen analoge Hardware und Programmumfang, z.B. 6502; 32K-Progr., 8K RAM. Zugleich sollten bei der Auswahl unterschiedliche Charaktere vertreten sein (Taktiker/Positionelle) um ein ausgewogenes Gegnerfeld zu haben. Nach dem ersten Durchlauf in diesem FADENKREUZ kann mit zusätzlichen Geräten nachjustiert und somit die Wertung präzisiert werden.

Mit der Bitte um sachliche Diskussion

kosakenzipfel
Mit Zitat antworten