Schachcomputer.info Community

Zurück   Schachcomputer.info Community > Schachcomputer / Chess Computer: > Die ganze Welt der Schachcomputer / World of chess computers


Antwort
 
Themen-Optionen Ansicht

  #1  
Alt 05.10.2016, 16:28
Benutzerbild von Solwac
Solwac Solwac ist offline
Revelation
 
Registriert seit: 18.07.2010
Land:
Beiträge: 782
Abgegebene Danke: 189
Erhielt 338 Danke für 216 Beiträge
Aktivitäten Langlebigkeit
0/20 14/20
Heute Beiträge
0/3 ssssss782
Gedanken zum Thema Schachprogramm und Elo

Bei der Lektüre einer älteren CSS bin ich mal wieder über die angeblichen Killerbibliotheken einiger Programme gestolpert. Ich möchte das mal für einige Gedanken zum Thema Elo und Schachprogramm nutzen:

Erst einmal, was bedeutet die Elozahl für menschliche Spieler? Die absolute Höhe ist nicht wichtig, es kommt nur auf die Differenz der Ratings zweier Spieler an. Je größer der Unterschied, desto größer die Erwartung auf einen Sieg des stärkeren Spielers. Die Abweichungen zwischen erwarteten und tatsächlichen Ergebnissen führt zu Änderungen der Elozahlen, so dass in der Theorie die aktuelle Spielstärke mit nur geringer Verzögerung auch in den Zahlen dargelegt wird. Wichtig für uns ist die Feststellung, dass die Elozahlen keine Konstanten in der Zeit sind. Und es gibt allgemeine Probleme bei Ratingzahlen.

Wie sieht es nun bei Schachprogrammen aus? Bis auf wenige Ausnahmen (z.B. Lernmöglichkeiten) sind die kommerziellen Schachprogramme in ihrer Leistung konstant. Die Version von Programm X zum Zeitpunkt Y rechnet in einer bestimmten Stellung heute genauso wie vor vielen Jahren bei Erscheinen. Es werden dieselben Eröffnungen gespielt und aufgrund der hohen Wiederholbarkeit von Partien auch dieselben Fehler gemacht - bis hin zu Dubletten von Niederlagen. Ich schlabbere jetzt mal die kleinen Abweichungen z.B. durch Lernmöglichkeiten, d.h. ich betrachte die Leistungen von Schachprogrammen als Konstante.

Warum aber schwanken die Werte mit der Zeit z.B. in der SSDF-Liste?

Bei Schachprogrammen sind die Elozahlen ja nicht a priori bekannt. Sie werden aufgrund von vorliegenden Ergebnissen berechnet und haben eine begrenzte Genauigkeit. Werden jetzt weitere Partien ausgespielt, so beeinflussen sie das Ranking aller beteiligten Programme.

Was kann eine Elozahl aussagen und was nicht?

Programme haben keine Tagesform. Daher ist die Elozahl nur für Paarungen interessant, die noch nicht ausgespielt wurden. Angenommen, Programme A und B haben dieselbe Elozahl. Ohne weitere Informationen würde ich also einen ausgeglichenen Wettkampf erwarten. Haben die beiden Programme zwar dieselbe Elozahl, ihr Zweikampf hat aber einen Sieger mit +40, -20 und =40 ergeben, wie würdet Ihr die Chancen in einer weiteren Partie angeben? 50% aufgrund der Elozahl oder 60% für den Sieger im Zweikampf? Und warum?

Bei diesen ersten Überlegungen merkt man schon, dass die Elozahl als einzige Kenngröße offenbar die Welt der Schachprogramme nur teilweise beschreiben kann. Aber es gibt eine Zahl und die kann man in einer Liste sortiert angeben. Und wie in der Bundesliga, man kann einem Programm die Daumen drücken und Fan sein.

Es geht noch weiter: Wir haben drei Programme A (160 Punkte aus 300 Partien), B (100/200) und C (140/300) - welches ist das beste, welches sollte die größte Elozahl haben? Nun, A hat zwar 53% der Punkte geholt, B nur 50% und C gar nur 47%, aber wie sieht es mit folgenden Einzelmatches aus?
A - B 40 - 60
A - C 120 - 80
B - C 40 - 60
Jedes Programm hat gegen eines 40% und gegen das andere 60% geholt. Da die Programme unveränderlich sind, warum sollten die jeweils zweiten 100 Partien von B anders ablaufen? Damit käme jedes Programm auf 200 Punkte aus 400 Partien, d.h. die Gleichwertigkeit der Programme wird deutlicher.

Bedeutet das, dass die unterschiedliche Anzahl von Partien pro Zweikampf keine Rolle spielt?

Natürlich nicht. Mit mehr Partien wird der Zweikampf aussagekräftiger, der Fehler geringer. Mit den 400 Partien der drei Zweikämpfe oben ist A gegenüber C um 33 - 108 Elo stärker, B gegenüber A aber um 17 - 124 Elo (jeweils mit 95% Wahrscheinlichkeit).

Da die Elozahl ja die Erfolgsaussichten über einen möglichst großen Pool von Schachprogrammen beschreiben soll, müssen die Zweikämpfe, die zur Berechnung dienen, möglichst repräsentativ sein. Hier aber liegt genau das Problem, wie sollen wir im Vorfeld wissen, welche anderen Programme den Pool aller Programme relativ gut vertritt.

Ziel sollte es sein, dass sowohl Angstgegner wie auch Lieblingsgegner nicht übermäßig in die Berechnung eingehen.

Betrachtet man nun aber z.B. die SSDF-Liste, dann sieht man viele nicht optimal gewählte Paarungen. Zum einen sind viele Wettkämpfe mit 90% oder mehr für einen Gegner ausgegangen. Ein einzelnes remis durch Stellungswiederholung verändert hier den Ausgang gleich sehr stark, bei gleicher Partienzahl sind solche Zweikämpfe mit einer hohen statistischen Unsicherheit verknüpft.
Und die Zahl der Lang-Programme ist sehr groß. Als jeweilige Weltmeisterprogramme sind ihre Ergebnisse natürlich interessant. Allerdings wird dadurch das Abschneiden anderer Programme gegen Lang-Programme übergewichtet.

Insbesondere wurden die Lang-Programme auch untereinander reichlich angesetzt. Kleine Fortschritte werden so mit vielen Punkten belohnt, vor allem wenn dann Zweikämpfe über viele Partien gehen (z.B. Mephisto Lyon gegen Fidelity Mach III).
Mit Zitat antworten
  #2  
Alt 05.10.2016, 18:28
Benutzerbild von Boris
Boris Boris ist offline
Schachcomputer Koryphäe
 
Registriert seit: 18.08.2013
Ort: Wuerzburg
Land:
Beiträge: 1.575
Abgegebene Danke: 2.526
Erhielt 1.835 Danke für 775 Beiträge
Aktivitäten Langlebigkeit
1/20 11/20
Heute Beiträge
0/3 sssss1575
AW: Gedanken zum Thema Schachprogramm und Elo

Man kann sich viele Gedanken machen.
Da frage ich mich warum Z. B. hört die ssdf-Liste bei 353 Teilnehmern auf und das letzte Gerät hat nur 28% gewonnen gegen Gegner die im Schnitt ca. 180 Elo über dem Gerät liegen.
Ganz nach dem Motto größer höher weiter, das untere Ende mit ca. 150 weiteren Schachcomputern wird ignoriert. Wer weiß denn welcher Schachcomputer den geringsten Elowert aufweist? Viele Bediener werden gedankenblind oder leiden an seelischer Grausamkeit, wenn sie eine U800 Partie verfolgen

Wahrscheinlich zieht sich der Abstand der Geräte gemessen in Elo mit der Zeit untereinander auseinander oder zusammen, aber letztendlich bleibt die Reihenfolge der Geräte einigermaßen konstant.

Für mich ist wichtig zu wissen, wann es keinen Sinn, hinsichtlich des Gewinns, macht eine zu große Differenz zu haben. Also versuche ich bei der Erstellung eines Schachcomputer-Turniers im Rahmen zu bleiben.

Bei der ganzen Phillosopie rund um Elo, darf die Schönheit des Spiels an sich, der sich ergebenden Stellungen innerhalb einer gespielten Partie, nicht außer acht gelassen werden. Da ist es dann im Sinne des einzelnen Betrachters möglicherweise unerheblich ob ein Schachcomputer 700 oder 3500 Elo aufweist.

So die Steine sind schon wieder aufgestellt. Lasst die Spiele beginnen.

Gruß, Jürgen
Mit Zitat antworten
Folgender Benutzer sagt Danke zu Boris für den nützlichen Beitrag:
paulwise3 (06.10.2016)
  #3  
Alt 06.10.2016, 00:08
Benutzerbild von Rasmus
Rasmus Rasmus ist offline
Mephisto London 68030
 
Registriert seit: 26.08.2016
Land:
Beiträge: 374
Abgegebene Danke: 165
Erhielt 445 Danke für 176 Beiträge
Member Photo Albums
Aktivitäten Langlebigkeit
1/20 8/20
Heute Beiträge
0/3 ssssss374
AW: Gedanken zum Thema Schachprogramm und Elo

 Zitat von Solwac Beitrag anzeigen
Warum aber schwanken die Werte mit der Zeit z.B. in der SSDF-Liste?
Naja zum einen statistisches Rauschen, zum anderen aber eben die von Dir erwähnten Bibliotheken. Die wurden seinerzeit oftmals danach gewählt, daß man nicht etwa übermäßig geniale Züge aufgenommen hat.

Sondern erstens, man merkte, aha, gegen populären Gegner X führt diese Variante letztlich (durch andere, später Fehler!) in einen Verlust. Also sperrt man die Variante. Zweitens merkte man, oho, dieser und jener wichtige Gegner erzeugt nach einer bestimmten Variante eine Verlustpartie. Also nahm man sie auf. Das war halt einer Zeit geschuldet, in der Hersteller die Elozahlen als Werbung benutzen konnten.

Für den Benutzer brachte das aber alles recht wenig. Der wäre nämlich statt mit einer aus Imagegründen gegen andere Gegner als ihn wohl eher mit einer breiteren Bibliothek zufrieden gewesen.
Mit Zitat antworten
  #4  
Alt 06.10.2016, 07:51
Benutzerbild von Solwac
Solwac Solwac ist offline
Revelation
 
Registriert seit: 18.07.2010
Land:
Beiträge: 782
Abgegebene Danke: 189
Erhielt 338 Danke für 216 Beiträge
Aktivitäten Langlebigkeit
0/20 14/20
Heute Beiträge
0/3 ssssss782
AW: Gedanken zum Thema Schachprogramm und Elo

 Zitat von Rasmus Beitrag anzeigen
Naja zum einen statistisches Rauschen, zum anderen aber eben die von Dir erwähnten Bibliotheken. Die wurden seinerzeit oftmals danach gewählt, daß man nicht etwa übermäßig geniale Züge aufgenommen hat.
Die Killerbibliotheken verursachen aber kein Rauschen sondern ein vorhersagbares Verhalten. Recht hoch einsteigen und dann durch Wettkämpfe gegen neuere Modelle abfallen.

Meine Frage zielte eher auf den Effekt, dass für die Erstveröffentlichung eines Programms nur wenige Wettkämpfe durchgeführt werden und mit weiteren Wettkämpfen dann Änderungen nach oben wie nach unten auftreten.
Mit Zitat antworten
Antwort

Themen-Optionen
Ansicht

Forumregeln
Du bist nicht berechtigt, neue Themen zu erstellen.
Du bist nicht berechtigt, auf Beiträge zu antworten.
Du bist nicht berechtigt, Anhänge hochzuladen.
Du bist nicht berechtigt, deine Beiträge zu bearbeiten.

BB code ist An
Smileys sind An.
[IMG] Code ist An.
HTML-Code ist An.

Gehe zu

Ähnliche Themen
Thema Erstellt von Forum Antworten Letzter Beitrag
Off Topic: Schachprogramm für Anfänger und Profis? udo Die ganze Welt der Schachcomputer / World of chess computers 0 03.05.2016 00:24
Frage: Schachprogramm für Amiga A500 Jockel Die ganze Welt der Schachcomputer / World of chess computers 2 03.05.2010 22:04
Hilfe: Schachcomputer oder Schachprogramm Aquamarin Die ganze Welt der Schachcomputer / World of chess computers 8 11.11.2007 21:14


Alle Zeitangaben in WEZ +2. Es ist jetzt 13:44 Uhr.



Powered by vBulletin (Deutsch)
Copyright ©2000 - 2024, Jelsoft Enterprises Ltd.
©Schachcomputer.info