OK, jetzt schreibe ich doch nochmal was dazu, seufz...

Zitat von
Solwac
Was meinst Du mit "her haben"? Zwei Gegner haben immer eine Gewinnerwartung, bei Computern ist der Wert fix, auch wenn ich ihn meist nicht kenne, bei Menschen variabel.
Mit herhaben meine ich: Wenn Du sagst das Gerät hat diese oder jene Gewinnerwartung dann musst Du sie irgendwo herhaben. Dass sie eine haben müssen ist wohl jedem klar. In deinem Beispiel hast Du aber eine bestimmte Gewinnerwartung genannt, und die muss - fix oder nicht fix - einen Ursprung haben. Ist sie nicht fix dann durch eine Ratingformel wie beispielsweise die der FIDE, ist sie fix dann dadurch dass Du ausgehend von der Eröffnungsbibliothek und anderen Einstellungen alle möglichen Partien bereits gespielt hast. Hast Du aber vermutlich nicht, also woher kommt dieser Wert?
Zitieren:
Nein, die Gewinnerwartung zwischen beiden ändert sich nicht!
Dann bring den mathematischen Beweis dafür, dass es ein endliches Problem ist. Ansonsten haben wir einfach nur Behauptung und Gegenbehauptung und drehen uns im Kreis. Können wir zwar machen, aber ich fahre lieber mit einem richtigen Karusell... Einzig und allein bei unseren Brettcomputerschätzchen würde ich Dir hier eingeschränkt recht geben. Bei den Spitzenprogrammen gibt es längst Entwicklungen, die diese Behauptung widerlegen. Und ich würde mal darauf wetten dass solche lernenden Programme wie das Go-Programm von Google irgendwann auch im Schach stärker Einzug halten werden. Letztlich ist das ein Programmiertechnisches Problem das lösbar ist. Auch wenn die Lösung als solches noch nicht gefunden ist.
Zitieren:
Das ist wie ein Würfel. Jeder Würfel hat eine Verteilung, mit welcher Wahrscheinlichkeit eine Seite oben liegt. Ideal wäre natürlich 1/6 für jede Seite, aber in der Realität gibt es leichte Abweichungen. Wenn ich dieser Abweichung auf die Spur kommen will, d.h. die tatsächliche Verteilung in Erfahrung bringen möchte, dann kann ich den Würfel exakt vermessen oder testweise würfeln. Wenn ich 10000 Würfelwürfel mache, dann kenne ich die Verteilung schon recht gut. Aber die Verteilung hat sich dadurch nicht geändert. Nur meine Schätzung hat sich verbessert.
Das Problem ist dass es natürlich einfach ist eine Wahrscheinlichkeit für einen Würfel zu definieren. Ich weiss ja dass er 6 Seiten hat. Für die Wahrscheinlichkeit eines Gewinns zwischen 2 Programmen müsste ich aus einer gegebenen Eröffnungsbibliothek (und die sind heutzutage verdammt groß...) alle möglichen Endstellungen ausspielen lassen. Kann man zwar machen, aber eben allenfalls auf Superblitzstufen. Ansonsten wird man nie zu einem Ergebnis kommen. Zumindest nicht, wenn man berücksichtigt dass das menschliche Leben endlich ist und man das Ergebnis vielleicht noch sehen will. Und bis wir dieses Ergebnis dann sehen, haben wir bereits lernfähige Systeme und das Ergebnis ist unwichtig geworden. Da sind die Näherungswerte der FIDE praktikabler.
Zitieren:
Du beschreibst sehr schön, warum die Gewinnerwartung zwischen zwei Computern praktisch immer gleich ist, zumindest bei älteren Geräten gibt es praktisch kein Lernen.
Das ist sicher richtig. Und bei kleiner Eröffnungsbibliothek würden sich solche Werte auch schnell ermitteln lassen. Das Problem ist nur, bei den Spitzengeräten sind diese Bibliotheken bereits gewaltig und es wären sehr lange Wettkämpfe um auch nur die Gewinnerwartung zwischen 2 bestimmten Geräten zu ermitteln. Für eine Ratingliste - und die ist ja erstmal der Sinn der ganzen Diskussion hier - wäre das praktisch nicht machbar. Außer vielleicht auf Blitzebene. Und selbst da kommen neue Engines für die Liste schneller als ich solche Turniere auch nur ansatzweise zu einem Ende bringen könnte. Insofern ist auch hier das Berechnungsmodell der FIDE genauer.
Zitieren:
Ein Zufallszahlengenerator verkompliziert zwar alles, weil mehr unterschiedliche Partien entstehen, aber es kann immer noch nach dem Gesetz der großen Zahlen erfasst werden.
OK, erstmal für die mitlesenden. Das Gesetz der großen Zahlen besagt in der einfachsten Form etwa folgendes: Wird ein Zufallsexperiment unter derselben Bedingung immer wieder durchgeführt, dann nähert sich die relative Häufigkeit in der Regel an die theoretische Wahrscheinlichkeit an. Das ist zwar sehr vereinfacht und selbst hier könnte es theoretisch "Aussreisser" geben, aber wir wollen ja keinen Mathekurs abhalten.
Soweit hast Du recht. Es kann natürlich theoretisch nach diesem Gesetz erfasst werden. Viel Spaß dabei, wenn Du sowas auch nur auf Aktivstufe mit 30 Sekunden Bedenkzeit zwischen 2 Geräten mit großer Eröffnungsbibliothek durchführen willst. Zur Erstellung einer Ratingliste allein mit der endlichen Zahl von Geräten bei unseren alten Bretties ist das eine Aufgabe für mehrere Generationen. Auch hier erweist sich das Berechnungsmodell der FIDE als praktikabler und genauer. Bei allen Listen die es gibt, haben wir - trotz vielleicht theoretischer Möglichkeit einer festen Gewinnerwartung - das Problem dass wir diese nicht kennen und nur Näherungswerte haben. Diese entstehen in der Regel durch die Erstellung einer Ratingliste nach gewissen Regeln. Sei es Fide, sei es Bajesian oder irgendetwas anderes. All diese theoretischen Überlegungen über fixe oder variable Gewinnerwartungen lösen aber weder das Problem der Vergleichbarkeit verschiedener Systeme noch die Frage welches System denn nun wirklich genauer ist.
Zitieren:
Zwischen zwei Computern ist die Gewinnerwartung konstant, darauf beruht die Möglichkeit einer Auswertung als ein großes Turnier. Haben zwei Computer aber noch nicht gegeneinander gespielt, dann haben wir als einzige Information das Rating.
Wir haben eigentlich immer nur das Rating, denn auch wenn die beiden fraglichen Geräte schon gegeneinander gespielt haben kann ich daraus ja nur eine sehr grobe Schätzung der Gewinnerwartung ableiten. Die Auswertung als ein großes Turnier macht nur dann Sinn, wenn sämtliche möglichen Partien ausgespielt werden. Ansonsten ist der ermittelte Wert eher wertlos. Im Gegensatz zum FIDE-System ist die Berechnung auch sehr vom Zufall geprägt, zumal eben wie schon gesagt, die Anzahl der Partien zwischen den Geräten oftmals sehr willkürlich gewählt wird. Sind wir mal ehrlich... dem SSDF ist man damals wegen weit geringfügigerer Manipulationen an den Karren gefahren als sie durch diese Listen kreiert werden. Anders wäre es, wenn man wirklich alle möglichen Partien zwischen den Geräten ausspielen würde. Gut dann hätte man zwar eine Gewinnerwartung aber jedes weitere Spiel zwischen den beiden wäre uninteressant, da ja (vorherige Aufzeichnung vorausgesetzt) alle Partien schon vorliegen.
... Deine Zusammenfassung habe ich hier nicht zitiert. Sie ist zwar nachvollziehbar, ändert aber nichts an der praktischen Unmöglichkeit der Berechnung eines fixen Erwartungswertes.
Zitieren:
Wie man hier auch im Forum nachlesen kann, wird bei der Beschreibung von Computerwettkämpfen gerne vermenschlicht, d.h. eine Psychologie angewandt von der die Geräte natürlich nichts wissen (man denke an 1990, wo das Langprogramm wegen eines von den Programmierern sehr hoch angesetztes Contempt-Faktors einen halben Punkt geschenkt bekam - das wäre dem Programm von alleine nie in den Sinn gekommen)
Tja und da sind wir bei dem Punkt zukünftiger oder schon geschehener Entwicklungen. In der Nationalmannschaft beim ICCF haben wir nämlich ein für uns geschriebenes Programm das genau auf solche Ideen kommt. Es ist in der Lage selbständig den Contempt-Faktor zu ändern, selbständig zu entscheiden ob es jetzt NullMove Puning verwendet oder nicht, etc. Da es hierfür sehr umgangreiche Berechnungen durchführen muss oder, wenn sich über einen längeren Zeitraum die Bewertung nicht ändert, mit anderen Einstellungen die letzten 3 Stufen der Denktiefe vielleicht neu berechnet, ist es zwar - zumindest zum jetzigen Zeitpunkt - für ein reines Computerturnier nicht brauchbar, für Fernschach und andere Langzeitanalysen aber weit besser geeignet als Stockfish und Co. Ich habe kaum einen Zweifel daran dass solche Entwicklungen, ebenso wie wirklich lernfähige Programme nicht mehr so weit weg sind. Im Go-Spiel ist es ja schon Realität. Spätestens dann aber, ist die Bayessche Berechnung und das Thema "fixe Gewinnerwartung" allenfalls noch ein philosophisches Problem.
So, nun bin ich aber wirklich mit dem Thema durch und schließe mich Michas Meinung an, dass eigentlich die Probleme alle angesprochen sind und man sich jetzt darauf konzentrieren sollte: Wie mach ich es besser, muss ich es überhaupt besser machen, etc.
Die Frage ist halt was ich will. Will ich eine Ratingliste unserer Schätzchen untereinander. Haben wir, funktioniert, alles gut.
Wollen wir eine Ratingliste die mit menschlichen Werten vergleichbar ist? Können wir machen wenn uns jemand in der FIDE-Zentrale das FIDE-Rating-Programm zukommen lässt oder irgendjemand ein Programm für exakt diese Auswertung schreibt. Ansonsten werden wir immer das Problem haben dass ein Gerät mit Wert X eigentlich "gefühlt" stärker oder schwächer ist.
Und ganz ehrlich... mich kümmerts net. Das mag das Problem derer sein, die meinen dass man 2 verschiedene Wertungssysteme unbedingt unter einen Hut bringen muss. Ich kann mit den bestehenden Listen bei uns hier gut leben. Und wieviel oder besser wie wenig ich von den ganzen CCGT und anderen Listen halte (und warum), dürfte zwischenzeitlich jeder mitbekommen haben.
