
Zitat von
Solwac
Nicht werden, ich halte so einen Unterschied für möglich. Leider stehen nicht genügend Partien gegen Menschen zur Verfügung um hier mit genügend Sicherheit eine Aussage treffen zu können.
@Hartmut: Bitte löse Dich von der aktuellen Berechnung der Elozahl für Menschen. Hier in der Diskussion braucht es mehrere Elozahlen, je nach Ermittlung. Besser ist deshalb für Computer die Verwendung des Begriffs Gewinnerwartung, das wird schließlich in einem Turnier ermittelt. Erst danach kommt die Vergabe von Elowerten um mit einem mathematischen Modell einfacher fassbare Zahlen zu bekommen. Aber hier geht es ja um die Frage, können Computer unter sich nach dem selben Modell wie Menschen beschrieben werden und dann für eine Elodifferenz dieselben Gewinnerwartungen erhalten?
Man kann sich von dem Berechnungsmodell eigentlich nicht wirklich lösen. Die ELO-Zahl ist ein von Arpad Elo geschaffenes oder ermitteltes mathematisches Modell. Entweder ich benutze dieses Modell, dann habe ich eine ELO-Zahl oder ich benutze ein anderes Modell, dann habe ich etwas anderes. Deswegen halte ich allein aufgrund der Berechnungsgrundlagen in den ganzen Listen den Begriff ELO-Zahl für problematisch. Es ist eine BayesELO, eine ELOSTAT-ELO oder eine ORDO-ELO aber eben keine wirkliche ELO-Zahl. Es gibt nur eine ELO-Zahl (die von Arpad Elo) und es gibt die verschiedensten Wertungszahlen die auf irgendeine andere Art entstanden sind. Wie ich früher schon mal gesagt habe. Äpfel und Birnen halt. Und genau deswegen kann ich es nicht mit den menschlichen Zahlen vergleichen. Egal wie ich mir die Computerlisten durch Änderung von Startwerten schönrechne. Vergleiche es mit dem Begriff Dollar. Wenn wir von Dollar reden, meinen wir den US-Dollar. Nicht den Hongkong Dollar, nicht den kanadischen Dollar oder irgende Andere Währung, die mit dem Begriff Dollar arbeitet. Und wir können auch nicht erwarten dass der Hongkong Dollar denselben Wert hat. Arbeiten wir aber mit verschiedenen Wertungszahl-Systemen die alle den Begriff ELO verwenden, dann soll das auf einmal gehen.
Der Begriff Gewinnerwartung den Du so gerne benutzt ist ebenfalls irreführend (zumindest so, wie ich ihn von Dir verstanden habe). Entweder ich habe eine Gewinnerwartung (woher wenn nicht aus einer Elodifferenz oder einer anderen Wertungszahlendifferenz?) oder ich habe ein Turnier in dem sowas berechnet wird. Dann ist es aber keine "Erwartung" mehr sondern ein Ergebnis. Also was nun bitte?
Zurück zur von dir geposteten Frage: Können Computer unter sich nach demselben Modell wie Menschen beschrieben werden und dann für eine Elodifferenz dieselben Gewinnerwartungen erhalten.
Also erstmal erneut ein erstauntes: "Ja was nun bitte?" Erst soll ich mich von dem Modell lösen, dann kommst Du mit der Frage ob man mit dem Modell arbeiten kann. Entscheide Dich doch bitte mal.
Natürlich kann man die Geräte untereinander genau so beschreiben. Was soll denn dagegen sprechen? Das ein Computer auch mal Eröffnungen spielt von denen er nichts versteht? Das machen Menschen (zumindest in den unteren Spielklassen) oftmals auch. Dass er keine Erfahrungswerte sammelt wie ein Mensch und daher nicht dazulernt? Das machen Menschen oftmals auch. Die Tatsache dass sie dazulernen KÖNNEN heisst noch lange nicht dass sie es auch tun. Ich kenne genügend Leute die immer wieder dieselben Fehler machen, im sonstigen Leben ebenso wie im Schach.
Grundsätzlich ist das ELO-System einfach nur ein mathematisches Modell, welches durch andauernde Auswertung von Partienmaterial eine Wertungszahl ermittelt. Durch andauernde Nachberechnung (wenn eben neue Partien dazukommen) ändert sich die Wertungszahl, nähert sich damit aber auch eher einem realistischen Wert an. Die ELO-Differenz zweier Spieler bestimmt die Gewinnerwartung. Je mehr Partien man hat und je größer der Pool der bespielten Gegner ist desto mehr entspricht die Gewinnerwartung der Realität.
Rein logisch wäre diese Methode von Arpad Elo sogar bei Computern besser anwendbar wie bei Menschen. Warum? Ein mathematisches Modell kennt keinen menschlichen Faktor. Wende ich das Modell bei Computern an, die keine Formschwankungen als solches kennen, werde ich bei Berechnung mit diesem Modell auf jeden Fall mit jeder erneuten Nachberechnung realistischere Werte bekommen. Beim Menschen wird diese Annäherung an realistische Werte jedoch immer einen Ungenauigkeitsfaktor (den menschlichen Faktor, wenn Du so willst)haben. Heute ist er in Topform, morgen ist er erkältet, vielleicht setzt er sich auch mal besoffen ans Brett oder verarbeitet gerade eine Trennung oder einen Verlust. Was auch immer. Das heisst letztlich nur: Die Werte beim Computer wären sogar genauer weil solche Formschwankungen keine Rolle spielen und mit der verwendeten Formel - die ja nichts anderes ist als eine Näherungsformel - irgendwann wirklich ein realistischer Wert erreicht wird. Beim Menschen nähere ich mich allenfalls seiner "durchschnittlichen" Form über den Zeitraum der Messung an, da er eben keinen "festen" Wert hat und es auch dauert bis durch die Berechnung seine Wertungszahl der tatsächlichen momentanen Form entspricht.
Nur macht sich, zumindest seit man meint, ELO-Zahlen aufgrund von tausenden von Blitzpartien ermitteln zu wollen wie bei CCGT, keiner die Arbeit nach dem wirklichen ELO-Modell zu rechnen, sondern man verwendet andere Modelle. Das sind aber dann auch eben keine wirklichen ELO-Zahlen sondern eben Wertungszahlen nach Methode Bayes, ORDO oder wie sie alle heissen mögen. Gleichzeitig (siehe CSS-Forum) erwartet man dass diese Zahlen dann auch noch mit menschlichen ELO-Werten vergleichbar sein sollen. Da fängt dann wirklich die Dummheit an (das einzige neben dem Universum, das scheinbar wirklich keine Grenzen kennt).
Ich kann natürlich normale ELO-Werte von Computern wie von Menschen berechnen und sie werden dann auch nahezu vergleichbar sein. Ich kann auch sagen: "Scheiss auf Arpad ELO ich benutze jetzt BayesELO für Computer UND Menschen". Kann man alles machen. Dann hat man halt auch eine Bayes-Zahl für Menschen. Ich kann aber nicht hergehen und 2 Gruppen bilden (In diesem Fall Computer und Menschen, ich könnte aber auch genauso 2 Menschengruppen nehmen), deren Wertungszahlen auf verschiedene Methoden ermitteln und dann hoffen, vergleichbare Werte zu haben. Die werde ich wie gesagt auch bei gleicher Berechnungsmethode nie haben, weil die Form beim Menschen schwankt und damit die ELO-Zahl die ja nur zurückliegende Partien enthält nicht unbedingt seiner momentanen Tages/Monatsform entsprechen muss. Sie wird aber in ungefähr vergleibar sein. Werden aber Wertungszahlen nach 2 verschiedenen Methoden errechnet gibt es keine Vergleichbarkeit. Vergleiche es mit dem Dollar. Wenn wir vom Dollar reden meinen wir den US-Dollar. Keiner käme auf die Idee zu glauben, dass er für einen Hongkong-Dollar oder einen kanadischen Dollar denselben Wert in der Hand hat, nur weil da auch das Wort Dollar draufsteht.
Wir können da noch monatelang diskutieren. Rein mathematisch kann ich alles anwenden und vergleichen und es wird auch vergleichbar sein, sofern ich nicht versuche 2 Gruppen auf verschiedene Arten zu berechnen und dann zu glauben, auch noch vergleichbare Ergebisse zu erhalten. Das funktioniert nicht.