Thema: Frage: Mm5 nur 1575 ELO ??
Einzelnen Beitrag anzeigen
  #78  
Alt 01.07.2017, 00:59
Hartmut Hartmut ist gerade online
Lebende Foren Legende
 
Registriert seit: 01.04.2010
Ort: Nürnberg
Alter: 61
Land:
Beiträge: 2.607
Abgegebene Danke: 3.561
Erhielt 2.793 Danke für 1.275 Beiträge
Aktivitäten Langlebigkeit
16/20 15/20
Heute Beiträge
1/3 sssss2607
AW: Mm5 nur 1575 ELO ??

 Zitat von Solwac Beitrag anzeigen
Verstehe ich nicht. Ich gebe Dir zwei Schachcomputer, deren Eigenschaften stehen fest und damit auch die Gewinnerwartung. Aber welchen Wert hat sie?
OK. Zur 1. Verständnishürde.

Du gibts mir 2 Schachcomputer, 2 Menschen oder von mir aus auch 2 schachspielende Affen. Völlig Egal. Dann schreibst Du: "Die Eigenschaften stehen fest und damit auch die Gewinnerwartung". Das stimmt nur eingeschränkt. Aufgrund der Eigenschaften eines Programmes ergibt sich keine Gewinnerwartung. Höchstens aus den ELO-Zahlen der beiden Teilnehmer, wobei erstmal egal ist, wo die herkommt. Sie kann vorher erzielt worden sein oder geschätzt sein.

Wenn beide Gegner eine ELO-Zahl haben ist es einfach. Aus der Differenz der ELO-Zahlen ergibt sich nach einer gegebenen Formel die jeweilige Gewinnerwartung. Welchen Wert hat sie? Erstmal nur enen statistischen der für die weitere Berechnung wichtig ist. Deswegen nennt man es auch Erwartungswert. Man führt dann einen Wettkampf durch. Wird die Gewinnerwartung genau getroffen (was in den seltensten Fällen vorkommt) dann bleiben die Elowerte unverändert. Werden die Gewinnerwartungen über- oder unterschritten, errechnet sich daraus mittels einer Formel die neue ELO-Zahl, womit - sollten die gleichen Gegner wieder aufeinandertreffen - dann auch die Gewinnerwartung für das nächste Match eine andere ist. Durch jede zusätzliche Berechnung (nach weiteren Wettkämpfen) wird dieser Wert immer mehr gefestigt oder sagen wir besser: Er nähert sich immer mehr der Realität an.

Hat nur einer eine ELO-Zahl dann wird es schwieriger. Nach den FIDE-Regeln dürfte man dann eine reine Wettkampfbegegnung meines Wissens nicht werten. Bei einem Turnier würde man dem einzelnen Soieler eine geschätzte Wertungszahl geben, in der Regel eine, die dem Turnierdurchschnitt entspricht. Machen wir es jetzt mal in unserem fiktiven Wettkampf genauso, dann wird erstmal eine 50:50 Chance angenommen. Geht das Match unentschieden aus ist für den Moment der geschätzte Wert bestätigt. Gewinnt eine der Parteien das Match ändert sich die Wertungszahl und damit für ein neues Match die Gewinnerwartung. Ansonsten siehe oben. Sind beide Gegner nicht gewertet dann kann man das Match zumindest ELO-mäßig nicht auswerten, denn eine Schätzung der ELO-Zahl wäre hier rein spekulativ. Und mathematische Berechnungen auf spekulativen Werten aufgebaut... da kann sich wohl jeder denken was da wertvolles rauskommt.

Zitieren:
Verstehe ich auch nicht. Eine Gewinnerwartung ist ein Prozentwert und keine Boolsche Variable. Und da die Gewinnerwartung i.A. nicht bekannt ist, können wir nur durch Wettkämpfe versuchen eine möglichst gute Schätzung zu geben, samt Unsicherheit.
Genau das sage ich ja. Es ist ein Prozentwert basierend auf einer ELO-Differenz. Du hast aber in Deinem Post geschrieben: "Aber richtig ist, wenn ich einmal die Gewinnerwartung zwischen zwei Programmen ermittelt habe, dann habe ich es für immer." Und damit hast Du genau das geschaffen. Einen im übertragenen Sinne boolschen Wert oder besser gesagt, eine Konstante. Eine ELO-Berechnung auf dieser Basis liefert Dir die Erkenntnis: "Gewinnerwartung stimmt oder stimmt nicht). Aber statt im Falle von "Stimmt nicht" dann auf Basis der errechneten ELO-Zahlen-Veränderung diesen Erwartungswert dann zu korrigieren wie es das ELO-System verlangt, meisselst Du den einmal ermittelten Wert wie seinerzeit Moses die 10 Gebote in eine Steintafel als feste Größe. Das ELO-System lebt doch von der immer neuen Berechnung und der damit einhergehenden Veränderung der Werte und nicht vom Durcharbeiten einer Datenbank die heute 10000 Partien und in einem Jahr 12000 Partien hat, wobei sie in einem Jahr in fünf Jahren, in 10 Jahren mit genau denselben Startwerten durchgearbeitet wird wie heute. Wenn Du eine Gewinnerwartung "für immer" hättest dann heisst das nichts anderes als: "Ich habe irgendwann einmal eine Spielstärke geschätzt, daraus eine Gewinnerwartung errechnet und die ist jetzt der heilige Gral". Das hat aber absolut nichts mit ELO-Berechnung zu tun. Und vor allem: Auf welcher Grundlage hast Du Die Gewinnerwartung denn berechnet wenn nicht aus einem Unterschied der ELO-Werte?

Zitieren:
Die letzten zwei Sätze haben aber doch nichts mit den Zeilen davor zu tun.
Stimmt. Die hatten wirklich nicht direkt was mit den vorstehenden Sätzen zu tun. Es waren 2 abschließende Sätze die erklären sollten warum ELOStat oder BayesELO eigentlich absolut nichts mit realistischen ELO-Werten zu tun hat.

Eine gewagte Behauptung? Nein. Weil diese Listen im Gegensatz zum Grundgedanken des ELO-Systems eben nicht auf wirklichen Veränderungen aufbauen, sondern sich Änderung in der ELO-Zahl allein dadurch ergeben, dass ich dieselben Startwerte verwende, aber der Partienpool sich vergrößert hat. Um den Unsinn dieser Vorgehensweise zu erklären muss ich jetzt ein wenig von Deinen Fragen weggehen.

Damit das überhaupt funktionieren kann (Die Technik schreitet voran, Speicher und Rechner werden immer schneller und die alten mit denen man mal angefangen hat kriegt man nicht mehr ersetzt, etc) arbeitet z.B. die CCRL Liste bei ihren Turnieren damit dass sie einen bestimmten PC als Basis nimmt und dann bei 2 verschiedenen PCs umrechnet (der ist doppelt so schnell also erhält er die halbe Bedenkzeit, etc.)

siehe hier:http://www.computerchess.org.uk/ccrl/4040/

Was lesen wir da? Ich übersetze es mal: Zeitkontrolle: Äquivalent zu 40 Zügen in 40 Minuten auf einem Athlon 64 X2 4600+ (2.4 GHz), entsprechend ungefähr 15 Minuten auf einer modernen Intel CPU

Allein bei der Beschreibung könnte ich mich vor Lachen unter den Tisch werfen. Einer modernen Intel CPU... welcher bitte? Gibt ja nur ein paar 100 davon mit den unterschiedlichsten Geschwindigkeiten. Welche davon ist der Typ "modern"? Sorry, diese Modellbezeichnung kenne ich nicht.

Und wie will man das bitte genau umrechnen wenn man z.B. hier Geräte mit 4Core Einstellung benutzt? (Der Athlon X2 hat keine 4 Cores...) Manche nutzen die parallelen Cores effektiver aus als andere. Mit Geschwindigkeitstests?

Das manche Befehle schneller abgearbeitet werden als andere, dass diese Schätzung bereits nur ein Näherungswert sein kann... und damit die ganze Liste nicht das Papier wert ist auf dem man sie drucken könnte, lässt man dabei mal schnell unter den Tisch fallen. Ebenso wie die Tatsache dass der Zugriff auf die Endspieldatenbanken vermutlich ebenfalls schneller erfolgt weil die Speichermedien (Festplatte, SSDs, etc) schneller geworden sind. Da kann jeder Geschwindigkeitstest nur ein grober Näherungswert sein. Und auf solchen groben Werten basiert dann eine ELO-Liste?

Dass sich ein Computer mit entsprechend anderer Zeiteinstellung (Beachte: ein 20mal so schneller Rechner müsste also bei deren Turnieren mit der Einstellung 40 in 2 Minuten spielen) vielleicht nach irgendeinem Algorithmus die Zeit dann ganz anders einteilt als er es auf dem erwähnten X2 bei 40 in 40 machen würde, dass er vielleicht sogar bei kurzen Rechenzeiten andere Algorithmen benutzt als bei langen Zeiten und damit die Vergleichbarkeit mit dem Basissystem allein deswegen schon nicht mehr gegeben ist, lässt man ebenfalls unter den Tisch fallen. Ich gehe mal stark davon aus, dass andere Listen nach ähnlichem Prinzip verfahren oder aber bei neuen Rechnern einen Wert schätzen (soundsoviel mehr Geschwindigkeit bringt soundsoviel ELO-Steigerung) und dann einfach die Listen aufwerten. Noch schlimmer, denn manche Programme profitieren von Geschwindigkeitssteigerungen mehr als andere. Diese Werte könnten dann also auch nicht mehr stimmen, wenn ich sie pauschal ansetze.

Was die Bedenkzeitangleichung bei CCRL betrifft: Probier es doch mal einfach z.B. in der MESS-Emu aus, möglichst bei enem Rechner wo Du die Taktfrequenz verändern kannst. Nimm einen beliebigen Schachcomputer in der Einstellung 40 in 120 und mach ein paar Züge und nimm die Zeit. Dann gib ihm die doppelte Taktfrequenz und nimm dafür die Einstellung 40 in 60 und nimm auch da die Zeit. Würde die Berechnung aufgehen müsste das 2. Modell dieselben Antwortzüge in exakt der halben Zeit fabrizieren und ausgeben. Ich kann Dir jetzt schon sagen: Es wird nicht funktionieren.

Äquivalent kannst Du auch ein Hilfsprogramm nehmen mit dem Du die Prozessorleistung auf exakt 50 % runterschrauben kannst (oder mach die entsprechenden Einstellungen im BIOS). Probier dann ein beliebiges UCI-Schachprogramm unter Arena in der Einstellung 40/40 aus. Dann stell den Computer wieder auf 100 % Leistung und nimm dasselbe Schachprogramm mit 40 in 20. Antwortet es in exakt der halben Zeit? Ich mache jede Wette das nicht. Soviel zum Wert solcher Listen. Wenn die Vergleichswerte aber schon nicht stimmen, der Ursprung der Startwerte ebenfalls (hatten wir oben schon) fragwürdig ist, wie sollen dann bitte die Listen auch nur ansatzweise an die Realität herankommen.

Da ist es mit unserer Liste hier noch einfacher so zu arbeiten, denn die Hardware ändert sich nicht im Gegensatz zu der Hardware mit der UCI-Engines getestet werden. Aber auch hier sind Ungenauigkeiten vorprogrammiert, wenngleich die nicht so groß ausfallen dürften wie bei den IPON, CCRL und wie sie alle heissen mögen. Über deren Phantasiezahlen kann ich sowohl als Schachspieler als auch als Mathematiker (Ich habe Informatik mit Nebenfach Mathematik studiert) allenfalls mitleidig lächeln.
__________________
Mein Profil beim ICCF (International Correspondence Chess Federation)
https://www.iccf.com/player?id=89948&tab=3

Geändert von Hartmut (01.07.2017 um 02:30 Uhr)
Mit Zitat antworten