Einzelnen Beitrag anzeigen
  #39  
Alt 12.08.2017, 01:21
Benutzerbild von spacious_mind
spacious_mind spacious_mind ist offline
Schachcomputer Koryphäe
 
Registriert seit: 29.06.2006
Ort: Alabama, USA
Land:
Beiträge: 1.927
Abgegebene Danke: 47
Erhielt 327 Danke für 197 Beiträge
Aktivitäten Langlebigkeit
0/20 18/20
Heute Beiträge
0/3 sssss1927
Re: AW: Geschwindigkeitsverdopplungen und Elozahlen

 Zitat von Hartmut Beitrag anzeigen
Irgendwie verstehe ich nicht wie dieser Test aufgebaut sein soll, wo Du das hernimmst, dass sich die ELO um 50 Punkte bei Verdopplung verbessert, etc.

Vielleicht kannst Du ja nochmal genau an einem konkreten Beispiel erklären was genau du wie testest... oder zumindest einen Link setzen, wo Du das genau erklärt hast. Irgendwie blicke ich gerade bei den ganzen Posts nicht mehr wirklich durch.
Hallo Hartmut,

Ok Ich versuche es mal zu erklaeren wie ich das sehe.

Auf seite 3 von diesen Post habe ich ein paar beispiele gezeigt mit Werte von tests die ich alle ausgefuehrt habe. Da siehst du ZB. Tatsachliche ELO Werte die ich ermittelt habe von mein Spiel Test mit schachprogramme ueber verschiedene Hardware. Ich Weiss nicht ob du weisst aber vor ein paar Jahre hatte ich ein Test gebaut mit 5 spiele wo jeder moeglicher zug Schwarz und Weiss evaluiert war von ca 30 Ply tief bis auf 50 Ply. Die Tiefe kam darauf an wie kompliziert die stellung war. Wenn kompliziert dann lies ich die Berechnung laufen auf mein schnellsten computer fuer einige stunden und sogar uebernacht. So baute ich 5 menschen Spiele auf. Fuer jedes spiel mit jeden schwarzen zug und jeden weissen zug evaluierte ich jede zug moeglichkeit zwischen 30 und 50 Ply tief. Jedes spiel dauerte ca 1 Woche um jeden zug und zug moeglichkeit zu evaluieren. Und das machte ich fuer 5 Spiele was ca 5 Wochen dauerte mit tag und nacht computer Rechnungen.

Nach jeden schwarzen und jeden weissen Zug speicherte ich die resultate in eine tabelle. Danach baute ich die werte auf fuer jeden zug mit einen tabellen gerechneten Wertsatz der genau gleich war fuer jeden schwarzen und weissen Zug. Die Werte waren so aufgebaut damit der Schachcomputer fuer den bessten zug das meisste bekam und fuer die naechsten besten zuege weniger bekam bis zu einem bestimmten grad der nicht sehr hoch lag. Danach war der Wert null.

Diese Werte baute ich auf gleich fuer jedes spiel und zug so das Gesamtspiel angepasst ist zu die best ELO Werten von das Gott Programm was damals auch Stockfish war. Stockfish 6. Den Test vergleichte ich naturlich mit Komodo der neben Ihn immer ganz oben steht und beide waren ziemlich nah mit schlusswerte bei diesen Test. Naturlich in ein paar zuege das ist es immer moeglich das der Komodo zB den zweit besten zug manchmal hoeher bewertet als Stockfish's besten Zug aber in der gesamtwertung die differenz zwischen Komodo und Stockfish war ziemlich klein daher auch nicht so unbedingt wichtig. Da ich ja diesen Test im allersten wollte um alle brettschachcomputer von den schwaechsten bis zum staerksten unter einen test einschliesslich DOS, Amiga usw benuetzen wollte.

So zur Zeit habe ich ca 370 schachprogramme durch diesen test spielen lassen mit verschiedene hardware.

Hier zB spiel ein paar beispiele:



Das war ganz oben auf der Liste mit bis jetzt gespielten spiele.



Hier noch ein paar mehr beispiele.



Und noch ein paar mehr.

Ihr koennt hier von schon erkennen das ich Werte habe fuer sehr verschiedene Hardware einschliesslich XBOX und PS2 usw.

Alles geht mit diese Tests von schlechtesten computer bis zum besten unter eine TestWelt!

Naturlich Weiss ich das die ELO Werte nur fuer diese spiele sind und nicht ein Gospel ELO Wert. Naturlich wuerde noch besser sein wenn ich 20 oder 30 solche tests Machen wuerde anstatt nur 5. Das waeren dann 2000-3000 Stellungen anstatt 300+ aber auch mit diese 5 tests macht schon sehr viel spass zu sehen wie sich die programme von 1 spiel zum anderen benehmen. Das sieht man schon zB mit linie 77 beim IPad Chess Genius wo er gut spielt bis auf spiel 4 und da liegt er voellig daneben. Mit weitere Tests koennte er sich vielleicht erhohlen aber seine kunst in spiel 4 war ziemlich schwach.

So jetzt egal was ihr oder ich von den ELOWerte denkt, Ihr sieht ich kann die differenz zwischen Hardware 1 und Hardware 2, 3 , 4, 5 fuer das gleiche schachprogramm sehen in diese spiele. Mit mehr als 5 spiele waere es naturlich immer mehr genauer.

Bei Wiki gehe ich davon aus das die Werte konstant sind zwischen den MIPS. Das ist ja auch logisch. Ich finde da ja auch kein Wert wo zB ein P200 hoeher liegt als ein P300 usw. Daher kann ich Davon ausgehen das die steigerung konstant bleibt (egal ob falsch oder richtig fuer die individuellen Werten). Ich gehe auch davon aus das sie auch ziemlich mit einer gleichen methode gemessen waren. Daher auch meine aussage des es fuer mich egal ist ob falsch oder richtig.

Ihr sieht ich habe mittlerweile werte fuer verschiede hardware fuer gleiche schachprogramme. So mehr ich Teste so mehr werte bekomme ich und um so genauer wird es.

Wenn ich jetzt alle programme nehme die ich getestet habe und die wiki MIPs daran stecke dann sehe ich unter die wiki mips die verdopplungswerte. Wenn ich die saemtlichen schachprogramme nehme von wo ich bis jetzt 2 oder mehr hardware getestet habe und sie auf einer tabelle aufstelle und den schluss durchschnitt nehme dann liegt dieser Wert zu Zeit bei ca 50. Daher nehme ich diesen wert unter meine Tests und Wiki MIPS Welt als den groben schaetzungswert in den Kalkulator den ich mir estellte. Wenn ich ein exakten wert habe fuer ein bestimmten Schachprogramm wie bei zB Sargon 5 dann wuerde ich diesen Wert nehmen. Aber Sargon 5 nehme ich seinen exakten Werte heute auch nicht unbedingt, weil ich habe Ihn noch nicht bei P100, P300, P800, P1000 noch nicht getestet die ich aber auch habe, daher bei diesen Sargon V wuerde ich mir die frage stellen nehme ich 50, sein zur Zeitigen Wert oder mache ich eines Tages diese Tests mit den Fehlenden obigen computers?

Da ich die Wiki MIPS benuetze mit Kontrollen da kann ich eigentlich nie sehr weit entfehrnt sein weil:

1) Die progressive hoeheren MIPS werten sind konstant zwischen die hardware.
2) Sollte der eine oder andere falsch sein dann ist es auch egal bei 50% falsch bin ich 25 ELO falsch. Bei 100% falsch bin ich bei 50 ELO falsch. Ich vertraue mich an die tatsache das die naechsten hardware MIPS nach den Falschen es wieder mal einfangen. Daher sagte ich das es egal ist ob ich Wiki benuetze, Drhystone oder FLOPS. Das schoene bei Wiki ist das ich fast alle hardware auf eine seite habe und brauche nicht von einer webseite zur einer anderen herumspringen was dann wieder ungenauigkeiten bringt.

ps... bei diese tests messe ich nicht nur den computer sondern auch die 2 menschen die das spiel gespielt haben.

Eingentlich liege ich hier schon 2 Jahre in voraus von Lichess

Viele Gruesse.

Geändert von spacious_mind (12.08.2017 um 01:49 Uhr)
Mit Zitat antworten