
Zitat von
GS
Hallo Hartmut,
Beispiele:
Code:
Bison 9.11 x64 2584 34,5:15,5 2723
bedeutet, dass GPU-LCZero gegen Bison 9.11 x64 mit 34.5-15.5 gewonnen hat.
Dies entspricht einer Match-Performance von 2723.
Code:
Stockfish DD x64 1CPU 3105 11,5:38,5 2895
bedeutet, dass LCZero gegen Stockfish DD x64 mit 11.5-38.5 verloren hat.
Dies entspricht einer Match-Performance von 2895.
Alle gelisteten Matches sind immer aus der Sicht der gerade zu testeten
Engine zu verstehen, hier also GPU-LCZero (steht einmal ganz oben)
Die Spiele kann man nach dem nächsten Update, ich weiss noch nicht wann
ich das online stellen werde, allesamt herunterladen und zwar immer hier:
http://www.cegt.net/downloads/40_4/downloads.htm
h.a.n.d.
Alles klar, dann habe ich das schon richtig interpretiert. Gegen Abrok und Ruffian habe ich ehrlich gesagt mit keinem anderen Ergebnis gerechnet, zumal Ruffian auf meinem bescheidenen AMD 4Kern auch von der CPU-Version bereits geschlagen wird (wenn auch nicht so hoch). Und auch gegen Stockfish ist das zumindest mal ein gutes Ergebnis, wenngleich Leela bei weitem noch nicht heranreicht, wie das Ergebnis auch zeigt. Gegen Deep Sjeng nahezu Gleichstand. Das entspricht etwa meiner persönlichen Einstellung. Auf jeden Fall ist Leela auf einem guten Weg. Die Ergebnisse sind um so beeindruckender da sie im Blitzmodus gespielt wurden, Leela aber gerade bei langen Bedenkzeiten deutlicher zulegt als andere Engines, die ich kenne. Das wird bestimmt noch interessant.
Das einzige was man bei Euren Tests schade finden kann ist die Tatsache dass die Eröffnungsbücher vorgegeben sind. (auch wenn es sich vielleicht nur um Bücher handelt in denen nur die ersten 2-3 Züge vorgegeben sind). Leela ist ja ein lernendes System, lernt also quasi inkl. Eröffnungsbehandlung von der Pike auf. Sinn der Übung ist es ja, dass sie ohne menschlichen Einfluß lernt (weswegen ja auch keine Eröffnungsbücher für das Training verwendet werden). Dem kann man natürlich in solchen Tests nicht gerecht werden, da sich sonst bei der Menge der Partien (Es waren soweit ich das gesehen habe, immer 50 Pro Wettkampf) Wiederholungen kaum vermeiden lassen. Insofern wird die "wahre" Stärke immer ein Näherungswert bleiben, da sie vielleicht auch mal in Eröffnungen gezwungen wird, die sie normal niemals spielen würde.
Aber gut, man kann nicht alles haben. Und bei Wettkämpfen über 50 Partien geht es wohl auch nicht anders. Gerade auch vor diesem Hintergrund umso mehr ein sehr gutes Ergebnis für Leela. Ich gehe mal davon aus, dass sie in eurem "New Engines"-Turnier auch auftauchen wird.
http://cegt.forumieren.com/t214-new-engine-to-test
Da bin ich auf die Gesamtperformance jetzt schon gespannt. Bisher war es ja eine "ausgesuchte" Gegnerschaft

Allerdings durchaus eine gut ausgesuchte, die vom Niveau her durchaus einen guten Querschnitt darstellt.