Schachcomputer.info Community

Schachcomputer.info Community (https://www.schachcomputer.info/forum/index.php)
-   Die ganze Welt der Schachcomputer / World of chess computers (https://www.schachcomputer.info/forum/forumdisplay.php?f=2)
-   -   Tipp: Selbstlernende KI: Neue Engine spielt auf Profi-Niveau (Der LC0 Thread) (https://www.schachcomputer.info/forum/showthread.php?t=5030)

BHGP 31.03.2019 08:47

AW: Selbstlernende KI: Neue Engine spielt auf Profi-Niveau
 
Hallo, Frage mal an die Profis:

Habe ein AMD-Board mit Ryzen 1700x und Nvidia Grafikkarte (CUDA-fähig).
Kann ich die CUDA-Version in Chessbase 15 / Fritz 15 benutzen oder nicht?
Mein ersten Versuche haben bisher nur eine Engine "produziert", die überhaupt nicht rechnet (aber keine Fehlermeldung).

BHGP 31.03.2019 14:05

AW: Selbstlernende KI: Neue Engine spielt auf Profi-Niveau
 
Zitieren:

Zitat von BHGP (Beitrag 79703)
Hallo, Frage mal an die Profis:

Habe ein AMD-Board mit Ryzen 1700x und Nvidia Grafikkarte (CUDA-fähig).
Kann ich die CUDA-Version in Chessbase 15 / Fritz 15 benutzen oder nicht?
Mein ersten Versuche haben bisher nur eine Engine "produziert", die überhaupt nicht rechnet (aber keine Fehlermeldung).


Hat sich erledigt, irgendwas war mit weights.txt nicht in Ordnung.

BHGP 08.04.2019 13:19

AW: Selbstlernende KI: Neue Engine spielt auf Profi-Niveau
 
So,

jetzt bin ich es doch noch mal mit einem Update. Habe mich am Wochenende dazu hinreißen lassen, eine Nvidia RTX 2060 zu kaufen. Meine ersten Versuche verliefen auch erfolgreich. Nun würde ich gerne die Einstellungen "optimieren".
Kann mir da jemand Starthilfe geben (cudnn-fp16 habe ich schon mal eingestellt) ?

Hartmut 08.04.2019 19:50

AW: Selbstlernende KI: Neue Engine spielt auf Profi-Niveau
 
Mit den neuen RTX-Karten hab ich leider noch keine Erfahrung (ist im Moment finanziell nicht drin, da derzeit andere Anschaffungen im Vordergrund stehen). Ich würde mal im englischen Google-Forum von Leela posten

https://groups.google.com/forum/m/#!forum/lczero

oder im Discord-Forum von LC0. Da sind die ganzen Leela-Cracks auf einem Haufen.

BHGP 08.04.2019 19:55

AW: Selbstlernende KI: Neue Engine spielt auf Profi-Niveau
 
Zitieren:

Zitat von Hartmut (Beitrag 79859)
Mit den neuen RTX-Karten hab ich leider noch keine Erfahrung (ist im Moment finanziell nicht drin, da derzeit andere Anschaffungen im Vordergrund stehen). Ich würde mal im englischen Google-Forum von Leela posten

https://groups.google.com/forum/m/#!forum/lczero

oder im Discord-Forum von LC0. Da sind die ganzen Leela-Cracks auf einem Haufen.


Hi,

danke Dir!

StPohl 08.04.2019 23:17

AW: Selbstlernende KI: Neue Engine spielt auf Profi-Niveau
 
Zitieren:

Zitat von BHGP (Beitrag 79850)
So,

jetzt bin ich es doch noch mal mit einem Update. Habe mich am Wochenende dazu hinreißen lassen, eine Nvidia RTX 2060 zu kaufen. Meine ersten Versuche verliefen auch erfolgreich. Nun würde ich gerne die Einstellungen "optimieren".
Kann mir da jemand Starthilfe geben (cudnn-fp16 habe ich schon mal eingestellt) ?

Von Andreas Strangmüller eine fette Meßreihe mit der RTX 2060:

Default Settings, backend=cudnn-fp16

Zeit Knoten Gesamt Knoten pro Sekunde
Höchste Knotenzahl: 00:18 404.929 22.276
Nach einer Minute: 01:01 1.224.396 19.995

---------------------------------------------------------------

Default Settings, backend=cudnn-fp16, NNCacheSize=2000000

Zeit Knoten Gesamt Knoten pro Sekunde
Höchste Knotenzahl: 01:01 1.503.121 24.499
Nach einer Minute: 01:01 1.503.121 24.499

---------------------------------------------------------------

Default Settings, backend=cudnn-fp16, NNCacheSize=2000000, MiniBatchSize=512

Zeit Knoten Gesamt Knoten pro Sekunde
Höchste Knotenzahl: 01:02 1.596.595 25.446
Nach einer Minute: 01:02 1.596.595 25.446

---------------------------------------------------------------

Default Settings, backend=cudnn-fp16, NNCacheSize=2000000, MiniBatchSize=1024

Zeit Knoten Gesamt Knoten pro Sekunde
Höchste Knotenzahl: 01:03 1.624.881 25.413
Nach einer Minute: 01:03 1.624.881 25.413

---------------------------------------------------------------

Default Settings, backend=cudnn-fp16, NNCacheSize=2000000, MiniBatchSize=512, MaxCollisionsEvents=512

Zeit Knoten Gesamt Knoten pro Sekunde
Höchste Knotenzahl: 01:00 1.560.655 25.669
Nach einer Minute: 01:00 1.560.655 25.669

---------------------------------------------------------------

Default Settings, backend=cudnn-fp16, NNCacheSize=2000000, MiniBatchSize=512, MaxCollisionsEvents=512, Threads=4

Zeit Knoten Gesamt Knoten pro Sekunde
Höchste Knotenzahl: 01:02 1.563.849 25.115
Nach einer Minute: 01:02 1.563.849 25.115

---------------------------------------------------------------

Default Settings, backend=cudnn-fp16, NNCacheSize=2000000, MiniBatchSize=512, MaxPrefetch=256, MaxCollisionsEvents=512

Zeit Knoten Gesamt Knoten pro Sekunde
Höchste Knotenzahl: 01:02 1.583.994 25.497
Nach einer Minute: 01:02 1.583.994 25.497

---------------------------------------------------------------

Default Settings, backend=cudnn-fp16, NNCacheSize=2000000, MiniBatchSize=512, MaxPrefetch=512, MaxCollisionsEvents=512

Zeit Knoten Gesamt Knoten pro Sekunde
Höchste Knotenzahl: 01:01 1.513.198 24.625
Nach einer Minute: 01:01 1.513.198 24.625

---------------------------------------------------------------

Hier die vermeintlich besten Einstellungen mit 10 Minuten:

Default Settings, backend=cudnn-fp16, NNCacheSize=2000000, MiniBatchSize=512, MaxCollisionsEvents=512

Zeit Knoten Gesamt Knoten pro Sekunde
Höchste Knotenzahl: 02:21 3.842.955 27.127
Nach zehn Minuten: 10:36 14.997.015 23.545

---------------------------------------------------------------

Default Settings, backend=cudnn-fp16, NNCacheSize=20000000, MiniBatchSize=512, MaxCollisionsEvents=512

Zeit Knoten Gesamt Knoten pro Sekunde
Höchste Knotenzahl: 10:01 16.980.960 28.219
Nach zehn Minuten: 10:01 16.980.960 28.219

--------------------------------------------------------------

Default Settings, backend=cudnn-fp16, NNCacheSize=20000000, MiniBatchSize=512, MaxCollisionsEvents=512, Threads=4

Zeit Knoten Gesamt Knoten pro Sekunde
Höchste Knotenzahl: 10:03 17.459.570 28.927
Nach zehn Minuten: 10:03 17.459.570 28.927

--------------------------------------------------------------

Und zum Schluss noch eine Analyse von über einer Stunde mit dem Maximalwert der NNCacheSize:

Default Settings, backend=cudnn-fp16, NNCacheSize=999999999, MiniBatchSize=512, MaxCollisionsEvents=512, Threads=4

Zeit Knoten Gesamt Knoten pro Sekunde
Höchste Knotenzahl: 32:50 60.231.582 30.559
Nach einer Stunde: 1:08:52 124.111.072 30.033

Bei dieser langen Bedenkzeit/Analyse wird die Schallmauer von 30.000 Knoten pro Sekunde durchbrochen!

Ich habe mich nochmals mit den Einstellungen beschäftigt. Folgende Optionen erzielen nun fast 32.000 Knoten/Rollouts und sind auch nach einer bzw. zehn Minuten am besten.

Default Settings, backend=cudnn-fp16, NNCacheSize=20000000, MiniBatchSize=1024, MaxCollisionsEvents=1024, Threads=4

Zeit Knoten Gesamt Knoten pro Sekunde
Höchste Knotenzahl: 26:58 51.530.869 31.844
Nach einer Minute: 01:02 1.640.545 26.109
Nach zehn Minuten: 10:12 18.748.776 30.593

Hartmut 09.04.2019 01:49

AW: Selbstlernende KI: Neue Engine spielt auf Profi-Niveau
 
Zitieren:

Zitat von StPohl (Beitrag 79866)
Von Andreas Strangmüller eine fette Meßreihe mit der RTX 2060:

Sieht so aus als wäre meine GTX-Karte schon wieder reif für den Elektroschrott... So schnell kann ich gar net sparen, wie es technisch vorwärts geht.

StPohl 09.04.2019 05:21

AW: Selbstlernende KI: Neue Engine spielt auf Profi-Niveau
 
Zitieren:

Zitat von Hartmut (Beitrag 79870)
Sieht so aus als wäre meine GTX-Karte schon wieder reif für den Elektroschrott... So schnell kann ich gar net sparen, wie es technisch vorwärts geht.

Tja, das “Problem“ ist, daß die RTX Karten es erlauben, daß lc0 seine Fließkomma-Matrizen Berechnungen mit nur 16bit Genauigkeit (cudnn-fp16) durchführen kann, während es bei den GTX Karten eben 32bit sind. Alleine dieses Umschalten auf fp16 beschleunigt lc0 um den Faktor 3.5. Und das ist natürlich ein Riesenunterschied. Und schneller sind die RTX Karten außerdem.
Die mobile GTX 950m in meinen alten Notebooks brachte lc0 auf ca. 1200 n/s in der Grundstellung. Die mobile RTX 2060 in meinem neuen Notebook bringt lc0 auf 18000 n/s. Das ist natürlich ein Quantensprung. Für eine halbwegs test-taugliche Leela-Ratio muß ich die RTX 2060 sogar um gute 30% abbremsen (mit dem MSI Afterburner), sonst wären Stockfish & Co. deutlich im Nachteil, obwohl mein neues Notebook sogar eine Hexacore-CPU hat!

BHGP 09.04.2019 09:07

AW: Selbstlernende KI: Neue Engine spielt auf Profi-Niveau
 
Hi,

super, danke ! Da gibt es doch einiges auszuprobieren;)

Mir sind noch folgende Zusatzfragen eingefallen:


- Ich habe gestern mal die GUIS von Chessbase (Fritz), Hiarcs Chess Explorer und Shredder ausprobiert. Im Prinzip hat die Einbindung überall funktioniert. Gibt es da Vor- und Nachteile der verschiedeen GUIS im Bezug auf die Performance von UCI-Engines, speziell Lc0?
Ich würde gerne ARENA, Aquarium oder auch Lucas in diese Frage miteinbeziehen. Diese GUIS wollte ich mir heute abend noch anschauen...

- Ich würde gerne Lc0 gegen Stockfish & Co aus einer bestimmten Stellung heraus X Partien (mit oder ohne Seitenwechsel) spielen lassen. Bisher ist mir das nur über die Shredder-GUI gelungen. Fritz und Hiarcs scheinen das nicht zu unterstützen, da sind allenfalls maximal 2 Partien möglich. Habe ich da falsch konfiguriert in Fritz? Insbesondere Fritz würde mich als GUI halt primär "reizen", weil ich doch sehr Chessbase-lastig bin...

applechess 09.04.2019 11:46

AW: Selbstlernende KI: Neue Engine spielt auf Profi-Niveau
 
Zitieren:

Zitat von BHGP (Beitrag 79876)
[...]

- Ich würde gerne Lc0 gegen Stockfish & Co aus einer bestimmten Stellung heraus X Partien (mit oder ohne Seitenwechsel) spielen lassen. Bisher ist mir das nur über die Shredder-GUI gelungen. Fritz und Hiarcs scheinen das nicht zu unterstützen, da sind allenfalls maximal 2 Partien möglich. Habe ich da falsch konfiguriert in Fritz? Insbesondere Fritz würde mich als GUI halt primär "reizen", weil ich doch sehr Chessbase-lastig bin...

Nichts falsch konfiguriert. Indessen frage ich mich, was
es Sinn macht, die selbe Stellung mehrmals mit den
gleichen Gegnern spielen zu lassen.
Gruss
Kurt


Alle Zeitangaben in WEZ +1. Es ist jetzt 23:08 Uhr.

Powered by vBulletin (Deutsch)
Copyright ©2000 - 2025, Jelsoft Enterprises Ltd.
©Schachcomputer.info