
Zitat von
Hartmut
Sieht so aus als wäre meine GTX-Karte schon wieder reif für den Elektroschrott... So schnell kann ich gar net sparen, wie es technisch vorwärts geht.
Tja, das “Problem“ ist, daß die RTX Karten es erlauben, daß lc0 seine Fließkomma-Matrizen Berechnungen mit nur 16bit Genauigkeit (cudnn-fp16) durchführen kann, während es bei den GTX Karten eben 32bit sind. Alleine dieses Umschalten auf fp16 beschleunigt lc0 um den Faktor 3.5. Und das ist natürlich ein Riesenunterschied. Und schneller sind die RTX Karten außerdem.
Die mobile GTX 950m in meinen alten Notebooks brachte lc0 auf ca. 1200 n/s in der Grundstellung. Die mobile RTX 2060 in meinem neuen Notebook bringt lc0 auf 18000 n/s. Das ist natürlich ein Quantensprung. Für eine halbwegs test-taugliche Leela-Ratio muß ich die RTX 2060 sogar um gute 30% abbremsen (mit dem MSI Afterburner), sonst wären Stockfish & Co. deutlich im Nachteil, obwohl mein neues Notebook sogar eine Hexacore-CPU hat!