Der zweite Satz ist abgeschlossen und hier ist die Endwertung:
Winkie (SenseRobot AI Level 25 (2900 ELO))gewinnt das Turnier mit einem halben Punkt Vorsprung vor Stockfish 18.
Aber man muss sagen, dass es ein bisschen Glück war. Die Niederlage gegen Dragon 3.3 und die beiden überraschenden Unentschieden gegen LC0 und Wasp 7.14, die Stockfish 18 hinnehmen musste, haben sehr geholfen. Das ist ein Unterschied von 1,1/2 Punkten. Aber das gilt sicherlich für alle Teilnehmer.
Ich Hätte und sollte gewinnen reicht nicht aus, um Preise zu gewinnen.
Betrachtet man Stockfish 17.1, so konnte es weder bei einer noch bei drei Sekunden pro Zug die Ergebnisse von Stockfish 18 und SenseRobot AI erreichen. Dies lässt vermuten, dass Stockfish 18 gegenüber 17.1 deutlich verbessert wurde.
Stockfish 18 ist nun das neue Ziel für alle Top-Schachprogramme.
Haben Sie kein Mitleid mit den Engines, wenn Sie denken, sie würden bestraft, weil sie nur eine Sekunde pro Zug spielen müssen. Probieren Sie es einfach selbst aus. Selbst die langsamsten Engines antworten nach der Eröffnung in über 90 % der Fälle sofort mit einer Zugtiefe von über 20 Ply. Nach wenigen Zügen steigt diese auf, und sobald Figuren das Brett verlassen, erhöht sie sich auf über 30 Ply und in Endspielen sogar auf 40 und 50.
Sie sind alle extrem stark bei einer Sekunde Bedenkzeit und würden selbst die besten menschlichen Großmeister mühelos schlagen, selbst wenn sie dem Großmeister so viel Bedenkzeit geben, wie er möchte. Es spielt keine Rolle, der Großmeister wird so oder so verlieren.
Manche Schachprogramme, insbesondere die leistungsschwächeren wie CSTal, Rebels und Wasp, analysieren zu optimistisch. Ich möchte CSTal als Beispiel nehmen, da ich es oft gespielt habe. Es geht von einem Spielstand von +0,7 aus, während andere Programme ihn bei 0,00 sehen, und dieser Wert steigt manchmal sogar auf +1,x. Sobald CSTal auf 0,00 oder -0,1 fällt, kann man sicher sein, dass es kurz vor der Niederlage steht. Das mag zwar einen unterhaltsamen Spielstil ermöglichen, ist aber in seiner Denkweise realitätsfern.
Nun ein Kritikpunkt an vielen Schachprogrammen: Wenn die Wertung 0,00 beträgt, insbesondere im Endspiel (Tabellendatenbanken mal außen vor gelassen, die haben ja keine Intelligenz), wirken die meisten dieser Programme trotz ihrer ausgeklügelten Programmierung auf das menschliche Auge einfach nur dumm. Sie suchen endlos nach etwas, das gar nicht existiert, und man muss sich am Ende nur noch ihre Dummheit ansehen. Nehmen Sie sich ein Beispiel an SenseRobot: Sieht sie keine Hoffnung in einer Stellung, gibt sie sich schnell mit einem Remis zufrieden. Warum Zeit verschwenden? Manche Programme sind sogar so dumm, dass sie eine Wertung von 0,00 auf 0,01 ändern. Das bedeutet, dass sie glauben, ewig im Vorteil zu sein und so lange sinnlose Züge spielen, bis nach 50 Zügen ein Remis erzwungen wird oder die dreimalige Zugwiederholung unvermeidbar ist.
Okay, das waren einige meiner Beobachtungen. (Nicht alles ist zu 100 % positiv.)
Hier einige Statistiken:
Tournament Performance ELO:
Code:
Program Elo + - Games Score Av.Op. Draws
1 SenseRobot AI-LV25 : 3838 70 52 38 67.1 % 3714 65.8 %
2 Stockfish 18 : 3829 70 59 38 65.8 % 3715 63.2 %
3 Stockfish 17.1 : 3800 61 42 38 61.8 % 3716 76.3 %
4 Obsidian160 : 3800 61 42 38 61.8 % 3716 76.3 %
5 Dragon 3.3 : 3782 59 46 38 59.2 % 3717 76.3 %
6 Alexandria-8.1.12 : 3764 62 57 38 56.6 % 3718 71.1 %
7 Reckless 0.8.0 : 3764 57 50 38 56.6 % 3718 76.3 %
8 Berserk-13 : 3756 54 47 38 55.3 % 3719 78.9 %
9 Clover.9.1 : 3756 59 54 38 55.3 % 3719 73.7 %
10 Caissa-1.24 : 3747 61 58 38 53.9 % 3719 71.1 %
11 PlentyChess-7.0.0 : 3747 46 35 38 53.9 % 3719 86.8 %
12 Pawnocchio-1.9.2 : 3747 56 52 38 53.9 % 3719 76.3 %
13 Viridithas-19.0.1 : 3729 49 47 38 51.3 % 3720 81.6 %
14 Integral 7.0.0 : 3729 71 70 38 51.3 % 3720 60.5 %
15 Quanticade Cronus 3.0 : 3703 56 58 38 47.4 % 3722 73.7 %
16 Chess-System-Tal-2.00 : 3650 64 69 38 39.5 % 3724 63.2 %
17 Rebel-16.3 : 3622 77 81 38 35.5 % 3726 50.0 %
18 Rebel-EAS-3.0 : 3593 79 84 38 31.6 % 3727 47.4 %
19 Wasp 7.14 : 3528 90 97 38 23.7 % 3731 36.8 %
20 lc0-v0.32.1 : 3475 82 101 38 18.4 % 3734 36.8 %
Games : 380 (finished)
White Wins : 94 (24.7 %)
Black Wins : 31 ( 8.2 %)
Draws : 255 (67.1 %)
Unfinished : 0
White Perf. : 58.3 %
Black Perf. : 41.7 %
ECO A = 9 Games ( 2.4 %)
ECO B = 150 Games (39.5 %)
ECO C = 38 Games (10.0 %)
ECO D = 48 Games (12.6 %)
ECO E = 135 Games (35.5 %)
Abschließend möchte ich noch einmal auf Apex Duel eingehen, da weiterhin unklar ist, ob die vom Hersteller wiederholt behauptete Behauptung, Apex Duel sei das stärkste Modell (um 300 Elo-Punkte), tatsächlich zutrifft. Meiner Erfahrung nach ist dies nicht der Fall. Daher die beiden gleichen Turniere noch einmal mit Apex Duel.
Anlage: Alle Spiele
https://www.schachcomputer.info/foru...1&d=1771414480
Beste grüße
Nick