Einzelnen Beitrag anzeigen
  #309  
Alt 18.02.2026, 12:37
Benutzerbild von spacious_mind
spacious_mind spacious_mind ist offline
Lebende Foren Legende
 
Registriert seit: 29.06.2006
Ort: Alabama, USA
Land:
Beiträge: 2.676
Abgegebene Danke: 1.274
Erhielt 2.072 Danke für 829 Beiträge
Aktivitäten Langlebigkeit
18/20 18/20
Heute Beiträge
0/3 sssss2676
Re: SenseRobot AI Test Spiele und Tests

Der zweite Satz ist abgeschlossen und hier ist die Endwertung:



Winkie (SenseRobot AI Level 25 (2900 ELO))gewinnt das Turnier mit einem halben Punkt Vorsprung vor Stockfish 18.

Aber man muss sagen, dass es ein bisschen Glück war. Die Niederlage gegen Dragon 3.3 und die beiden überraschenden Unentschieden gegen LC0 und Wasp 7.14, die Stockfish 18 hinnehmen musste, haben sehr geholfen. Das ist ein Unterschied von 1,1/2 Punkten. Aber das gilt sicherlich für alle Teilnehmer.

Ich Hätte und sollte gewinnen reicht nicht aus, um Preise zu gewinnen.

Betrachtet man Stockfish 17.1, so konnte es weder bei einer noch bei drei Sekunden pro Zug die Ergebnisse von Stockfish 18 und SenseRobot AI erreichen. Dies lässt vermuten, dass Stockfish 18 gegenüber 17.1 deutlich verbessert wurde.

Stockfish 18 ist nun das neue Ziel für alle Top-Schachprogramme.

Haben Sie kein Mitleid mit den Engines, wenn Sie denken, sie würden bestraft, weil sie nur eine Sekunde pro Zug spielen müssen. Probieren Sie es einfach selbst aus. Selbst die langsamsten Engines antworten nach der Eröffnung in über 90 % der Fälle sofort mit einer Zugtiefe von über 20 Ply. Nach wenigen Zügen steigt diese auf, und sobald Figuren das Brett verlassen, erhöht sie sich auf über 30 Ply und in Endspielen sogar auf 40 und 50.

Sie sind alle extrem stark bei einer Sekunde Bedenkzeit und würden selbst die besten menschlichen Großmeister mühelos schlagen, selbst wenn sie dem Großmeister so viel Bedenkzeit geben, wie er möchte. Es spielt keine Rolle, der Großmeister wird so oder so verlieren.

Manche Schachprogramme, insbesondere die leistungsschwächeren wie CSTal, Rebels und Wasp, analysieren zu optimistisch. Ich möchte CSTal als Beispiel nehmen, da ich es oft gespielt habe. Es geht von einem Spielstand von +0,7 aus, während andere Programme ihn bei 0,00 sehen, und dieser Wert steigt manchmal sogar auf +1,x. Sobald CSTal auf 0,00 oder -0,1 fällt, kann man sicher sein, dass es kurz vor der Niederlage steht. Das mag zwar einen unterhaltsamen Spielstil ermöglichen, ist aber in seiner Denkweise realitätsfern.

Nun ein Kritikpunkt an vielen Schachprogrammen: Wenn die Wertung 0,00 beträgt, insbesondere im Endspiel (Tabellendatenbanken mal außen vor gelassen, die haben ja keine Intelligenz), wirken die meisten dieser Programme trotz ihrer ausgeklügelten Programmierung auf das menschliche Auge einfach nur dumm. Sie suchen endlos nach etwas, das gar nicht existiert, und man muss sich am Ende nur noch ihre Dummheit ansehen. Nehmen Sie sich ein Beispiel an SenseRobot: Sieht sie keine Hoffnung in einer Stellung, gibt sie sich schnell mit einem Remis zufrieden. Warum Zeit verschwenden? Manche Programme sind sogar so dumm, dass sie eine Wertung von 0,00 auf 0,01 ändern. Das bedeutet, dass sie glauben, ewig im Vorteil zu sein und so lange sinnlose Züge spielen, bis nach 50 Zügen ein Remis erzwungen wird oder die dreimalige Zugwiederholung unvermeidbar ist.

Okay, das waren einige meiner Beobachtungen. (Nicht alles ist zu 100 % positiv.)

Hier einige Statistiken:

Tournament Performance ELO:

Code:
    Program                          Elo    +   -   Games   Score   Av.Op.  Draws

  1 SenseRobot AI-LV25             : 3838   70  52    38    67.1 %   3714   65.8 %
  2 Stockfish 18                   : 3829   70  59    38    65.8 %   3715   63.2 %
  3 Stockfish 17.1                 : 3800   61  42    38    61.8 %   3716   76.3 %
  4 Obsidian160                    : 3800   61  42    38    61.8 %   3716   76.3 %
  5 Dragon 3.3                     : 3782   59  46    38    59.2 %   3717   76.3 %
  6 Alexandria-8.1.12              : 3764   62  57    38    56.6 %   3718   71.1 %
  7 Reckless 0.8.0                 : 3764   57  50    38    56.6 %   3718   76.3 %
  8 Berserk-13                     : 3756   54  47    38    55.3 %   3719   78.9 %
  9 Clover.9.1                     : 3756   59  54    38    55.3 %   3719   73.7 %
 10 Caissa-1.24                    : 3747   61  58    38    53.9 %   3719   71.1 %
 11 PlentyChess-7.0.0              : 3747   46  35    38    53.9 %   3719   86.8 %
 12 Pawnocchio-1.9.2               : 3747   56  52    38    53.9 %   3719   76.3 %
 13 Viridithas-19.0.1              : 3729   49  47    38    51.3 %   3720   81.6 %
 14 Integral 7.0.0                 : 3729   71  70    38    51.3 %   3720   60.5 %
 15 Quanticade Cronus 3.0          : 3703   56  58    38    47.4 %   3722   73.7 %
 16 Chess-System-Tal-2.00          : 3650   64  69    38    39.5 %   3724   63.2 %
 17 Rebel-16.3                     : 3622   77  81    38    35.5 %   3726   50.0 %
 18 Rebel-EAS-3.0                  : 3593   79  84    38    31.6 %   3727   47.4 %
 19 Wasp 7.14                      : 3528   90  97    38    23.7 %   3731   36.8 %
 20 lc0-v0.32.1                    : 3475   82 101    38    18.4 %   3734   36.8 %
Games : 380 (finished)

White Wins : 94 (24.7 %)
Black Wins : 31 ( 8.2 %)
Draws : 255 (67.1 %)
Unfinished : 0

White Perf. : 58.3 %
Black Perf. : 41.7 %

ECO A = 9 Games ( 2.4 %)
ECO B = 150 Games (39.5 %)
ECO C = 38 Games (10.0 %)
ECO D = 48 Games (12.6 %)
ECO E = 135 Games (35.5 %)

Abschließend möchte ich noch einmal auf Apex Duel eingehen, da weiterhin unklar ist, ob die vom Hersteller wiederholt behauptete Behauptung, Apex Duel sei das stärkste Modell (um 300 Elo-Punkte), tatsächlich zutrifft. Meiner Erfahrung nach ist dies nicht der Fall. Daher die beiden gleichen Turniere noch einmal mit Apex Duel.

Anlage: Alle Spiele

https://www.schachcomputer.info/foru...1&d=1771414480

Beste grüße

Nick
Angehängte Grafiken
Dateityp: jpg Screenshot 2026-02-08 BulletTM8.jpg (188,7 KB, 97x aufgerufen)
Angehängte Dateien
Dateityp: pgn The One Second Bullet Bandits of the Universe.pgn (5,15 MB, 6x aufgerufen)

Geändert von spacious_mind (18.02.2026 um 13:00 Uhr)
Mit Zitat antworten
Folgende 5 Benutzer sagen Danke zu spacious_mind für den nützlichen Beitrag:
DirkS (18.02.2026), Gegengambit (18.02.2026), kamoj (18.02.2026), Major Chaos (18.02.2026), Tibono (19.02.2026)