Thema: Studie: Tests und mehr Tests
Einzelnen Beitrag anzeigen
  #1  
Alt 16.01.2025, 01:35
Benutzerbild von spacious_mind
spacious_mind spacious_mind ist offline
Lebende Foren Legende
 
Registriert seit: 29.06.2006
Ort: Alabama, USA
Land:
Beiträge: 2.222
Abgegebene Danke: 650
Erhielt 1.146 Danke für 511 Beiträge
Aktivitäten Langlebigkeit
0/20 18/20
Heute Beiträge
0/3 sssss2222
Tests und mehr Tests

Nun, da Weihnachten vorbei ist und wir uns im neuen Jahr befinden, habe ich vor kurzem begonnen, das Match Mephisto Atlanta gegen Mephisto Vancouver 68020 zu verfolgen. Ich habe auch die anderen Spiele verfolgt, aber dieses finde ich besonders faszinierend, weil ich Atlanta letztes Jahr in den 40 Renaissance-Tests getestet hatte, wo es eine Stärke von 2244 erreichte. Damals hatte ich auch die TM Mephisto Lyon 68030 getestet, die mit 2239 etwas schlechter abschnitt als Atlanta.

Damals dachte ich, dass die Anzahl der Tests vielleicht nicht ausreicht, um gute und exakte Endbewertungen für alle Computer zu erhalten, und dass ich in Zukunft weitere Tests hinzufügen müsste.

Da ich vor kurzem auch mein Bewertungstool mit Arena Analysis erstellt habe, dachte ich mir, warum nicht zurückgehen und einige kürzlich gespielte Partien überprüfen, und ich fand die 50 Partien, die gegen Mephisto London 68000 und Mephisto Lyon 68020 gespielt wurden. Also habe ich diese 100 Partien durch die Arena-Analyse laufen lassen und unten seht ihr die Ergebnisse.

Ich beschloss auch, einen jungen Bobby Fischer im Alter von 12 bis 14 Jahren durch die Analyse laufen zu lassen, um ein Kindergenie aus der Vor-Computer-Ära zu vergleichen und zu sehen, wann und in welchem Alter er beginnen würde, die Computer mit seiner Spielstärke zu überholen. Schließlich war dies der Grund, warum ich die Tests entwickelt habe, um eine Methode zum Vergleich von Mensch und Computer zu haben.

Die Methode, die ich für die Renaissance-Tests und die Arena-Analyse-Spiele verwende, ist genau dieselbe, daher hoffte ich, vergleichbare Ergebnisse zu erhalten.



Ich weiß, dass das Spiel Mephisto London 68000 mit 25-25 unentschieden endete und dass Atlanta Mephisto Lyon 68020 um 3 Punkte mit 26,5-23,5 schlug. Daher war ich sehr überrascht zu sehen, dass von den 2545 Zügen, die gegen Lyon 68020 gespielt wurden, Atlanta im Durchschnitt 172 Punkte pro Zug mehr erzielt hat und von den 2615 Zügen, die gegen Mephisto London 68000 gespielt wurden, hat Atlanta ebenfalls im Durchschnitt 165 Punkte mehr erzielt als London, obwohl die Partie unentschieden endete.

Außerdem ist die endgültige OMESTR-Bewertung 2280 und 2271, ein Unterschied von 9 Punkten, mit einem Durchschnitt von 2276 über die 100 Partien oder 5160 Züge.

Da es sich bei den Renaissance-Tests um Tests nach der Eröffnung handelt, ist ein interessanter Vergleich die ME STR-Wertung nach 100 Partien, die Atlanta mit 2240 Punkten und Renaissance Atlanta mit 2244 Punkten erreichte. All dies scheint ziemlich konsistent zu sein.

Warum zeigen die Ergebnisse gegen Lyon und London also nicht, dass Atlanta erfolgreicher ist? Ich habe absolut keine Ahnung. Zwei Dinge, die mir in den Sinn kommen, sind das Eröffnungsbuch, das in den ersten 12 Zügen des Spiels eindeutig London zu bevorzugen schien, und das zweite, was mir in den Sinn kommt, ist die Suchtiefe, unter der alle dedizierten Computer leiden. Die Auswahl eines Zuges selbst nach 3 Minuten ist, wenn sie Glück haben, meistens nur eine Suchtiefe von 6 Halb-Zuege, daher kann so viel schiefgehen, und dies scheint offensichtlich einen großen Effekt zu haben, der beide Computer ständig betrifft. Sie haben einfach nicht die Fähigkeit zu wissen, was die 7. oder 8. Suchtiefe aufdeckt. Das macht die Spiele interessant, aber auch sehr zufällig. Aber wenn Sie genügend Spiele spielen, wird sich schließlich die Beständigkeit durchsetzen, zu guensten denjeningen der insgesamt bessere Züge spielt. Das kann sogar 100, 200 oder 300 + Spiele dauern, um in einigen Fällen absolut klarzustellen, weil beide Programme insgesamt ziemlich kompetent sind.



Bei Bobby Fischer sieht man, wie sehr er sich im Alter von 13 Jahren verbessert hat. Er hätte gegen Atlanta einige fantastische Spiele und Spaß gehabt. Mit 14 Jahren hätte er Atlanta und wahrscheinlich auch Tasc R30 deutlich übertroffen. Dann bliebe vielleicht nur noch Millennium King Element als würdiger Gegner übrig.

Aber das ist für einen anderen Tag. Ich arbeite mich gerade durch Fischers Alter von 15 und 16 Jahren, also schauen wir mal, was das in Zukunft bringt.

Interessant ist, dass die Leistung seiner Gegner im Durchschnitt mit 14 Jahren im Vergleich zu mit 13 Jahren nachgelassen hat. Ich kann nur annehmen, dass sein Ruf als Wunderkind seine Gegner inzwischen stark mental unter Druck gesetzt hat und sie mehr Fehler gemacht haben.

Seine ersten großen Spiele gegen europäische und russische Gegner begannen 1958, als er 15 war, das wird also ein zukünftiger Bericht und Vergleich sein.

Gruss

Nick
Mit Zitat antworten
Folgende 6 Benutzer sagen Danke zu spacious_mind für den nützlichen Beitrag:
borromeus (16.01.2025), ferribaci (16.01.2025), kamoj (19.01.2025), Mapi (16.01.2025), Roberto (17.01.2025), Thomas J (17.01.2025)