Folgende 4 Benutzer sagen Danke zu Egbert für den nützlichen Beitrag: | ||
|
|||||||||||
AW: King Besitzer als freiwillige Tester gesucht
Genau solche Partien, besser gesagt Endspiele, wie in der zweiten Partie des SuperConstellation gegen den King 8000, sind ein Grund dafür, dass ich von weiteren Experimenten abgesehen habe.
Die Schwankungsbreite der Leistungen ist zu groß, um zu einer qualifizierten Einschätzung zu kommen. Und dies hängt stark davon ab, wie viele Zugmöglichkeiten es gibt. Und das zieht sich herauf bis zur 16.000-er Stufe. Auch dort werden in Einzelfällen gröbere Fehler gemacht, als das allgemeine Spielniveau bei 500 Knoten pro Zug ist. Denn auch diese 500-er Spielstufe ist in der Lage ein ansehnliches Schach zu spielen. Zumindest so lange es Anhaltspunkte für die Spielentwicklung gibt und es nicht zu kompliziert wird. Kurz gesagt: In der durchschnittlichen, positionell geführten Partie. Meine Meinung insgesamt dazu: Die Idee Elo-Stufen ein zu führen, ist nicht verkehrt. Aber nicht auf dieser Basis der jetzigen Einfach-Stufen. Eine "Umrechnung" der festen Pos./Zug in Elo funktioniert nicht. Vorschlag 1: Entweder man knüpft die Knoten pro Zug an die Anzahl der Zugmöglichkeiten, um (zu) starke Leistungsabfälle in Figurenendspielen zu vermeiden, oder: Vorschlag 2: Nimmt die Rechentiefe-Stufen als Basis für die Elo-Zahl. Gruß Wolfgang |
|
||||||||||||
AW: King Besitzer als freiwillige Tester gesucht
Hi Mike
Hier kannst du es noch einmal in Ruhe nachlesen: https://www.schachcomputer.info/foru...Neues+PGN+Tool
__________________
Gruß Olaf |
Folgender Benutzer sagt Danke zu Novize für den nützlichen Beitrag: | ||
Egbert (12.04.2020) |
|
||||||||||||
AW: King Besitzer als freiwillige Tester gesucht
Danke Egbert für die Info und das Einstellen meiner Partien. Mit dem ergänzenden Hinweis von Novize (Danke dafür) kann ich künftig meine pgn´s selber veröffentlichen.
#Wolfgang2: Über die Idee, die Spielstärken auch für die Suchtiefen zu ermitteln, habe ich auch schon nachgedacht. Wäre sicherlich auch sehr interessant. Frohe Ostern an alle und bleibt gesund. |
Folgender Benutzer sagt Danke zu MikeChess für den nützlichen Beitrag: | ||
Egbert (12.04.2020) |
|
|||||||||||
AW: King Besitzer als freiwillige Tester gesucht
Thanks Mike for the 8000 nodes/move games.
It adds an interesting point to the curve: 79,2% / 1804 = 2036 (the one on the left of the 10000 x-axis value) ![]() Now the 4000 nodes point (on its left) seems a bit high. Forecasted elo @4000 nodes according to my previous formula (not an achievement, would simply help to select consistent opponents) is 1937, while the average opponent for those games was 1789, including a one-way 4-0 for The King against Sensory 12 (1743). The opponents were not balanced enough (not a criticism, we had to baseline it), and The King made it too easy. Should the 4000 mark get lower, points could better align (and updating the formula would be a next step). I can find opponents in this elo-range to complete more games @4000, will take care of that. Cheers, Eric |
|
||||
AW: King Besitzer als freiwillige Tester gesucht
Eine generelle Anmerkung: die Anzahl der Partien ist viel zu niedrig, um daraus viel ablesen zu können.
Wenn man ein Vertrauenslevel von 95% erreichen will und zwei exakt gleichstarke Engines gegeneinander 50 Spiele spielen läßt, dann wäre der Erwartungwert 50%, also 25 Punkte. Tatsächlich hat man aber ein Intervall von +/- 2 Sigma, also etwa Wurzel aus N, und das ist alles zwischen 18 und 32 Punkten. Mithin eine Bandbreite von +/- 100 Elo. Bei noch viel weniger Partien wird die Aussagekraft noch geringer - vier Partien gegen einen Gegner sagen eigentlich nichts aus. Andererseits sind tausende Partien, wie sie nötig wären, aus Aufwandsgründen nicht mit dem physischen Schachcomputer zu machen. Ein Ausweg wäre, The King als UCI- oder WB-Version auf den PC zu laden und dort eine konfigurierbare Drosselung der Knotenrate zu verbauen. Dann kann man auch mit ein bis drei Sekunden pro Zug bei verschiedenen Knotenraten im Selbstmatch zu testen. So ähnlich haben Frank und John das bei Wasp gemacht, und ich bei meiner Engine ebenfalls. Der Spielstärkezuwachs ist typischerweise nicht konstant mit Verdoppelung der Knotenrate, wie schon Thompsons Untersuchungen mit Belle gezeigt haben, weil z.B. der Sprung von 4 auf 6 Halbzüge eine viel größere Wirkung hat als der von 10 auf 12, auch wenn derselbe Faktor an Rechenaufwand dahintersteckt. Gesetz des abnehmenden Ertrages. |
|
|||||||||||
AW: King Besitzer als freiwillige Tester gesucht
Thanks Mike for the 8000 nodes/move games.
It adds an interesting point to the curve: 79,2% / 1804 = 2036 (the one on the left of the 10000 x-axis value) ![]() Now the 4000 nodes point (on its left) seems a bit high. Forecasted elo @4000 nodes according to my previous formula (not an achievement, would simply help to select consistent opponents) is 1937, while the average opponent for those games was 1789, including a one-way 4-0 for The King against Sensory 12 (1743). The opponents were not balanced enough (not a criticism, we had to baseline it), and The King made it too easy. Should the 4000 mark get lower, points could better align (and updating the formula would be a next step). I can find opponents in this elo-range to complete more games @4000, will take care of that. Cheers, Eric Ferner glaube ich tatsächlich, dass zwischen 4000 und 8000 Knoten kein allzu großer Unterschied in der Spielstärke liegt (getestet anhand von Stichproben). Gruß Wolfgang Geändert von Wolfgang2 (12.04.2020 um 15:07 Uhr) Grund: Typo |
|
|||||||||||
AW: King Besitzer als freiwillige Tester gesucht
Genau so ist es. Diese paar auf physischen Brettrechner gespielten Partien sind statistisch völlig unzureichend. Und linear steigt die Spielstärke-Kurve mit zunehmender Knotenzahl definitiv nicht. Abnehmender Grenznutzen. Bekannt.
Leider kann man aber bei der PC Engine (King 3.50) keine maximale Knotenzahl als Limit angeben. Zumindest nicht das ich wüßte. |
|
||||
AW: King Besitzer als freiwillige Tester gesucht
1) Millennium könnte den Testern eine modifierte PC-Engine zur Verfügung stellen, die man entweder über Protokoll oder Kommandozeilen-Parameter dahingehend einstellen kann. 2) Da man für automatisierte Tests z.B. mit Arena anders als mit physischen Schachcomputern nicht viele Testpersonen braucht, könnte Millennium eventuelle Urheberrechts-Bedenken umgehen, indem sie diese Tests einfach im eigenen Haus machen. |
|
|||||||||||
AW: King Besitzer als freiwillige Tester gesucht
Ich stehe grundsätzlich auf dem Standpunkt, dass es viel effizienter ist, den schachlichen Gehalt von relativ wenigen (etwa zehn) Partien zu beurteilen, als die Anzahl der Partien um ein X-faches zu erhöhen. Beispiel: Ich legte mich während der King-Testphase schon ein halbes Jahr vor Erscheinen fest, dass der Stil NORMAL gegen starke Schachprogramme stärker ist als der viel gelobte AKTIV-Stil. Zu der Einschätzung kam ich nach vielleicht zehn bis höchstens 20 Spielen bzw. Einzeltests. Bei dieser Elo-Stärke-Schätzung ist jetzt im Falle von Millennium noch mit zu berücksichtigen, dass der Hersteller die Spitze mit (>) 2400 Elo-Punkten taxiert hat. Es bedarf also an der Spitze einer Abwertung um etwa 150 Punkte ggü. den Wiki-Zahlen. Wenn ich mich jetzt festlegen müsste, würde ich an Ossi Weiner berichten: Knoten / Elo 125: 1050 250: 1200 500: 1320 1000: 1450 2000: 1560 4000: 1650 8000: 1730 16000: 1850 (also ein relativ großer Sprung) Gruß Wolfgang |
Folgende 2 Benutzer sagen Danke zu Wolfgang2 für den nützlichen Beitrag: | ||
Chessguru (12.04.2020), Mythbuster (12.04.2020) |
![]() |
|
|
![]() |
||||
Thema | Erstellt von | Forum | Antworten | Letzter Beitrag |
Turnier: King vs R30 | borromeus | Partien und Turniere / Games and Tournaments | 9 | 01.01.2019 17:54 |
Hilfe: An alle Rebel Portoroz Besitzer (!) ... | mickihamster | Technische Fragen und Probleme / Tuning | 9 | 26.11.2016 17:02 |
Turnier: Besitzer eines Saitek D++ gesucht | achimp | Partien und Turniere / Games and Tournaments | 2 | 15.06.2014 16:20 |
Hilfe: An alle Dallas 68020 Besitzer | Endspielgott | Die ganze Welt der Schachcomputer / World of chess computers | 0 | 13.05.2008 19:01 |
Frage: Eine Frage an die Besitzer eines MM I und MM II Modul. | Mephisto67 | Teststellungen und Elo Listen / Test positions and Elo lists | 0 | 26.01.2007 21:08 |