|
||||||||||||
AW: Revelation II Begrüßungsturnier
Zum Ersten :
Ich glaube das die Ergebnisse von Eckehard schon demonstriert das eben nach eine solche Reihe von Siegen, nach noch mehrere partien doch die leistung noch ganz anders aussehen kann. Aber gut wenn programme umso 200 ELO aus einander liegen gibt es noch immer 25% chancen. Ich habe so etwas ebenso gesehen in mein Zweikampf zwischen Conny 3.6 und T432, eben wenn diese SC sich einander ELO weise nicht weit entfernen. Auch der Conny 3.6 schlagte der Europa mit 6-1 aber wie wurde das gleiche ergebnis sein nach 100 partien ? Statistisch würde est "veilleicht" schief sein aber doch vielleicht wesentlich anders als die % nach 7 Spiele. Zweitens : Glaube ich das 2 criterien gilten. Eine minimalen nummer of Gegner und eine minimale nummer of Partien. So wird er "vorläufig" bewertet. Für mich kann es eben so noch besser. Vielleicht 4 Unterschiedliche Gegner und 20 Partien, aber gut es handelt sich nur um eine vorläufige wertung. Keine idee ob die Vorlaufige wertung gilten für die Gegner (sollte so nicht sein laut FIDE, KBSB National ELO vermutlich auch USCF oder DWZ ELO) Für FIDE (sehe Fide handbuch, https://www.fide.com/fide/handbook.h...2&view=article) ist nur über 400 ELO eine partie ein bischen "Sinnlos". Auch werden complette nul ergebnisse (beim ersten ELO zahl) oder weniger als 1000 ELO erwischt. Das gilt hier nicht für die Zweikämpfe des Dallas. Diese regeln sind nur da um wichtige Schwankungen zu vermeiden. Weil Brett Computer dazu nicht die möglichkeit haben von Ihre Fehler zu lernen, starker, in bestimmte falle, Spielen Sie immer die gleiche Züge auf die gleiche Situation (wenn Sie keine randomiser haben für gleichwertige Züge oder eine zu kleine Eroffnungbibliothek) ist es ganz möglich das ein Brettcomputer , zufälligerweise oder nicht, eine z.b. "anti Novag" styl hat. Auch bei menschen gibt es gleich/andere gleichmäsige Faktoren (Psychologie, Gambiten, Eroffnungswahl,...). Schau dies (StatistikTeil ELO Liste), zum Bewertungskriterien auf unsere geliebten wiki: Es seht sehr sehr vernünftig aus. Zitieren:
1. Ein Gerät muss mindestens 15 Partien gegen 2 Gegner gespielt haben, um eine Wertungszahl zu erhalten. Es wird dann mit P für “vorläufig” bewertet (engl. preliminary) bezeichnet. 2. Ein Gerät muss mindestens 50 Partien gegen 3 Gegner gespielt haben, damit es als vollwertig bewertet in die Liste aufgenommen wird (Bezeichnung F, engl. full). 3. Ein Gerät, das 150 Partien gegen 15 % der in der Liste geführten Geräte gespielt hat wird als Referenzgerät bezeichnet (Bezeichnung R, engl. reference). 4. Ein Gerät, das 300 Partien gegen 20 % der in der Liste geführten Geräte gespielt hat wird als Meistergerät bezeichnet (Bezeichnung M, engl. master). Nur sollte die wertung "vörlaufig" sein , damit wir wissen das dies noch nicht mit viel sicherheit sein Spielnivo ist und etwas scharfer steht im vergleich zu einem "Augenhohe" ELO. Ich glaube das es klar ist das Egbert im Rumfrage angeboten hat welche schachsehle im Revalation II zum eine Wertung kommt. Wie ich es sehe wird Egbert noch viele andere Gegner im Gerendert bringen und wird alles klar sein. Ich kann mich finden in welchem Meinungen auch , aber ebenso im vielleicht das gegengestellte. Ich basiere mich auf was für hände ist (brunnen) und was im Algemeinem vernunftig ist. Ich wolte nur ermitteln das ein Augenhohe wertung -> vorläufige wertung -> full wertung -> Referenz wertung den Weg ist. Für dies brauchen wir schachpartien, daher das so viele mehrere oder wenige partien mit uns teilen. Ich werde mich jedenfalls freuen weitere partien zu sehen eben mit Gegner im 2000 bereich wenn Egbert überhaupt keine andere hätte. Geändert von StefanT (08.12.2015 um 14:38 Uhr) |
Folgender Benutzer sagt Danke zu StefanT für den nützlichen Beitrag: | ||
Egbert (08.12.2015) |
|
||||
AW: Revelation II Begrüßungsturnier
Danke Stefan für Deine umfangreiche Stellungnahme. Du hast die Intention meines Tuns vollkommen korrekt erfasst.
Gruß Egbert |
|
||||||||||||
AW: Revelation II Begrüßungsturnier
das ist ein interessantes Thema, wenngleich hier wohl ein bißchen off-topic Ich mache trotzdem weiter! Wenn's zu sehr ausufert, müssen wir den Kram vielleicht in einen anderen Thread verschieben. Ich glaube mich nämlich ebenfalls dunkel daran zu erinnern, daß Micha mal so etwas erwähnt hat, daß extreme Vergleiche rausgenommen werden. Und auch mir ist so etwas im Grunde suspekt, weil die Statistik das theoretisch wieder einrenken sollte. Aber spätestens, wenn man die Dokumentation zu Bayeselo liest, kommt man darauf, daß es sich hier vielleicht nur um ein Problem des in unseren Listen verwendeten EloStat-Algorithmus handeln könnte. Mir hat die Sache keine Ruhe gelassen, und ich habe mal, basierend auf den Szenarien aus dieser Diskussion, eine Test-PGN-Datei gemacht (zu finden im Anhang). Darin zu finden ist ein "Player X", von dem ich annehme, der hätte 2180 Elo. Dieser Spieler spielt 3 Matches a 20 Partien: Einmal 19:1 gegen einen 2000-Spieler (zu hoch), einmal 11:9 gegen 2145 (korrekt) und einmal 9:11 gegen 2215 (korrekt). Mit EloStat ergibt sich daraus folgende "Liste": Code:
Program Elo + - Games Score Av.Op. Draws 1 Player 2215 : 2316 80 31 20 55.0 % 2281 90.0 % 2 Player X : 2250 54 48 60 65.0 % 2142 63.3 % 3 Player 2145 : 2246 31 80 20 45.0 % 2281 90.0 % 4 Player 2000 : 1769 222 88 20 5.0 % 2281 10.0 % Code:
Rank Name Elo + - games score oppo. draws 1 Player 2215 2295 79 78 20 55% 2273 90% 2 Player X 2273 52 51 60 65% 2149 63% 3 Player 2145 2252 78 79 20 45% 2273 90% 4 Player 2000 1900 118 182 20 5% 2273 10% Man sieht, daß mit Bayeselo die Spreizung nicht so groß ist. Beide Programme "erkennen" die Problematik des 19:1-Ergebnisses (allerdings eher als schlechtes Rating für den Verlierer), wobei EloStat das Rating des Verlierers gnadenlos runterzieht und in der Fehlerspanne zu erkennen gibt, daß das Programm vermutlich besser ist; Bayeselo hat eine höhere Zahl, aber dafür wird ein nach unten größeres Fehlerfenster geöffnet. Da wir in der Praxis oft gar nicht in die offizielle Liste mit den Fehlerspannen, sondern nur in die Wiki-Liste gucken, ist mir persönlich der Bayeselo-Ansatz etwas sympathischer. Ob Micha wohl ganz auf das Ausfiltern der Ausreißer-Ergebnisse verzichten könnte, wenn man die Listen mit diesem Tool berechnen würde? Dazu brauchen wir vermutlich noch mehr Untersuchungen... Viele Grüße, Dirk Edit: In diesem Fall fällt bei der EloStat-Auswertung auch negativ auf, daß der "Player X" nicht in der Mitte zwischen 2215 und 2145 liegt. Das 19:1-Ergebnis hat ihm also sogar geschadet! Das paßt bei Bayeselo besser. Und nicht vergessen: Die "Ratings" für die "bekannten" Spieler sind dem Auswerteprogramm hier natürlich nicht bekannt; das Auswerteprogramm kennt natürlich nur die vorliegenden 60 Partien. Geändert von Supergrobi (08.12.2015 um 20:01 Uhr) |
|
||||||||||||
AW: Revelation II Begrüßungsturnier
Beide Male war als Offset 2180 eingestellt, aber die absoluten Ratings sind hier wohl eher nebensächlich.
Man sieht, daß mit Bayeselo die Spreizung nicht so groß ist. Beide Programme "erkennen" die Problematik des 19:1-Ergebnisses (allerdings eher als schlechtes Rating für den Verlierer), wobei EloStat das Rating des Verlierers gnadenlos runterzieht und in der Fehlerspanne zu erkennen gibt, daß das Programm vermutlich besser ist; Bayeselo hat eine höhere Zahl, aber dafür wird ein nach unten größeres Fehlerfenster geöffnet. Damit das 19:1 gegen 2000 Elo klar ein "Ausreißer" ist, habe ich der virtuellen PGN-Datei noch zwei weitere Matches eingegeben: Ein 5:15 von Elo 2000 gegen 2215 und ein 6:14 gegen 2145 entspricht möglichst genau der jeweiligen Elo-Differenz. Wie werden die Programme nun den Ausreißer bewerten? Hier EloStat: Code:
Program Elo + - Games Score Av.Op. Draws 1 Player X : 2275 54 48 60 65.0 % 2168 63.3 % 2 Player 2215 : 2260 64 47 40 65.0 % 2153 70.0 % 3 Player 2145 : 2205 57 49 40 57.5 % 2153 75.0 % 4 Player 2000 : 2014 63 74 60 20.0 % 2255 40.0 % Code:
Rank Name Elo + - games score oppo. draws 1 Player X 2252 66 66 60 65% 2156 63% 2 Player 2215 2236 81 81 40 65% 2146 70% 3 Player 2145 2192 79 79 40 58% 2146 75% 4 Player 2000 2039 75 75 60 20% 2227 40% Hier nochmal kurz die Übersicht über das File (ist auch wieder neu im Anhang): Code:
1 Player X 2252 60.0 ( 39.0 : 21.0) 20.0 ( 9.0 : 11.0) Player 2215 2236 20.0 ( 11.0 : 9.0) Player 2145 2192 20.0 ( 19.0 : 1.0) Player 2000 2039 2 Player 2215 2236 40.0 ( 26.0 : 14.0) 20.0 ( 11.0 : 9.0) Player X 2252 20.0 ( 15.0 : 5.0) Player 2000 2039 3 Player 2145 2192 40.0 ( 23.0 : 17.0) 20.0 ( 9.0 : 11.0) Player X 2252 20.0 ( 14.0 : 6.0) Player 2000 2039 4 Player 2000 2039 60.0 ( 12.0 : 48.0) 20.0 ( 1.0 : 19.0) Player X 2252 20.0 ( 5.0 : 15.0) Player 2215 2236 20.0 ( 6.0 : 14.0) Player 2145 2192 Dirk |
|
||||||||||||
AW: Revelation II Begrüßungsturnier
Aber spätestens, wenn man die Dokumentation zu Bayeselo liest, kommt man darauf, daß es sich hier vielleicht nur um ein Problem des in unseren Listen verwendeten EloStat-Algorithmus handeln könnte.
|
|
||||
AW: Revelation II Begrüßungsturnier
Guten Morgen Schachcomputerfreunde
die 10.Partie ist absolviert. Ein Glückwunsch an Wolfgang, welcher bereits frühzeitig das Zwischenergebnis von 9:1 für den Revelation II Dallas gegen den Novag Zircon II prognostiziert hat Das Unentschieden in der 10. Partie war jedoch mehr als glücklich aus Sicht des Favoriten. Im Verlaufe des Wettkampfs werden andere Geräte nicht so nachsichtig mit den Schwächen des Lang-Programms umgehen. Andererseits darf nie vergessen werden, das Programm stammt aus dem Jahre 1986...
[Event "Revelation II Begrüßungsturnier"]
[Site "Dreieich"] [Date "2015.12.09"] [Round "210"] [White "Novag Zircon II"] [Black "Mephisto Dallas 68030, 66 MHz"] [Result "1/2-1/2"] [ECO "D20"] [Annotator "Egbert"] [PlyCount "182"] 1. d4 d5 2. c4 dxc4 3. e4 e5 4. Nf3 Bb4+ 5. Bd2 Bxd2+ 6. Nbxd2 exd4 7. Bxc4 Nc6 {Ende Buch} 8. O-O Nf6 9. e5 {Ende Buch} Nd7 {? Mephisto Dallas offenbart Schwächen in der Eröffnung. Erforderlich ist hier 9. ...Sf6-d5.} 10. Nb3 {? doch Novag Zircon II findet 10. e5-e6! nicht...} O-O 11. Re1 Nb6 12. Bb5 Bd7 13. Nfxd4 Nxd4 14. Nxd4 Bxb5 15. Nxb5 a6 16. Nc3 Qg5 17. Qf3 c6 18. Rad1 Rad8 19. Qe4 Rfe8 20. Rd4 Nd7 21. f4 Qe7 22. Red1 Nc5 23. Qe3 Rxd4 24. Rxd4 f6 25. b4 Ne6 26. exf6 Qxf6 27. Re4 Kf7 28. a4 Rd8 29. g3 g5 30. Ne2 gxf4 31. Nxf4 Ng5 {? ein taktische Ungenauigkeit des Mephisto Dallas, 31. ...Td8-d1+ mit Ausgleich.} 32. Qb3+ Kf8 33. Re2 Qd6 34. Kg2 Rd7 35. h4 Nf7 36. Ne6+ Kg8 37. Qb2 Nh6 38. Nf4 Rd8 39. Qc3 {? besser 39. Db2-b3+} Nf5 40. Qb3+ Kh8 41. Qf7 Rf8 42. Re8 Rxe8 43. Qxe8+ Kg7 44. Qe4 Ne7 45. g4 {? besser 45. a4-a5.} Nd5 46. Nh5+ Kf8 47. Qf5+ Ke8 {? eine weitere taktische Schwäche des Dallas, hier sollte 47. ...Kf8-g8 mit einer nahezu ausgeglichenen Stellung erfolgen.} 48. Qc8+ Ke7 49. Qxb7+ Qd7 50. Qxd7+ Kxd7 51. Kf3 Ke7 52. g5 Nxb4 {? wiederum nicht gut..., hier sollte Schwarz noch wenigstens 52. ... Ke7-f7 versuchen. Doch ohne Hashtables erfordert die Stellung einfach zu viel Rechentiefe. Es ist eine (fast) klare Gewinnstellung für Weiß.} 53. Nf6 Kf7 54. Nxh7 Nd5 {? besser 54. Kf7-g6.} 55. h5 Kg7 56. g6 {?? puh..., übersieht folgende Variante:} (56. Nf6 Ne7 57. Ke4 c5 58. Nd7 c4 59. Kd4 c3 60. Kxc3 Nf5) 56... c5 57. Ng5 Nf6 58. Ne6+ Kh6 59. Nf4 Kg5 60. g7 Kh6 61. Ne6 c4 62. Ke3 Kxh5 63. Kd4 c3 64. Kxc3 Kg6 65. a5 Kh7 {?? damit schenkt Dallas seinem Kontrahenten nochmals alle Sieg-Chancen! 66. ...Kg6-f7! dürfte in ein sicheres Remis münden.} 66. Nc7 {?? übersieht folgendes, es war wohl doch zu tief. In diesen Stellungen sieht man, wie wertvoll die Einführung der Hashtables war.} (66. Kc4 Ng8 67. Kc5 Ne7 68. Kb6 Kg8 69. Kxa6 Kf7 70. Nd8+ Kxg7 71. Kb7) 66... Kxg7 67. Nxa6 Kf7 {?? doch Dallas will den Sieg an dass tapfere kleine Novag-Gerät verschenken, hier muss 67. ...Sf6-e8 erfolgen.} 68. Nc7 Ne4+ 69. Kd4 Nd6 70. a6 Nc8 71. Kc5 Ke7 72. Kc6 Na7+ 73. Kb6 Kd7 74. Nd5 Nc8+ 75. Kb7 Nd6+ 76. Kb8 Nb5 77. Nc3 Nd4 78. Kb7 Nc6 79. Nb5 {?? 79. Sc3-e4! gewinnt, so läuft die Partie in ein Remis.} (79. Ne4 Na5+ 80. Kb6 Nc6 81. Nc5+ Kd6 82. Nb7+ Kd5 83. Na5 Nxa5 84. a7) 79... Na5+ 80. Kb6 Nc4+ 81. Kc5 Nb2 82. Nd4 Kc7 83. Kb5 Kb8 84. Nc6+ Kc7 85. Ne5 Na4 86. Nd7 Nc3+ 87. Kc5 Ne4+ 88. Kb4 Nf6 89. Nc5 Kb6 90. Kc4 Ne4 91. Nxe4 Kxa6 {ein mehr als glückliches Remis für den Revelation II Mephisto Dallas. In dieser Partie wurde überdeutlich, wie sehr den beiden Geräten Hashtables fehlen. Mit der "normalen" Suche wurden einfach nicht die erforderlichen Rechentiefen erreicht.} 1/2-1/2 Gruß Egbert |
Folgender Benutzer sagt Danke zu Egbert für den nützlichen Beitrag: | ||
Wolfgang2 (10.12.2015) |
|
|||||||||||
AW: Revelation II Begrüßungsturnier
Hallo Egbert,
55. g5-g6 würde ich dem Zircon II nicht vorwerfen. Denn es braucht eine Suchtiefe von 18 Halbzügen, um zu erkennen, dass nach 55. Sf6!! schwarz nicht auf f6 tauschen darf. Der Tausch auf f6 sieht schlecht aus, aber es ist, wie nachstehende Variante zeigt, lediglich ein Zug, den schwarz auf seinem Königsmarsch zum Damenflügel zu spät kommt. Wäre er nach c7 gekommen, hätte weiß nicht gewinnen können. Bis der Bauer dann durch ist, vergehen noch einmal sieben Halbzüge.
[Event "Computer Schach Partie"]
[Site "TOSHIBA"] [Date "2015.12.10"] [Round "?"] [White "Rybka 2.2"] [Black "Rybka 2.2"] [Result "*"] [BlackElo "2400"] [ECO "TB: We"] [Opening "iss gewinnt in 12"] [Time "13:49:36"] [WhiteElo "2400"] [TimeControl "120+6"] [SetUp "1"] [FEN "8/6kN/p1p5/3n2PP/P7/5K2/8/8 w - - 0 1"] [Termination "unterminated"] [PlyCount "17"] [WhiteType "human"] [BlackType "human"] 1. Nf6 Nxf6 2. gxf6+ Kxf6 3. Ke4 Kg5 4. Ke5 Kxh5 5. Kd6 Kg6 6. Kxc6 Kf6 7. Kb6 Ke6 8. Kxa6 Kd7 9. Kb7 * Geändert von Wolfgang2 (10.12.2015 um 14:12 Uhr) |
|
||||
AW: Revelation II Begrüßungsturnier
Hallo Wolfgang,
dass ist in der Tat zu viel verlangt und ohne Hashtables sind solche Rechentiefen in vertretbaren Zeiten gar nicht zu erreichen. Gerade ist die 11. Partie zu Ende gegangen. Fortsetzung folgt Gruß Egbert |
|
||||
AW: Revelation II Begrüßungsturnier
...wie bereits angekündigt nun die 11. Partie. Klarer hätte die Angelegenheit kaum sein können. Von der Eröffnung an begab sich der kleine Zircon II auf Abwege und wurde von einem daraufhin sehr stark aufspielenden Revelation II förmlich auseinandergenommen. Somit steht es nun 10:1 für den klaren Favoriten.
[Event "Revelation II Begrüßungsturnier"]
[Site "Dreieich"] [Date "2015.12.10"] [Round "211"] [White "Mephisto Dallas 68030, 66 MHz"] [Black "Novag Zircon II, Egbert"] [Result "1-0"] [ECO "C26"] [Annotator "Egbert"] [PlyCount "79"] {600MB, EGBERT-PC} 1. e4 e5 2. Nc3 Nf6 3. a3 {Ende Buch} g6 4. Nf3 d6 5. d4 Nbd7 {Ende Buch} 6. dxe5 dxe5 7. Be2 Be7 {? na da gehört der Läufer wohl nicht hin...} 8. O-O O-O 9. Bc4 Nb6 10. Bb3 Bd6 {? das kleinere Übel wäre hier evtl. noch der Dametausch gewesen. In der Folge spielt der Revelation II Mephisto Dallas seine wohl bislang stärkste Partie.} 11. Bh6 Re8 12. Ng5 Re7 {? besser ist noch 12. ...Lc8-e6.} 13. Qf3 Rd7 14. g4 {?! originelle Idee, obgleich Ta1-d1 stärker gewesen sein dürfte.} Bc5 {? Zircon II weiß einfach nichts mit der Stellung anzufangen, stärker war hier 14. c7-c5.} 15. a4 Rb8 {?... und hier war 15. ...Td7-d4 notwendig.} 16. a5 Na8 17. Nxf7 {?! ... noch stärker ist:} (17. Rad1 Bd4 18. Nb5 c5 19. c3 Nc7 20. Nxa7) 17... Rxf7 18. Bxf7+ Kxf7 19. g5 Bg4 20. Qxf6+ Qxf6 21. gxf6 Kxf6 22. b4 Bd6 23. Be3 a6 24. Rab1 Bf3 25. b5 axb5 26. Rxb5 c6 27. Rb3 Bc7 28. Ra1 Bg4 29. Ba7 Rd8 30. Rxb7 Bc8 31. a6 Rd2 32. Rb2 Be6 33. Be3 Rd8 34. a7 Bc4 35. Ra4 Be6 36. Ra6 Rd6 37. Bc5 Rd7 38. Rxc6 Ba5 39. Rb8 Rd8 40. Rb7 {und Novag Zircon II war des grausamen Spiels müde geworden und gab auf. Das Novag Gerät konnte überhaupt nichts mit der gespielten Eröffnung anfangen und war mit dem druckvollen Spiel des Mephisto Dallas in dieser Partie vollkommen überfordert. Ja, auch ein Lang-Programm kann sehr schöne Partien aus dem Hut zaubern } 1-0 Gruß Egbert |
|
|
Ähnliche Themen | ||||
Thema | Erstellt von | Forum | Antworten | Letzter Beitrag |
Idee: Revelation - DGT | jumapari | Die ganze Welt der Schachcomputer / World of chess computers | 13 | 21.03.2012 22:33 |
Frage: Revelation 1 | jumapari | Die ganze Welt der Schachcomputer / World of chess computers | 4 | 18.03.2012 14:39 |
Frage: Revelation+DGT=? | blaubaer | Die ganze Welt der Schachcomputer / World of chess computers | 16 | 07.02.2012 14:18 |
Anleitung: Revelation 4.01 | bretti | Die ganze Welt der Schachcomputer / World of chess computers | 10 | 22.11.2009 21:47 |
Test: Shredder auf Revelation Ist ein Revelation! | xchessg | Partien und Turniere / Games and Tournaments | 9 | 23.07.2009 09:00 |