|
|
||||||||||||
AW: Revelation II Begrüßungsturnier
Einen Gedanken wollte ich aber noch einmal aufgreifen. Im Sinne einer Elo-Einstufung bringt dieser Wettkampf nicht all zu viel.
Eine 90% - Quote würde lt. http://www.schacharena.de/new/elo_calc.php dem Dallas Rev II ein Rating von 2493 Wiki-Elo Punkten bescheren, wenn der Zircon II 2029 hat. Bei anderen Berechnungsvorschriften wären es um 2370, aber immer noch ein viel zu hoher Wert. Ich glaube Micha hat mal irgend wo dazu etwas geschrieben, wie klar eine Überlegenheit sein darf, damit sie überhaupt in die Berechnung eingeht. Beispiel: Angenommen der realistische Wert für den Dallas wären 2180 Punkte. Und du spielst nach dem Zircon-Wettkampf gegen Meph Vancouver 68020 und Meph Magellan, jeweils 20 Partien. Zwischen-Ergebnis: Ungefähr auf Augenhöhe.
Dann hättest Du in Summe 60 Turnierpartien gespielt, also auch viel Zeit investiert. Und der Rev II Dallas hätte wegen des enormen Startratings einen verbleibenden Vorteil von einem Drittel der Anfangsüberhöhung also 67 bis 100 Punkte. ![]() Wie Egbert schon sagte, die Abweichung vom Erwartungswert ist gering. Und neben dem Spaß an den Partien ist eine möglichst breitgestreute Palette an Gegnern mit jeweils gleich viel Partien die sauberste Art einer Spielstärkebestimmung. |
Folgender Benutzer sagt Danke zu Solwac für den nützlichen Beitrag: | ||
Egbert (08.12.2015) |
|
||||
AW: Revelation II Begrüßungsturnier
Hallo Wolfgang,
lassen wir uns einfach überraschen, mein Testhunger auf dem Revelation II ist ungestillt ![]() ![]() Gruß Egbert |
|
||||||||||||
AW: Revelation II Begrüßungsturnier
Zum Ersten :
Ich glaube das die Ergebnisse von Eckehard schon demonstriert das eben nach eine solche Reihe von Siegen, nach noch mehrere partien doch die leistung noch ganz anders aussehen kann. Aber gut wenn programme umso 200 ELO aus einander liegen gibt es noch immer 25% chancen. Ich habe so etwas ebenso gesehen in mein Zweikampf zwischen Conny 3.6 und T432, eben wenn diese SC sich einander ELO weise nicht weit entfernen. Auch der Conny 3.6 schlagte der Europa mit 6-1 aber wie wurde das gleiche ergebnis sein nach 100 partien ? Statistisch würde est "veilleicht" schief sein aber doch vielleicht wesentlich anders als die % nach 7 Spiele. Zweitens : Glaube ich das 2 criterien gilten. Eine minimalen nummer of Gegner und eine minimale nummer of Partien. So wird er "vorläufig" bewertet. Für mich kann es eben so noch besser. Vielleicht 4 Unterschiedliche Gegner und 20 Partien, aber gut es handelt sich nur um eine vorläufige wertung. Keine idee ob die Vorlaufige wertung gilten für die Gegner (sollte so nicht sein laut FIDE, KBSB National ELO vermutlich auch USCF oder DWZ ELO) Für FIDE (sehe Fide handbuch, https://www.fide.com/fide/handbook.h...2&view=article) ist nur über 400 ELO eine partie ein bischen "Sinnlos". Auch werden complette nul ergebnisse (beim ersten ELO zahl) oder weniger als 1000 ELO erwischt. Das gilt hier nicht für die Zweikämpfe des Dallas. Diese regeln sind nur da um wichtige Schwankungen zu vermeiden. Weil Brett Computer dazu nicht die möglichkeit haben von Ihre Fehler zu lernen, starker, in bestimmte falle, Spielen Sie immer die gleiche Züge auf die gleiche Situation (wenn Sie keine randomiser haben für gleichwertige Züge oder eine zu kleine Eroffnungbibliothek) ist es ganz möglich das ein Brettcomputer , zufälligerweise oder nicht, eine z.b. "anti Novag" styl hat. Auch bei menschen gibt es gleich/andere gleichmäsige Faktoren (Psychologie, Gambiten, Eroffnungswahl,...). Schau dies (StatistikTeil ELO Liste), zum Bewertungskriterien auf unsere geliebten wiki: Es seht sehr sehr vernünftig aus. Zitieren:
1. Ein Gerät muss mindestens 15 Partien gegen 2 Gegner gespielt haben, um eine Wertungszahl zu erhalten. Es wird dann mit P für “vorläufig” bewertet (engl. preliminary) bezeichnet. 2. Ein Gerät muss mindestens 50 Partien gegen 3 Gegner gespielt haben, damit es als vollwertig bewertet in die Liste aufgenommen wird (Bezeichnung F, engl. full). 3. Ein Gerät, das 150 Partien gegen 15 % der in der Liste geführten Geräte gespielt hat wird als Referenzgerät bezeichnet (Bezeichnung R, engl. reference). 4. Ein Gerät, das 300 Partien gegen 20 % der in der Liste geführten Geräte gespielt hat wird als Meistergerät bezeichnet (Bezeichnung M, engl. master). Nur sollte die wertung "vörlaufig" sein , damit wir wissen das dies noch nicht mit viel sicherheit sein Spielnivo ist und etwas scharfer steht im vergleich zu einem "Augenhohe" ELO. Ich glaube das es klar ist das Egbert im Rumfrage angeboten hat welche schachsehle im Revalation II zum eine Wertung kommt. Wie ich es sehe wird Egbert noch viele andere Gegner im Gerendert bringen und wird alles klar sein. Ich kann mich finden in welchem Meinungen auch , aber ebenso im vielleicht das gegengestellte. Ich basiere mich auf was für hände ist (brunnen) und was im Algemeinem vernunftig ist. Ich wolte nur ermitteln das ein Augenhohe wertung -> vorläufige wertung -> full wertung -> Referenz wertung den Weg ist. Für dies brauchen wir schachpartien, daher das so viele mehrere oder wenige partien mit uns teilen. Ich werde mich jedenfalls freuen weitere partien zu sehen eben mit Gegner im 2000 bereich wenn Egbert überhaupt keine andere hätte. Geändert von StefanT (08.12.2015 um 14:38 Uhr) |
Folgender Benutzer sagt Danke zu StefanT für den nützlichen Beitrag: | ||
Egbert (08.12.2015) |
|
||||
AW: Revelation II Begrüßungsturnier
Danke Stefan für Deine umfangreiche Stellungnahme. Du hast die Intention meines Tuns vollkommen korrekt erfasst.
![]() Gruß Egbert |
|
||||||||||||
AW: Revelation II Begrüßungsturnier
Natürlich habt Ihr beide (Egbert, Solwac) theoretisch nicht Unrecht mit Euren Ansichten. Aber ich sage "theoretisch", weil es meines Erachtens viel zu viel statistisches Material, sprich Partien, braucht, um auf diesem Wege eine einigermaßen abgesicherte Elo-Zahl zu kommen.
Ein Test gegen ungefähr gleich starke Gegner ist da schneller zielführend. Bei menschlichen Gegner kommt Psychologie ins Spiel und nach einem 0:5 oder 1:9 hat man ein gutes Gefühl was die nächsten 10 oder 20 Partien bringen können. Bei Computern ist das nicht der Fall. |
![]() |
|
|
![]() |
||||
Thema | Erstellt von | Forum | Antworten | Letzter Beitrag |
Idee: Revelation - DGT | jumapari | Die ganze Welt der Schachcomputer / World of chess computers | 13 | 21.03.2012 22:33 |
Frage: Revelation 1 | jumapari | Die ganze Welt der Schachcomputer / World of chess computers | 4 | 18.03.2012 14:39 |
Frage: Revelation+DGT=? | blaubaer | Die ganze Welt der Schachcomputer / World of chess computers | 16 | 07.02.2012 14:18 |
Anleitung: Revelation 4.01 | bretti | Die ganze Welt der Schachcomputer / World of chess computers | 10 | 22.11.2009 21:47 |
Test: Shredder auf Revelation Ist ein Revelation! | xchessg | Partien und Turniere / Games and Tournaments | 9 | 23.07.2009 09:00 |