Schachcomputer.info Community

Zurück   Schachcomputer.info Community > Schachcomputer / Chess Computer: > Partien und Turniere / Games and Tournaments


Antwort
 
Themen-Optionen Ansicht

  #241  
Alt 10.11.2015, 16:02
Benutzerbild von Solwac
Solwac Solwac ist offline
Revelation
 
Registriert seit: 18.07.2010
Land:
Beiträge: 782
Abgegebene Danke: 189
Erhielt 338 Danke für 216 Beiträge
Aktivitäten Langlebigkeit
0/20 14/20
Heute Beiträge
0/3 ssssss782
AW: Wettkämpfe

 Zitat von Fluppio Beitrag anzeigen
Hallo Micha,

interessanter Ansatz. Lässt sich kurz (für Laien erläutern worin der Unterschied in der Berechnungsformel liegt?

Gruß, Peter
Für Details solltest Du dem Link folgen.

Aber grob erklärt gibt es vier Unterschiede:
- Ergebnisse gegen deutlich stärkere oder schwächere Gegner werden anders behandelt.
- Ergebnisse wie 10:0 werden anders gewichtet als ein 1:0, das verändert vor allem bei relativ wenigen Partien das Ergebnis.
- der Unterschied zwischen der durchschnittlichen Stärke vieler Gegner und einem Gegner mit der durchschnittlichen Spielstärke wird berücksichtigt.
- Anzug und Unentschieden werden berücksichtigt. Weiß und Schwarz werden also unterschiedlich behandelt, genau wie Sieg und Niederlage einen Ticken anders als zwei Unentschieden sind.
Mit Zitat antworten
Folgender Benutzer sagt Danke zu Solwac für den nützlichen Beitrag:
Boris (12.11.2015)
  #242  
Alt 10.11.2015, 16:49
Benutzerbild von Chessguru
Chessguru Chessguru ist offline
Administrator
 
Registriert seit: 29.06.2004
Ort: Rostock
Alter: 55
Land:
Beiträge: 6.500
Bilder: 1
Abgegebene Danke: 1.624
Erhielt 4.647 Danke für 1.395 Beiträge
Member Photo Albums
Aktivitäten Langlebigkeit
8/20 20/20
Heute Beiträge
0/3 sssss6500
AW: Wettkämpfe

 Zitat von Solwac Beitrag anzeigen
Ich verstehe nicht, warum die Dubletten nicht gewertet werden sollten. Sie zu vermerken, ja. Denn diese Information charakterisiert das Duell zweier Programme. Aber Dubletten zu ignorieren verfälscht das Ergebnis.

Beispiel: Programme A und B spielen 10 Partien.
1:0
1:0
0:1
1:0
0:1
0:1
1:0
1:0
1:0
0:1

(Es sind nur 10 Partien, die Statistik ist also mit einem sehr großen Fehler behaftet - aber das ignoriere ich jetzt mal)

Das Match ist also 6:4 ausgegangen, d.h. bei einer Wiederholung sind wieder 60% für Programm A zu erwarten.

Wenn jetzt die Partien 5 und 6 identisch verlaufen sind, was sagt uns das? Sind die Programme dadurch unterschiedlich in ihrer relativen Stärke? Nein, denn die Erwartung ist immer noch 60% für A.
Bei einer Filterung der Dubletten wäre das Ergebnis 6:3 und ein Leser würde 66,7% für A erwarten.
Ja, schon klar was du mir sagen willst. Damit habe ich aber ein Problem. Oh, oh die Glaubenskämpfe beginnen. Ich bin doch Atheist...

Getreu dem Motto, man beantwortet keine Frage mit einer Gegenfrage, stelle ich diese nun.

Beispiel: Programme A (neues, unbekanntes Gerät) und B (sehr bekanntes Gerät) spielen 10 Partien.
1:0
1:0
1:0
1:0
1:0
1:0
1:0
1:0
1:0
0:1

Das Match ist also 9:1 ausgegangen. Ach ja, 8x wurde die Gewinnpartie wiederholt. Wenn jetzt die Partien 1 bis 9 identisch verlaufen sind, was sagt uns das? Sind die Programme dadurch unterschiedlich in ihrer relativen Stärke?

Nicht nur rein statistisch die Sache beleuchten, sondern auch aus kommerzieller Sicht eines Herstellers. Nach dem oben aufgeführten Prinzip könnte man Listen sehr leicht manipulieren. Ich möchte aber nicht nur die Zufallsbreite des Eröffnungsbuches erfassen, sondern eben auch die schachlichen Qualitäten eines Programms. Erinnerst du dich noch an einige Geräte, die bei ihrem Erscheinen in der SSDF einen fantastischen Elo-Einstiegswert hingelegt haben? Später aber in die Niederungen der Durchschnitts-Elos abrutschten? Ein Schelm, wer Böses...

Zitieren:
Aber Dubletten zu ignorieren verfälscht das Ergebnis.
Ja schon, aber sie nicht zu ignorieren ebenfalls.

Gruß
Micha
Mit Zitat antworten
Folgende 3 Benutzer sagen Danke zu Chessguru für den nützlichen Beitrag:
Boris (16.05.2016), Robert (11.11.2015), Theo (10.11.2015)
  #243  
Alt 10.11.2015, 17:28
Benutzerbild von Solwac
Solwac Solwac ist offline
Revelation
 
Registriert seit: 18.07.2010
Land:
Beiträge: 782
Abgegebene Danke: 189
Erhielt 338 Danke für 216 Beiträge
Aktivitäten Langlebigkeit
0/20 14/20
Heute Beiträge
0/3 ssssss782
AW: Wettkämpfe

 Zitat von Chessguru Beitrag anzeigen
Das Match ist also 9:1 ausgegangen. Ach ja, 8x wurde die Gewinnpartie wiederholt. Wenn jetzt die Partien 1 bis 9 identisch verlaufen sind, was sagt uns das? Sind die Programme dadurch unterschiedlich in ihrer relativen Stärke?
Ja, sind sie.
A würde schließlich zu 90% diese eine Gewinnpartie spielen.

Was die Sorge vor "gekochten" Büchern angeht, so kann man so einem Programm nur ein gutes Eröffnungsbuch attestieren wenn gegen verschiedene Gegner Erfolge erzielt werden. Mehr Partien gegen einen "geknackten" Gegner bringen keinen Erkenntnis mehr.

Du willst die schachlichen Qualitäten wissen? Dann teste sie durch passende Testpositionen.
Du willst ihre Erfolgswahrscheinlichkeit wissen? Dann spiele Partien.
Du willst wissen, wie gut spielt das Gerät ohne Eröffnungsbibliothek? Dann spiele Partien aus vorgegebenen Stellungen und hoffe auf eine repräsentative Auswahl dieser Stellungen.
Mit Zitat antworten
  #244  
Alt 10.11.2015, 18:03
Benutzerbild von Fluppio
Fluppio Fluppio ist offline
Schachcomputer Koryphäe
 
Registriert seit: 02.09.2004
Ort: im Urlaub
Alter: 59
Land:
Beiträge: 1.229
Bilder: 13
Abgegebene Danke: 970
Erhielt 794 Danke für 255 Beiträge
Aktivitäten Langlebigkeit
4/20 20/20
Heute Beiträge
0/3 sssss1229
AW: Wettkämpfe

 Zitat von Solwac Beitrag anzeigen
Für Details solltest Du dem Link folgen.

Aber grob erklärt gibt es vier Unterschiede:

- Anzug und Unentschieden werden berücksichtigt. Weiß und Schwarz werden also unterschiedlich behandelt, genau wie Sieg und Niederlage einen Ticken anders als zwei Unentschieden sind.
Hi,
die ersten drei Unterschiede finde ich noch nachvollziehbar bei Auswertungen von Comp-Comp Partien, aber die unterschiedliche Wertung von Sieg, Niederlage und Unentschieden bei der ELO-Berechnung sollte mMn nicht mit einfließen.
Mit Zitat antworten
  #245  
Alt 10.11.2015, 18:06
Wolfgang2 Wolfgang2 ist offline
Lebende Foren Legende
 
Registriert seit: 02.02.2005
Ort: Schweinfurt
Alter: 57
Land:
Beiträge: 2.705
Abgegebene Danke: 3.247
Erhielt 3.222 Danke für 1.564 Beiträge
Aktivitäten Langlebigkeit
6/20 20/20
Heute Beiträge
1/3 sssss2705
AW: Wettkämpfe

 Zitat von Chessguru Beitrag anzeigen
...Besonders interessant, die Werte der Novag Super Expert Geräte, die ebenfalls, wie bei der SSDF deutlich niedriger (im Vergleich) liegen als bei unseren Listen (Auswertung per EloStat). Womit auch die Theorie eines Ufo-Forschers widerlegt wäre, dass die Novag Ergebnisse in unseren Listen allesamt geschönt wären...
....
Gruß
Micha
Hallo Micha, da hast Du also höchstpersönlich diverse Novag-Werte mit dem von Dir verwendeten Berechnungsalgorithmus in der bisherigen Wiki-Liste geschönt! //* was alles raus kommt, das ist ja fast so spannend, wie die 2006-er Fußball-WM-Vergabe *//
Außerdem, Vorsicht, von "allesamt geschönt" habe ich nie gesprochen. Constellation 3.6, Super Constellation sind m.E. sehr realistisch eingestuft.

Doubletten erlauben oder nicht ? Das war jetzt das Thema.


A) Im Sinne eines erwartbaren (Turnier-)Ergebnis gegen Computer muss ich solche natürlich erlauben. Denn wenn ein und vielleicht sogar derselbe Gegner immer wieder auf die gleiche Eröffnungsfalle herein fällt, dann ist es eben so. Da bin ich auf der Seite von Solwac.

B) Wenn ich die praktische Spielstärke, beispielsweise gegen Menschen (solche soll es ja auch noch geben, die sich selbst ans Brett setzen ) ermitteln will, sind Doubletten natürlich nicht hilfreich. Schon allein, weil man sich nicht zweimal mit dem gleichen Trick übertölpeln lässt.
Da bin ich auf der Seite von Micha.

Selbst versuche ich auch, Doubletten zu vermeiden. Gehe also den Weg (B). Wobei bei beispielsweise zehn Partien auch zwei Mal "Spanisch" dabei sein darf, wenn die Varianten frühzeitig sich unterscheiden.

Tatsächlich schwierig wird es dann, wenn man 20 oder mehr Partien spielen lässt. Was soll man tun ?
(a) auf Gedeih und Verderb Vielfalt reinbringen, was bei manchen Geräten (z.B. Mephisto Roma) verdammt schwierig ist, und den Rechner dann auch vielleicht benachteiligt, oder
(b) mit vielen zueinander ähnlichen Partien "leben", was langweilig ist.

Gruß
Wolfgang
Mit Zitat antworten
  #246  
Alt 10.11.2015, 19:18
Benutzerbild von Solwac
Solwac Solwac ist offline
Revelation
 
Registriert seit: 18.07.2010
Land:
Beiträge: 782
Abgegebene Danke: 189
Erhielt 338 Danke für 216 Beiträge
Aktivitäten Langlebigkeit
0/20 14/20
Heute Beiträge
0/3 ssssss782
AW: Wettkämpfe

 Zitat von Fluppio Beitrag anzeigen
Hi,
die ersten drei Unterschiede finde ich noch nachvollziehbar bei Auswertungen von Comp-Comp Partien, aber die unterschiedliche Wertung von Sieg, Niederlage und Unentschieden bei der ELO-Berechnung sollte mMn nicht mit einfließen.
Warum nicht, wenn es doch die Verteilung besser beschreibt?
Mit Zitat antworten
  #247  
Alt 11.11.2015, 09:22
Benutzerbild von Robert
Robert Robert ist offline
Lebende Foren Legende
 
Registriert seit: 30.06.2004
Ort: Regensburg
Alter: 60
Land:
Beiträge: 4.196
Abgegebene Danke: 1.807
Erhielt 823 Danke für 481 Beiträge
Aktivitäten Langlebigkeit
7/20 20/20
Heute Beiträge
1/3 sssss4196
AW: Wettkämpfe

 Zitat von Solwac Beitrag anzeigen
Ja, sind sie.
A würde schließlich zu 90% diese eine Gewinnpartie spielen.
Aber das klappt idR ja nur gegen diesen einen Gegner, deshalb finde ich das für den Zweck der Ermittlung einer zuverlässigen ELO zumindest fragwürdig.
Wenn ein 1700-er Programm gegen ein 2000-er Programm nur aufgrund eines Buchfehlers oder einer Killervariante etliche Dubletten gewinnt (MM V ohne HG550 ist da sehr anfällig; habe da eigene Erfahrungen), dann verfälscht das mMn die ELO durchaus. Und die Partien gegen andere Gegner können das nicht mehr korrigieren, sondern bestenfalls etwas begradigen; der "Fehler" bleibt.

Zitieren:
Was die Sorge vor "gekochten" Büchern angeht, so kann man so einem Programm nur ein gutes Eröffnungsbuch attestieren wenn gegen verschiedene Gegner Erfolge erzielt werden. Mehr Partien gegen einen "geknackten" Gegner bringen keinen Erkenntnis mehr.
Wenn ich Dich richtig verstehe, wäre also nur eine bestimmte Anzahl an Dubletten vertretbar? Und wie hoch dürfte diese Zahl dann sein?
Sorry, aber das fände ich dann ziemlich inkonsequent: Wenn Dubletten erlaubt sind, dann müssen alle zählen...

Meine Meinung kurzgefasst:
Für ein Turnier müssen Dubletten natürlich zählen (der Turnierleiter/Bediener kann ja nicht bei jeder Partie einen Dublettencheck machen), aber für die ELO-Auswertung dürfen sie nicht herangezogen werden...

viele Grüße
Robert
Mit Zitat antworten
  #248  
Alt 11.11.2015, 10:07
Benutzerbild von Solwac
Solwac Solwac ist offline
Revelation
 
Registriert seit: 18.07.2010
Land:
Beiträge: 782
Abgegebene Danke: 189
Erhielt 338 Danke für 216 Beiträge
Aktivitäten Langlebigkeit
0/20 14/20
Heute Beiträge
0/3 ssssss782
AW: Wettkämpfe

 Zitat von Robert Beitrag anzeigen
Aber das klappt idR ja nur gegen diesen einen Gegner, deshalb finde ich das für den Zweck der Ermittlung einer zuverlässigen ELO zumindest fragwürdig.
Warum?

Elo sagt nichts über die schachliche Qualität aus, nur über den Erfolg in Partien. Ob die Siege durch überlegenes Wissen, eine tiefere Suche oder ein überlegenes Buch zustande kommen, da gibt es keinen Unterschied.

 Zitat von Robert Beitrag anzeigen
Wenn ein 1700-er Programm gegen ein 2000-er Programm nur aufgrund eines Buchfehlers oder einer Killervariante etliche Dubletten gewinnt (MM V ohne HG550 ist da sehr anfällig; habe da eigene Erfahrungen), dann verfälscht das mMn die ELO durchaus. Und die Partien gegen andere Gegner können das nicht mehr korrigieren, sondern bestenfalls etwas begradigen; der "Fehler" bleibt.
Da ist kein Fehler, der bleiben kann. Das eine Duell ergibt ein Ergebnis abweichend von der Erwartung aufgrund der anderen Duelle, mehr nicht. Die Streuung der Ergebnisse ist also größer, aber das ist halt so. Werden jetzt weitere Gegner in die Wertung einbezogen, dann trägt das eine Einzelduell immer weniger zum Gesamtergebnis bei.

 Zitat von Robert Beitrag anzeigen
Wenn ich Dich richtig verstehe, wäre also nur eine bestimmte Anzahl an Dubletten vertretbar? Und wie hoch dürfte diese Zahl dann sein?
Sorry, aber das fände ich dann ziemlich inkonsequent: Wenn Dubletten erlaubt sind, dann müssen alle zählen...
Nein, alle Dubletten müssen zählen.

Eine Dublette gibt aber schachlich keine neuen Erkenntnisse, die entstehende Partie ist in ihrem Ergebnis ja bekannt. Stell Dir vor, zwei Programme haben kein Buch. Dann gibt genau zwei verschiedene Partien (P1-P2 und P2-P1). Nach diesen zwei Partien ist das Kräfteverhältnis im direkten abschließend geklärt. Eine dritte, vierte, hundertste Partie wird keine neuen Erkenntnisse liefern. Eine numerische Auswertung wird aber dieses Duell mit steigender Anzahl von Partien immer stärker wichten. Da liegt das Problem.

Bei älteren Programmen mit kleinem Buch tritt meist folgender Fall ein:
Zuerst bekommt man verschiedene Partien. Irgendwann wiederholen sich die ersten Partien, so könnten bei einem Wettkampf über 20 Partien z.B. 2 identische Partien auftreten. Werden jetzt mehr Partien gespielt, dann gibt es irgendwann keine neuen Partien mehr, alle möglichen verschiedenen Partien wurden gespielt, alle Kombinationen der aktiv gespielten Züge aus dem Buch sind dran gewesen.
Werden jetzt noch weitere Partien gespielt, so wird nur noch der Fehler bei der Bestimmung der Ausspielwahrscheinlichkeiten kleiner.

 Zitat von Robert Beitrag anzeigen
Meine Meinung kurzgefasst:
Für ein Turnier müssen Dubletten natürlich zählen (der Turnierleiter/Bediener kann ja nicht bei jeder Partie einen Dublettencheck machen), aber für die ELO-Auswertung dürfen sie nicht herangezogen werden...
Damit erhält man eine falsche Einschätzung.
Mit Zitat antworten
  #249  
Alt 08.05.2016, 17:18
Eckehard Kopp Eckehard Kopp ist offline
Resurrection
 
Registriert seit: 08.07.2004
Beiträge: 583
Abgegebene Danke: 324
Erhielt 231 Danke für 99 Beiträge
Aktivitäten Langlebigkeit
1/20 20/20
Heute Beiträge
0/3 ssssss583
AW: Wettkämpfe

Ich habe den Designer 2000 (= Excellence 3 MHz mit größerer Biblio)
einige Partie auf Turnierstufe spielen lassen:

Des 2000 - Turbostar KSO 4,5:1,5
6 enge Partien, am Ende hat meistens der Fidelity die Nase vorn.

Des 2000 - Krypton Challenger 7,5:12,5
Ein überraschend klares Ergebnis

Supermondial - Krypton Challenge 11:9

Gruß Eckehard
Mit Zitat antworten
Folgende 4 Benutzer sagen Danke zu Eckehard Kopp für den nützlichen Beitrag:
Egbert (08.05.2016), Mapi (08.05.2016), paulwise3 (08.05.2016), Robert (08.05.2016)
  #250  
Alt 24.06.2016, 00:33
Eckehard Kopp Eckehard Kopp ist offline
Resurrection
 
Registriert seit: 08.07.2004
Beiträge: 583
Abgegebene Danke: 324
Erhielt 231 Danke für 99 Beiträge
Aktivitäten Langlebigkeit
1/20 20/20
Heute Beiträge
0/3 ssssss583
AW: Wettkämpfe

Ich habe den Supermondial gegen den Par Ex 16 MHz auf Turnierstufe spielen lassen (40/120), allerdings bekam der Par nur 2 Min/Zug, was etwa 10,6 MHz entsprechen sollte.
Supermondial (1891) - Par Ex (ca. 1980) 1,5:8,5.
Außer einer schönen Angriffspartie gelang dem SuMo nicht viel.

Mit einer Min pro Zug sollte der Par Ex etwa mit 5,3 MHz spielen.
Supermondial - Par Ex (1880) 3,5:6,5
Immer noch ein deutliches und für mich überraschendes Ergebnis.
Die Partien dauerten hier deutlich länger, es war deutlich zäher für den Par.

Vor einigen Jahren ließ ich den Turbostar gegen den SuMo auf Turnierstufe spielen. Das Ergebnis war mit 16,5:7,5 eindeutig für den SuMo.
Eins der Probleme des Turbos war die mangelnde Ausnutzung der Zeit.
Ich habe es daher jetzt mit 3Min/Zug, probiert, doch hier lief es genau
wie mit 40/120: viele Sofortantworten, viel Zeit blieb ungenutzt.
Mit der nächsthöheren Stufe (6Min/Zug) überschritt der Scisys erwartungsgemäß die Zeit, allerdings um weniger als eine halbe h!
Von den programmierbaren Stufen erwies sich 30/120 als die Stufe,
auf der die Zeit am besten genutzt wird.
Am Ende gewann der SuMo 18:12, jetzt gegen den Turbostar KSO.

Gruß Eckehard
Mit Zitat antworten
Folgender Benutzer sagt Danke zu Eckehard Kopp für den nützlichen Beitrag:
Egbert (24.06.2016)
Antwort


Forumregeln
Du bist nicht berechtigt, neue Themen zu erstellen.
Du bist nicht berechtigt, auf Beiträge zu antworten.
Du bist nicht berechtigt, Anhänge hochzuladen.
Du bist nicht berechtigt, deine Beiträge zu bearbeiten.

BB code ist An
Smileys sind An.
[IMG] Code ist An.
HTML-Code ist An.

Gehe zu

Ähnliche Themen
Thema Erstellt von Forum Antworten Letzter Beitrag
Turnier: Neue Aktiv-Schach Wettkämpfe lexmark_z55 Partien und Turniere / Games and Tournaments 1 04.03.2005 19:05


Alle Zeitangaben in WEZ +2. Es ist jetzt 13:02 Uhr.



Powered by vBulletin (Deutsch)
Copyright ©2000 - 2024, Jelsoft Enterprises Ltd.
©Schachcomputer.info