Thema: Frage: Mm5 nur 1575 ELO ??
Einzelnen Beitrag anzeigen
  #55  
Alt 30.06.2017, 01:50
Hartmut Hartmut ist offline
Lebende Foren Legende
 
Registriert seit: 01.04.2010
Ort: Nürnberg
Alter: 61
Land:
Beiträge: 2.336
Abgegebene Danke: 3.495
Erhielt 1.944 Danke für 1.037 Beiträge
Aktivitäten Langlebigkeit
18/20 15/20
Heute Beiträge
2/3 sssss2336
AW: Mm5 nur 1575 ELO ??

 Zitat von Chessguru Beitrag anzeigen
Hallo Hartmut,



naja, im Gegensatz zu dem faktenlosen Gebrülle aus dem CSS Forum, haben wir zumindest ein paar handfeste Sachen anzubieten. Gut, ist jetzt nicht viel, aber zumindest sind es Fakten.
Stimmt. Und das finde ich auch das gute an unserer Liste. Wir haben nicht nur die Partien vom SSDF sondern auch eigene Partien, die wir in die Wertung einbringen können. Das ist nachgewiesenermaßen mehr als gewisse Schreihälse aus dem CSS-Forum beizutragen haben.

...


Zitieren:
Aber eine andere Frage. Kann es sein, dass die Art der Elo Berechnung durch die 3 bekannten Programme an ihre Grenzen stößt und deshalb das Geschrei beginnt?
Ich denke davon kannst du ausgehen. Genau deswegen sind die Leute ja so verwirrt. Das was diese Programme machen ist eine Berechnung die auf einen vorgegebenen Startwert geeicht ist. Daraus resultiert nun ein berechneter Wert der die ganze Liste nun umverteilt. Dabei werden jedoch wichtige Punkte des ELO-Systems vernachlässigt, wie ich es oben schon beschrieben habe.

Zitieren:
Da die PC-Engine Listen ja aufgrund der Vielzahl an Partien gegen 3100 Elo Spielern extrem groß ist, können die Listen nicht falsch sein. Also muss die Sache unten geändert werden. Dabei kommen dann diese wirren Rechenbeispiele heraus. Fakten wären Partien gegen menschliche Gegner, um die Aussagen zu untermauern. Nein, man rechnet irgendetwas hoch und runter, bis es ins Weltbild passt. Auf jetzt einsetzende Rückfragen, kommt eine bekannte Diskussionstaktik zum Einsatz. Sehr unterhaltsam...
Yep, es ist wirklich unterhaltsam. Dabei fragt man sich aber - mit einer gewissen Berechtigung - wie man auf die Idee kommt dass die Listen nicht falsch sein können. Wie gesagt, jede der Listen basiert auf einem gewissen Startwert. Wo nimmt man den auf welcher Grundlage her? Warum diesen und keinen anderen? Einige Listen erklären noch auf welchem Startwert für die Berechnung diese Werte basieren. Keine erklärt auf welcher Grundlage man diesen und keinen anderen Wert genommen hat. Insofern sind alle diese Werte mehr oder weniger spekulativ. Sieht man sich dann die Werte genauer an, dann merkt man dass einige Engines nur immer wieder gegen bestimmte andere Engines antreten. Die Gegnerschaft ist meist überschaubar. Das ist als wenn zich Jahre lang nur im SV Hintertupfing mit Vereinskollegen gespielt und nie an einem externen Turnier teilgenommen hat. Und sowas soll vergleichbar sein? Das kann meines Erachtens nur ein total Irrer annehmen.

Zitieren:
Bewegt man sich, wie bei den meisten Listen in dem kleinen bekannten Rahmen der Top Engines, passt die Nummer. Sind zwar völlig sinnlose Elo Phantastereien, die jeder Grundlage entbehren, aber egal, mit Statistik lässt sich ja alles belegen. Wenn man sich die Werte in der CCRL 40/4 ansieht, wird es langsam eng am Ende. Da muss Stockfish dann schon mit 3484 Elo herhalten.
Das könnte bei der Bedenkzeit sogar stimmen. Gegen einen menschlichen Spieler im Modus 40/4 spielt Stockfish vermutlich wie Gott persönlich... Da gibt es nicht mal eine messbare Wahrscheinlichkeit für ein Remis aus 100 Partien.



Zitieren:
Verwende ich ORDO (mittlerweile Standard bei vielen Ranglisten) für die Berechnung der Aktivliste und setze die Traumwerte von 2000 Elo für den R30 an (MM V hätte dann ~1590), so lande ich am Ende der Liste sogar im negativen Bereich. Was nun? Heißt das, die Geräte am Ende der Liste spielen einfach unterirdisch? Oder ist die ganze Wahrscheinlichkeitsrechnung am Ende wahrscheinlich unwahrscheinlich?
Sie ist unwahrscheinlich schon aufgrund des oftmals fiktiven Startwertes aber auch aufgrund der Berechnungsmethode.

Viele meinen man dürfte die ELO-Zahl nicht berechnen wie es beispielsweise die FIDE macht, weil ein Computer im Gegensatz zu einem menschlichen Spieler sich ja nicht verbessert (wenn er fleissig übt) oder verschlechtert (wenn im Alter die Leistung nachlässt), und auch sonst keinen Formschwankungen unterworfen ist. Dabei ist das ein Fehlschluss. Denn mit jedem Turnier ändert sich ja normalerweise die Gegnerschaft und damit die Relation in der eine Wertungsveränderung zu sehen ist. Die Formschwankung ist damit nur ein kleiner Teil, der in die Berechnung einfließt. Die gibt es eventuell in einem Computerturnier auch. Sei es weil das Zufallsprinzip zuschlägt, sei es weil Eröffnungen gespielt werden die dem Programm eigentlich nicht liegen (was ein Mensch normalerweise nicht tun würde) etc. So gesehen hat auch der Computer Formschwankungen, nur sind die anderer Art. Aber es gibt noch mehrere Unterschiede.

Ist ein Spieler ohne Wertung und nimmt an einem Turnier teil, dann wird der Startwert an bestimmten Kriterien (in der Regel Durchschnitt der gewerteten Spieler) festgemacht und die endgültige Wertung dann am Ergebnis in Relation zu diesem Startwert festgemacht. Es müssen in einem Turnier auch immer eine gewisse Anzahl von Spielern gewertet sein, damit eine Wertung ungewerteter Spieler überhaupt erfolgen kann. In der Folge wird jedes Turnier neu ausgewertet oder wie beim ICCF 4mal im Jahr eine ELO-Zahl auf Basis der seit der letzten Auswertung gespielten Partien errechnet.

Die gängigen Programme, ganz egal ob ORDO, BayesElo oder ELOStat arbeiten hier total anders. Sie könnten einigermaßen genau arbeiten, wenn man sich die Mühe machen würde einzelne Turniere oder eine Serie von Partien aus einem bestimmten Zeitraum auszuwerten. Man hätte dann die alten ELO-Werte, die Veränderungen aus den gespielten Partien, einen Offset für noch ungewertete Programme basierend auf dem Durchschnitt der gewerteten Programme gegen die gespielt wird und damit eine genaue Auswertung.

Stattdessen wird einigen Programmen mit Offset ein Wert zugeordnet von dem niemand weiss wo er herkommt und dann eine riesige Liste durchlaufen. Das was dann am Schluss rauskommt ist mehr Spekulation als irgendetwas anderes. Vor allem weil die Offset-Werte nicht nachvollziehbar sind.

Warum z.B. bei deinem ORDO-Beispiel negative Werte am unteren Ende der Liste möglich sind...

Naja... eigentlich ist das nur deswegen möglich weil eben die Berechnungsgrundlagen von der normalen ELO-Berechnung abweichen. In der FIDE-ELO-Berechnung wäre das nicht möglich. Einerseits weil es einen Mindestwert gibt, bis zu dem ein Spieler noch geführt wird (liegt glaube ich bei 1200) und damit darunter keine ELO-Berechnung stattfindet, andererseits weil gewisse Regeln bei der Berechnung gelten. Ist z.B. der Unterschied zwischen 2 Spielern > 400 ELO Punkte so wird für die Berechnung ein Unterschied von 400 genommen. Damit wird verhindert, das ein Spieler unrealistische ELO-Werte bekommt indem er nur gegen zu schwache Gegner antritt. Bei den normalen ELO-Formeln liegt für diesen Fall die Gewinnerwartung auch bereits bei 92 %. Damit wäre für mehr als 400 Punkte Unterschied auch für den stärkeren kaum mehr was zu gewinnen. Wie es hier bei ORDO, ELoStat und Co ist, weiss ich nicht, vermutlich unterscheiden sich die Berechnungen aber auch hier.

Das Berechnungssystem der Fide könnte man natürlich ebenso in ein Programm pressen wie man Programme wie ELOStat oder ORDO schreiben kann, die rechnen das bei der FIDE schließlich auch nicht per Hand aus. Aber das bedeutet eben dass man nicht mehr so rechnen darf wie es die gängigen ELO-Listen jetzt machen. Man kann eben nicht mehr beliebig viele Partien aus 3 Jahrzehnten wild durcheinanderwürfeln, sondern muss wirklich Stück für Stück Zeiträume oder Turniere auswertet und neue Programme per Offset auf realistische Werte einstellen. Aber dazu ist man schlicht zu faul. Man hat zwar Zeit automatische zichttausende von Partien spielen zu lassen, aber die Zeit für eine ordentliche Liste will man eben nicht opfern. Im Moment erscheint das alles recht willkürlich. Bei uns wäre die normale ELO-Berechnung aufgrund der pro Jahr durchaus überschaubaren Partien-/Turnier-/Wettkampfzahl übrigens ein durchaus vertretbarer Aufwand wenn man ein Programm hätte, welches nach FIDE-Regeln arbeitet.

Wer mehr zur Berechnung von "richtigen" ELO-Zahlen lesen will, darf sich das gerne mal auf den FIDE-Seiten reinziehen. Vielleicht will ja einer auch ein entsprechendes Programm schreiben, lach

http://www.fide.com/fide/handbook.ht...7&view=article

Puh... jetzt hab ich doch weit mehr dazu geschrieben, als ich eigentlich wollte... Zeit fürs Bett.
__________________
Mein Profil beim ICCF (International Correspondence Chess Federation)
https://www.iccf.com/player?id=89948&tab=3

Geändert von Hartmut (30.06.2017 um 02:02 Uhr)
Mit Zitat antworten
Folgende 2 Benutzer sagen Danke zu Hartmut für den nützlichen Beitrag:
Chessguru (30.06.2017), Egbert (30.06.2017)