Einzelnen Beitrag anzeigen
  #25  
Alt 22.01.2008, 16:49
Benutzerbild von Robert
Robert Robert ist offline
Lebende Foren Legende
 
Registriert seit: 30.06.2004
Ort: Regensburg
Alter: 61
Land:
Beiträge: 4.307
Abgegebene Danke: 2.115
Erhielt 979 Danke für 569 Beiträge
Aktivitäten Langlebigkeit
3/20 20/20
Heute Beiträge
1/3 sssss4307
AW: Klon Test Magellan - Atlanta

 Zitat von spacious_mind
2) In der Aktiv liste sehe ich 439 spiele also mehr als genug um sie zu splitten und um zu sehen was da raus kommt oder? Reicht das nicht um zu sehen wo sie beide liegen? Wieviele spiele brauch man 1000 ??
Wenn du die Engines-Freaks fragst, werden sie sagen: JA! (und manchen reicht auch das nicht)

Es ist ja nicht so, dass man sagen kann, ich brauche 200 Partien, dann ist es korrekt, sondern die Varianz wird einfach nur kleiner. Selbst mit 1000 Partien hat man vielleicht noch +/- 10 ELO (keine Ahnung, ob das realistisch ist ), und ich denke nicht, dass Atlanta und Magellan soweit auseinander sein werden.
Zitieren:
3) Wenn es abweichungen gibt im software dann sehe ich das als noch ein groesseren Grund Magellan und Atlanta zu splitten.
aber man wird erst nach vielen hundert Partien feststellen können, welcher der beiden besser ist! (wenn überhaupt!)
Zitieren:
4) Ich sage nicht das man Magellan 1 und Magellan 2 und Magellan 3 listet
aber genau das ist ja das Problem: vielleicht gibt es Atlanta 1.01, 1.02, 1.03 und auch Magellan 1.01, 1.02 und 1.03. Dann hätte es ja keinen Sinn, nur nach Atlanta und Magellan zu splitten, wenn es für beide gleiche Softwareversionen gibt! Das würde mich vor einer Trennung interessieren.
Zitieren:
sondern nur das man Atlanta und Magellan mal seperat ueberprueft durch ihre einge spiel ergebnisse. Was ist den so schlimm damit wenn sie gleiche ELO haben dann bleiben sie zusammen wenn nicht dann werden sie gesplittet?
Aber es ist ja klar, dass sie keine gleiche ELO haben werden, weil die Ergebnisse viel zu ungenau sind! Genau das ist ja das Problem...

Selbst wenn der Atlanta in Wirklichkeit 10 ELO stärker sein sollte, ist es leicht möglich, dass der Magellan in der Liste 50 ELO mehr hat! Erst mit zunehmender Anzahl an Partien wird sich diese Fehlerrate verringern.
Zitieren:
429 spiele in der Aktiv liste gebuendelt (reicht aus fuer beide um zu sehen wo sie in der tatsache beide liegen oder?)
Meiner Meinung nach reicht das nicht, da die Varianz selbst mit 429 Partien noch bei +/- 27 ELO liegt.

Um einen Fehler zu beseitigen, baut man mMn einen viel größeren ein...

Versteh mich recht: Ich wäre auch interessiert, zu erfahren, ob es messbare Unterschiede gibt, aber ich fürchte, das wird schwer bis unmöglich sein, das festzustellen!


viele Grüße,
Robert
Mit Zitat antworten