Schachcomputer.info Community

Schachcomputer.info Community (https://www.schachcomputer.info/forum/index.php)
-   Die ganze Welt der Schachcomputer / World of chess computers (https://www.schachcomputer.info/forum/forumdisplay.php?f=2)
-   -   Test: ELO ist relativ (https://www.schachcomputer.info/forum/showthread.php?t=5096)

Chesswalker 15.01.2016 13:12

ELO ist relativ
 
Hallo Fans:)

Da ich viele Schachcomputer sammle und auch ab und zu gegen einige Modelle spiele, fiel mir folgendes auf.
ELO-Zahlen sind als grober Anhaltspunkt für Spielstärke ganz okay, aber im Grunde sehr ungenau.
Beispiele: Ich nahm heute meinen neu ersteigerten Mephisto 68000 XL mit knapp 2000 ELO und er spielte locker einen Milano Pro gegen die Wand. Okay, ich rechnete schon fast damit, da das Endspiel eine Schwäche vom M.Milano Pro (F.Morsch) ist.
Krass wurde mein Erlebnis jedoch hier: Einen kleinen Novag Allegro (Piccolo) wollte ich vor Publikum mal schnell besiegen und opferte schon 2 Leichfiguren, weil ich etwas "zu locker" an die Sache ging und hatte wirklich Mühe die Partie noch zu gewinnen. Meine Einschätzung waren waren "gefühlsmässige" 1300-1400 SSF-ELO und deshalb nahm ich einen Novag Alto mit dieser Spielstärke 1300 und stellte fest, daß der kleine Allego (ELO 945) mit seinem halb so großen Programm (2k!) real viel besser spielt als der ca. 350 (!) ELOs stärkere Alto - sowohl im Direkvergleich (Maschine gegen Maschine) als auch gegen Mensch.
Ich glaube solche "Effekte" treten in allen Spielstärkeklassen auf, nur eben dachte ich, daß es nicht so extrem ist.
Grüße euer Chesswalker :)

Chessguru 15.01.2016 17:01

AW: ELO ist relativ
 
Hallo,

klar, unsere Elo Listen sind und bleiben nur Anhaltspunkte. Etwas anderes wurde auch nie proklamiert, nette Spielerei eben. So relativ wie Nutella. Nutella hat nur wenige Vitamine, daher muss man relativ viel davon essen... :gruebel:

Was aber auch eine Rolle spielt, ist die Art der Berechnung. Momentan bin dabei, unsere Turnierliste mit dem SSDF-Rating Programm zu berechnen. Bin gespannt, wie sich diese Liste im Vergleich gestalten wird.

Gruß
Micha

Wolfgang2 15.01.2016 18:18

AW: ELO ist relativ
 
Zitieren:

Zitat von Chessguru (Beitrag 56956)
Hallo,

klar, unsere Elo Listen sind und bleiben nur Anhaltspunkte. Etwas anderes wurde auch nie proklamiert, nette Spielerei eben. ...

Gruß
Micha

Ja richtig Micha. Du hast das immer betont, die Liste sogar "kleiner" geredet als sie ist. Nur leider ist es wieder so, wie ich vor ein paar Monaten prognostiziert habe, dass die Liste als die unfehlbare Referenz heran gezogen wird, wenn es um das Klingenberg-Turnier geht.

Da wurde jetzt für die U 2100-Gruppe "trickreich" von einem Teilnehmer der Almeria 68020 gewählt, der offensichtlich falsch, hinter Dallas 68020, Roma 68020 und sogar Almeria 68000 eingestuft ist.

Ich hoffe, dass Deine Anpassung nach SSDF-Rechnungsvorschrift dafür sorgt, dass Fidelity Mach IV unter die 2100er Elo-Grenze fällt und man dann das diesjährige Oldie-Turnier als 1988-er WM mit erweitertem Teilnehmerfeld interpretieren kann.
Denn die 88-er WM war ja richtig interessant gewesen. Ich selbst habe Mach IV nicht, aber ich weiß, wer gerne damit antreten würde.

Gruß
Wolfgang

Walter 15.01.2016 19:30

AW: ELO ist relativ
 
Zitieren:

Zitat von Chessguru (Beitrag 56956)
klar, unsere Elo Listen sind und bleiben nur Anhaltspunkte. Etwas anderes wurde auch nie proklamiert, nette Spielerei eben. So relativ wie Nutella. Nutella hat nur wenige Vitamine, daher muss man relativ viel davon essen... :gruebel:

Was aber auch eine Rolle spielt, ist die Art der Berechnung. Momentan bin dabei, unsere Turnierliste mit dem SSDF-Rating Programm zu berechnen. Bin gespannt, wie sich diese Liste im Vergleich gestalten wird.

Ich habe da ohnehin einen Verdacht: Ich vermute, dass die Elo-Werte der starken Geräte mit der Zeit allmählich steigen. Das kann aber nur scheinbar sein, und folglich wäre da ein Fehler im System. Sachlich gesehen, kann es ja keine Spielstärkesteigerung geben, weil die Hard- und Software unverändert bleiben. Ein solcher Effekt wäre zu identifizieren, entweder wenn man die Berechnungslogik des Elo-Schemas voll verstanden hat (habe ich nicht wirklich :nene:) oder auf statistischem Weg, wenn man die Entwicklung eines Compis über die Jahre verfolgt und die Spielstärke der Gegner dazu in Relation setzt. Dazu fehlen mir aber Zahlen und Zeit.

Wenn ich das Berechnungsschema richtig verstanden habe (@Micha: bitte korrigieren, wenn ich falsch liege, du bist der Experte), dann "klauen" sich die starken Geräte allmählich hier und da Elo-Punkte von den schwächeren, die mit der Zeit Punkte verlieren. Diesen Effekt gibt es jedenfalls bei menschlichen Spielern, wo sich die stärkeren zunehmend Punkte von den "Schwächlingen" holen. Also könnte es angezeigt sein, Partien zwischen Gegnern ab einer bestimmten Elo-Differenz überhaupt nicht mehr zu werten. Das würde den Effekt zumindest verlangsamen. Liege ich da richtig?
Es könnte auch gut sein, wenn man das System von Zeit zu Zeit neu justiert, praktisch neu anfängt.

Das Problem ist halt, dass Elo quasi ein geschlossenes System ist, wo die Punktemenge aller Geräte festliegt (wenn nicht gerade mal ein neues Gerät dazukommt). Änderungen kann es in einem geschlossenen System geben, indem einer dem anderen die Punkte wegnimmt. Und bei "unfairen" Paarungen mit hohen Unterschieden sehe ich die stärkeren Geräte nun mal am längeren Hebel, so dass sie allmählich Punkte ansammeln und sie nie mehr abgeben.

Also, ich bin mir bei dieser Vermutung nicht ganz sicher, sondern argumentiere mehr aus einem Bauchgefühl heraus. Ich wäre also um eine Stellungnahme von Micha hocherfreut. ;)

Was die Beobachtungen von "Chesswalker" angeht, so macht man öfter die Erfahrung, dass bestimmte Gegner "Angstgegner" sind, einfach weil bestimmte Compis gegen sie schlecht aussehen. Das liegt sicher an der jeweiligen Spielweise, und das kennt man auch bei Menschen. Deswegen müssen vernünftig begründete Elo-Berechnungen auf einer Mindestzahl an verschiedenen Gegnern und Partien beruhen. Auch ein Spieler mit 300 Elo niedriger gewinnt manchmal gegen den stärkeren. :box2:

Letztlich könnte eine wirklich objektive Elo-Bewertung nur stattfinden, wenn wir einen allwissenden Schachrechner hätten, der die Messlatte abgibt, und an dem alle gemessen würden. So wie das System nun aber mal ist, gibt es immer nur relative Schätzungen aufgrund tatsächlicher Ergebnisse ab. Wir haben nun mal nichts Besseres. Andererseits ist das Elo-System die bestmögliche Schätzung der Spielstärke, eingebaute Nachteile inclusive - unvollkommen, aber das bestmögliche.

Walter

goto34 15.01.2016 19:47

AW: ELO ist relativ
 
Hallo Wolfgang,

erst einmal will ich Dir sagen wie sehr ich Deine Threads schaetze, aber das habe ich Dir bereits das letzte Mal in Klingenberg persoenlich erzaehlt.

Was ich aber jetzt nicht absolut nachvollziehen kann, ist die Tatsache das Du dich hier in diesem Forum weiter beschwerst. Sorry das ich das jetzt so sagen muss.

Das ganze als "Trickreich" zu bezeichnen finde ich schon ganz schoen gewagt deswegen versuche ich das etwas zu neutralisieren...will es mal sachte halten...ich erzaehl dir mal was...ich hatte die gleiche Idee...war aber nicht schnell genug...sonst waer ich der Arsch gewesen oder wie? Ich seh das schwarz weiss...weil sonst moechte ich gerne mein BruteForce mit 9 Elo Punkten zuviel elo auch starten lassen...die Liste ist ja nicht 100% korrekt....

Ich hoffe Du verstehst mich nicht verkehrt. Jeder will was und der TL muss entscheiden (vielleicht akzeptierst du es hier mehr als dort)...da gibt es Leute denen das gefällt und da gibt es Leute denen das nicht gefällt...was ist Dir wichtig ...? mir ist wichtig das ich Dich und alle anderen in Klingenberg wieder treffe und spass habe mit einem guten gefuehl.. Ich kann mich auch ueber etwas aufregen was mir nicht an solchen Turnieren passt (die gleiche sch...gibt es auch in NL)...aber keine details...mir missfaellt das sehr...Weil es ist die Gemeinschaft...und ich glaube auch nicht das Du 100%ig so denkst...komm schraub mal zurueck ...:)

Tobias

Wolfgang2 15.01.2016 19:57

AW: ELO ist relativ
 
Zitieren:

Zitat von Walter (Beitrag 56960)
...Was die Beobachtungen von "Chesswalker" angeht, so macht man öfter die Erfahrung, dass bestimmte Gegner "Angstgegner" sind, einfach weil bestimmte Compis gegen sie schlecht aussehen. ...Walter

Das "Angstgegner" - Argument möchte ich gerne aufgreifen, weil es speziell beim Almeria 68020 und - umgekehrter Effekt - beim MonteCarlo IV anzutreffen ist. Ersterer tut sich schwer mit den Schröder-Programmen (MC IV, Nigl Short) und der MC IV hat zwar 211 Spiele gemacht, aber davon nun mal rund die Hälfte gegen diverse Programme von Richard Lang, die ihm offenbar gut liegen.
Nun, dann gibt es ein stolzes Rating für den MC IV (2018), der meiner Ansicht nach (ich selbst habe den Supermondial II) irgendwo zwischen MM IV und MM V besser aufgehoben wäre.
Aber das liegt in der Natur der Sache. Ich verstehe jeden, der mit dem "kleinen" Schröder-Programm Partien gegen "Lang"-Rechner spielt. ;)

Einen weiteren Punkt, den ich für kritisch halte, ist wenn ein Programm gegen eine Vorgängerversion spielt. Das gibt dann mitunter zu klare Ergebnisse.
Ich betreibe "Mephisto Polgar - MM IV /20 MHz" auch deswegen nicht weiter. Denn das würde den MM IV unverhältnismäßig schlecht aussehen lassen, das Rating nach unten "verfälschen".

Gruß
Wolfgang

Wolfgang2 15.01.2016 20:40

AW: ELO ist relativ
 
Zitieren:

Zitat von goto34 (Beitrag 56961)
Hallo Wolfgang,

...mir missfaellt das sehr...Weil es ist die Gemeinschaft...und ich glaube auch nicht das Du 100%ig so denkst...komm schraub mal zurueck ...:)

Tobias

Hallo Tobias,
so dramatisch sehe ich das alles nicht. Ich akzeptiere die Klingenberg-Regeln, auch wenn ich mir vielleicht ein Zweitkriterium für die Zulassung eines Gerätes (SSDF-List oder Mindestpartien-Zahl 100) wünschen würde. Ich akzeptiere auch, dass der Almeria 68020 teilnimmt. Selbst nehme ich auch teil, freue mich schon drauf. Alles weitere habe ich im "anderen" Forum per PN geklärt, - wenn man so will "entschärft".

Gruß
Wolfgang

goto34 15.01.2016 21:26

AW: ELO ist relativ
 
Zitieren:

Zitat von Wolfgang2 (Beitrag 56963)
Hallo Tobias,
so dramatisch sehe ich das alles nicht. Ich akzeptiere die Klingenberg-Regeln, auch wenn ich mir vielleicht ein Zweitkriterium für die Zulassung eines Gerätes (SSDF-List oder Mindestpartien-Zahl 100) wünschen würde. Ich akzeptiere auch, dass der Almeria 68020 teilnimmt. Selbst nehme ich auch teil, freue mich schon drauf. Alles weitere habe ich im "anderen" Forum per PN geklärt, - wenn man so will "entschärft".

Gruß
Wolfgang

Hi Wolfgang,
schoen das wir das eben offline klaeren konnten. Ich kann jetzt deinen Standpunkt besser verstehen. Ich denke, dass somit auch alles gesagt ist. Ich freue mich auf unser Wiedersehen. Bis dahin

Tobias

Chesswalker 15.01.2016 23:17

AW: ELO ist relativ
 
Ja Walter hat Recht ;) ein allwissender Supercomputer, welcher alle Schwächen und Stärken berücksichtigt könnte eine gute ELO-Bewertung abgeben.
Aber wir hätten dabei schon wieder ein Problem. Welche Kriterien wie gewichtet werden. Dieser Supercomputer müsste dann nach einer möglichst hohen Anzahl von Spielen einen Wert liefern.
Die Praxis schaut aber so aus, daß ein rechenstarkes Programm Vorteile im unübersichtlichen und kombinationsreichen Mittelspiel hat. Programme mit mehr Endspielwissen kommen aber erst dann zum Zug, wenn Sie zumindest das Mittelspiel einigermaßen verlustlos überstehen. Das alles beeeinflußt Ergebnisse.

Außerdem wurden einige Schachprogramme so werbeträchtig präsentiert wie gewünscht, um einen höheren Verkaufspreis zu rechtfertigen. Die Hardware
wurde als wichtig hingestellt oder auch nur eine um 50% höhere Taktfrequenz oder Verarbeitungsbreite, dabei ist und bleibt eine intelligente Programmierung
der entscheidente Faktor. Der neue Genius von Millennium ist ein tolles Schachprogramm auf trotzdem noch kleiner Hardware, denn jeder heutige
PC und sogar Laptop ist dieser Hardware mehrfach überlegen. Ich persönlich freue mich jedoch, daß endlich wieder der ernst zu nehmende Schachcomputer zurückkehrt.
Noch vor ca.5 Jahren gab es bei Ebay keine Kategorie Schachcomputer mehr, weil Schachcomputer nur wenige Menschen interessierte. Nun endlich haben die Menschen gemerkt , daß das Schachspiel am Brett etwas wirklich Echtes ist und Bildschirmschach nicht das einzig Wahre. Amen

Chessguru 16.01.2016 19:04

AW: ELO ist relativ
 
Hallo Wolfgang,

Zitieren:

Zitat von Wolfgang2 (Beitrag 56958)
Nur leider ist es wieder so, wie ich vor ein paar Monaten prognostiziert habe, dass die Liste als die unfehlbare Referenz heran gezogen wird, wenn es um das Klingenberg-Turnier geht.

ja, da bin ich mir meiner Schuld natürlich bewusst und bereue zutiefst meine Verfehlung.

´schuldigung. Manchmal stehe ich ein bisschen neben mir und gucke, was ich da so mache, dann muss ich plötzlich grinsen und dann lachen wir beide.

Zitieren:

Ich hoffe, dass Deine Anpassung nach SSDF-Rechnungsvorschrift dafür sorgt, dass Fidelity Mach IV unter die 2100er Elo-Grenze fällt und man dann das diesjährige Oldie-Turnier als 1988-er WM mit erweitertem Teilnehmerfeld interpretieren kann.
Denn die 88-er WM war ja richtig interessant gewesen. Ich selbst habe Mach IV nicht, aber ich weiß, wer gerne damit antreten würde.
Zumeist ist Religion das Problem, nicht die Lösung...

Sorry Wolfgang wenn es sarkastisch wurde, aber ich kann diese Nummer definitiv nicht einmal im Ansatz verstehen.

Klingenberg, Kaufbeuren, Online-Turniere haben nur einen Zweck, sie sollen Freude bereiten. Der Spaß am Treffen mit Gleichgesinnten, die Freude am Spiel mit den alten Kisten, das Fachsimpeln, du weißt was ich meine. Falscher Ehrgeiz hat aus meiner Sicht nichts auf diesen Veranstaltungen zu suchen. Vielleicht macht es Sinn, nach den Motiven für verbissenen Ehrgeiz zu suchen. Was treibt einen an? Was glaubt man, durch diesen übertriebenen Ehrgeiz zu gewinnen? Und die vielleicht wichtigste Frage: Welchen Preis ist man bereit zu zahlen für diesen Ehrgeiz?

Almeria 68020: Ehrlich gesagt war mir die Geschichte gar nicht aufgefallen. Gut, ist momentan vermutlich etwas zu niedrig angesiedelt. Zumeist versuche ich solche Geräte nicht in der Liste auszuführen, da einem die "innere gefühlte Elo-Liste" sagt, die Nummer passt einfach nicht, es fehlen einfach noch weitere Partien. Bei den Lang Kisten würde ich von ca. 50 Elo Zuwachs aufgrund der Taktverdoppelung ausgehen, so zumindest die Erfahrung bei anderen Programmversionen. Auf der anderen Seite, 70 Partien stehen zu Buche. Mein Ansatz wäre nicht das Wehklagen, sondern Partien zu spielen. Vielleicht fällt die Spielstärkesteigerung bei dem Almeria Programm bei Taktverdoppelung geringer aus? Nein? Vorher weiß man das? Genau das macht doch den Spaß aus. Spielen, testen, Spaß haben. So sehe ich die ELo Listen. Schauen wir mal, wie sich die Auswertung entwickelt.

Auch hatte ich geschrieben, "Momentan bin dabei, unsere Turnierliste mit dem SSDF-Rating Programm zu berechnen", d.h. ich verwende für das Datenmaterial unserer Turnier-Elo-Liste das damalige Rating Programm von Lars Hjorth, welches bei der SSDF zur Listenerstellung zur Anwendung kam. Mir geht es nur um den Vergleich der Berechnungsmethoden. Ist aber ein riesiger Aufwand, dauert noch etwas.

Nur Wolfgang, du willst mir doch nicht wirklich erzählen, dass wenn ich die Elo Zahl des Almeria 68020 in der Elo Liste ändere, dieses Gerät in Klingenberg spielen "darf"? Hallo? Ihr unterwerft euch einer privaten Elo Liste, von der ich immer und immer wieder sage, sie stellt nur eine Spielerei dar, da sie nur Anhaltspunkte liefern kann? Wo genau liegt jetzt das Problem? Bei der Elo Liste oder bei der Art der Betrachtung? Jungs, um was geht es euch eigentlich? Macht das so, wie ihr euch wohl fühlt und unterwerft euch keinem Diktat, welches noch nicht einmal vorhanden ist.

Gruß
Micha

<hr>
Hallo Walter,

Zitieren:

Zitat von Walter (Beitrag 56960)
IWenn ich das Berechnungsschema richtig verstanden habe (@Micha: bitte korrigieren, wenn ich falsch liege, du bist der Experte), dann "klauen" sich die starken Geräte allmählich hier und da Elo-Punkte von den schwächeren, die mit der Zeit Punkte verlieren. Diesen Effekt gibt es jedenfalls bei menschlichen Spielern, wo sich die stärkeren zunehmend Punkte von den "Schwächlingen" holen. Also könnte es angezeigt sein, Partien zwischen Gegnern ab einer bestimmten Elo-Differenz überhaupt nicht mehr zu werten. Das würde den Effekt zumindest verlangsamen. Liege ich da richtig?
Es könnte auch gut sein, wenn man das System von Zeit zu Zeit neu justiert, praktisch neu anfängt.

ich bin nicht der Experte, ich putze hier nur. ;) Den beschriebenen Effekt kann man sehr schön bei der Fide beobachten, die Inflation der hohen Elo Zahlen.

Bei unseren Elo Listen konnte ich diesen Effekt nicht erkennen. Aber selbst wenn, welche Alternative hätte man? "Neu justieren" hört sich nett, nur wie soll sich die Nummer in der Praxis gestalten? Partien weglassen? Diese Frage hatte wir vor nicht allzu langer Zeit hier schon einmal angesprochen -> https://www.schachcomputer.info/foru...p?t=99&page=24 ab Beitrag 233 ging es los.

Was ich gerne machen möchte, über die verschiedenen Programme zur Berechnung diskutieren. Dass aus meiner Sicht sinnvollste Programm zur Berechnung von Computerratings ist Ordo. Hier schon mal ein "Brocken" unserer Turnierliste mit Ordo berechnet:

Auszug, mit Absicht aus dem 2000er Bereich:
Code:

  30 Mephisto Almeria 68020                    : 2112  112  112    32    56.3 %  2062  18.8 %
  31 Mephisto Berlin 68000                    : 2108  54  54  162    51.5 %  2094  31.5 %
  32 Mephisto Milano Pro / Master Chess        : 2099  47  47  190    54.7 %  2058  27.4 %
  33 Fidelity Elite 68030 V9                  : 2098  124  124    24    41.7 %  2164    8.3 %
  34 Mephisto Lyon 68000                      : 2088  70  70    92    50.5 %  2080  38.0 %
  35 Novag Sapphire / Diamond                  : 2086  41  41  277    45.5 %  2117  28.2 %
  36 Phoenix Resurrection Deep Sjeng          : 2085  149  149    24    27.1 %  2265  29.2 %
  37 Mephisto Portorose 68020                  : 2082  69  69    91    58.8 %  2012  40.7 %
  38 Fidelity Mach IV / Designer 2325 / V6    : 2079  55  55  157    38.9 %  2165  22.9 %
  39 Phoenix Revelation Super Expert C        : 2077  114  114    30    50.0 %  2077  46.7 %
  40 Phoenix Revelation Amsterdam              : 2061  155  155    18    52.8 %  2041  16.7 %
  41 Mephisto Almeria 68000                    : 2044  85  85    59    51.7 %  2032  35.6 %
  42 Fidelity Par Excellence 16 MHz            : 2044  146  146    24    54.2 %  2013  25.0 %
  43 Mephisto Nigel Short 10 MHz              : 2042  145  145    24    66.7 %  1904    8.3 %
  44 Novag Diablo / Scorpio 68000              : 2033  41  41  254    54.3 %  2003  33.1 %
  45 Mephisto Polgar 10 MHz                    : 2032  78  78    70    50.7 %  2026  21.4 %
  46 Mephisto MM V 10 MHz                      : 2007  100  100    41    45.1 %  2043  22.0 %
  47 Mephisto Roma 68020                      : 1999  52  52  156    55.4 %  1954  22.4 %
  48 Novag Citrine                            : 1997  72  72    80    55.0 %  1957  25.0 %
  49 Saitek Cougar / Mephisto Explorer Pro    : 1978  64  64    95    50.5 %  1971  18.9 %
  50 Fidelity Mach III / Designer 2265 / V2    : 1978  42  42  244    41.6 %  2049  25.8 %
  51 Mephisto Nigel Short                      : 1974  94  94    46    55.4 %  1937  28.3 %
  52 Mephisto Milano                          : 1972  33  33  442    54.6 %  1935  22.4 %
  53 Novag Super Expert / Forte C 6 MHz        : 1968  34  34  412    54.9 %  1932  28.6 %
  54 Saitek Corona D+ 8 MHz                    : 1968  120  120    25    50.0 %  1969  20.0 %
  55 Mephisto Schachakademie 24 MHz            : 1964  156  156    18    55.6 %  1915  33.3 %
  56 Saitek GK 2100                            : 1963  35  35  335    51.8 %  1945  27.8 %
  57 Mephisto MM IV Turbo 16 MHz + HG440      : 1961  100  100    44    38.6 %  2065  22.7 %
  58 Mephisto Monte Carlo IV LE                : 1960  46  46  218    50.2 %  1958  27.1 %
  59 Mephisto Roma II                          : 1954  89  89    51    53.9 %  1921  29.4 %
  60 Novag Star Ruby / Obsidian                : 1950  50  50  190    47.4 %  1971  37.9 %
  61 Novag Super Expert / Forte B 6 MHz        : 1947  73  73    81    49.4 %  1951  32.1 %
  62 Novag Turquoise / Emerald classic plus    : 1946  120  120    29    53.4 %  1908  31.0 %
  63 Novag Zircon II / Jade II                : 1939  50  50  180    47.8 %  1955  30.0 %
  64 Mephisto Polgar                          : 1935  38  38  315    48.6 %  1946  24.8 %
  65 Novag Super Expert / Forte C 5 MHz        : 1934  64  64  117    50.9 %  1935  23.1 %
  66 Mephisto Dallas / Mondial 68000XL        : 1929  34  34  447    49.8 %  1930  24.4 %
  67 Phoenix Revelation II Glasgow            : 1928  65  65  160    53.4 %  1902  31.9 %
  68 Mephisto Modena 8 MHz                    : 1926  46  46  190    45.5 %  1958  33.2 %
  69 Mephisto MM V + HG550                    : 1925  34  34  435    47.4 %  1945  23.4 %
  70 Phoenix Revelation Rebell 5.0            : 1912  174  174    18    61.1 %  1822  33.3 %
  71 Mephisto Schachakademie                  : 1901  107  107    36    47.2 %  1917  22.2 %
  72 Saitek Brute Force                        : 1898  114  114    44    29.5 %  2090  22.7 %
  73 Saitek D+ 6 MHz                          : 1898  161  161    16    46.9 %  1925  18.8 %
  74 Mephisto Academy                          : 1897  63  63  125    50.4 %  1896  22.4 %
  75 Saitek GK 2000                            : 1887  62  62  116    50.9 %  1876  27.6 %
  76 Saitek D++ 6 MHz                          : 1882  67  67    81    42.0 %  1939  27.2 %
  77 Mephisto MM IV + HG440                    : 1881  60  60  127    47.6 %  1911  19.7 %
  78 Excalibur Grandmaster / Igor 24 MHz      : 1880  150  150    19    44.7 %  1930  15.8 %
  79 Mephisto Supermondial II / MC IV          : 1877  62  62  111    49.1 %  1882  29.7 %
  80 Mephisto Travel Champion 2080            : 1875  110  110    38    32.9 %  2033  13.2 %
  81 Novag Super Expert / Forte A 5 MHz        : 1863  82  82    73    54.8 %  1829  21.9 %
  82 CXG Sphinx Dominator 2.04                : 1854  53  53  140    40.0 %  1931  20.0 %

Na? Neugierig geworden? Erinnert das nicht an die wohligen SSDF-Zeiten? Oder sind wir einfach nur befangen?

Gruß
Micha

Solwac 16.01.2016 20:08

AW: ELO ist relativ
 
Irgendwie scheine ich das Problem nicht erkennen...

Einige sind sauer/enttäuscht, dass "ihr" Lieblingscomputer in einer vorher anerkannten Liste zu hoch steht und deshalb bei einer Beschränkung raus fällt?

Dann sollte vorher der Finger gehoben werden, nachkarten hinterlässt immer einen faden Beigeschmack.

Eine andere Sache ist das teilweise vorhandene Unverständnis in Bezug auf die Ermittlung der ELO-Zahlen. Da wird mit "Gefühl" argumentiert, es werden Vergleiche mit der Ermittlung menschlicher ELO-Zahlen herangezogen usw.

Zum ersten: Gefühl hat dabei nichts verloren und ist zwar menschlich verständlich, aber für ein Ergebnis nicht hilfeich. Solange die einzelne Partie nicht technische Fehler hat gehört sie gewertet. Ansonsten wird ein systematischer Fehle eingebaut. Für verschiedene Fälle gehört vorher eine Lösung überlegt und diese dann konsequent angewandt. Dazu gehören z.B. Zeitüberschreitung, Umgang mit Dubletten (wenn sie aus Gründen der Zeitersparnis und Abwechselung nicht ausgespielt werden sollen), Aufgabe einer Seite und Abschätzung einer Partie (auch hier wäre das Ausspielen besser, aber eben auch mit Zeit und wenig Abwechselung verbunden).

Die Veränderung der ELO-Zahlen in verschiedenen Listen mit der Zeit hat hauptsächlich zwei Ursachen: Es werden neue Partien gespielt (eventuell sogar mit neuen Programmen) und bei der Neuberechnung ergibt sich eine bessere Schätzung. Und zweitens, die gesamte Liste wird neu geeicht. Letzteres verändert die Liste nur als ganzes, aber für einzelne Programme kann dabei eine kritische fixe Marke (z.B. ELO 2000) über- bzw. unterschritten werden. Daher sollte eine Neueichung nicht kurz vor einem Turnier mit einem fixen Limit durchgeführt werden. Denn ein Programm mit z.B: 2006 statt vorher 1997 ist natürlich kein Deut anders und die Relation zu den anderen Turnierteilnehmern hat sich nicht geändert.

Der Vergleich mit der Ermittlung menschlicher ELO-Werte ist nicht hilfreich. Menschen unterliegen einer zeitlichen Veränderung, Schachprogramme nicht. Eine Partie vor 20 Jahren von mir gegen meinen Nachbarn ist für den heutigen Erwartungswert meiner Spielstärke irrelevant. Eine Partie zwischen MM IV gegen Roma II hingegen gehört auch nach 20 Jahren noch in die Berechnung.

Die Berechnung von ELO-Zahlen aus Partien zwischen Computern hat zwei grundsätzliche Probleme: Zum einen sollen die Zahlen mit menschlichen Zahlen vergleichbar sein, d.h. wenn Programm A 200 ELO höher als Progamm B eingestuft wird, dann soll sich das auch im Vergleich zu Menschen wider spiegeln. Es gibt aber deutlich mehr Partien zwischen Computern als gegen Menschen, deshalb wird es immer Abweichungen geben müssen. Und das zweite Problem liegt in der Annahme einer Verteilungsfunktion. Bayes-ELO statt ELO-Stat ist eine Verbesserung, aber es bleibt immer noch ein Fehler.

Solwac 16.01.2016 20:26

AW: ELO ist relativ
 
Was das Gefühl betrifft:

Nehmen wir mal eine Bewertung aufgrund von vier Programmen A, B, C und D.

Folgende Ergebnisse gab es in einem ersten Durchlauf:

Code:

A - B 12,0 -  8,0
A - C 18,0 - 22,0
A - D 13,5 - 16,5
B - C 16,5 - 13,5
B - D 22,0 - 18,0
C - D 10,0 - 10,0

A: 43,5/90
B: 46,5/90
C: 45,5/90
D: 44,5/90

Was sagt Euer Gefühl, welches Programm ist das Stärkste?
Was sagen die ELO-Zahlen?
Und würde sich etwas ändern, wenn in 10 weiteren Partien A gegen B 6 weitere Punkte erzielen würde?

;)

mclane 16.01.2016 20:53

AW: ELO ist relativ
 
Zitieren:

Zitat von Wolfgang2 (Beitrag 56962)
Das "Angstgegner" - Argument möchte ich gerne aufgreifen, weil es speziell beim Almeria 68020 und - umgekehrter Effekt - beim MonteCarlo IV anzutreffen ist. Ersterer tut sich schwer mit den Schröder-Programmen (MC IV, Nigl Short) und der MC IV hat zwar 211 Spiele gemacht, aber davon nun mal rund die Hälfte gegen diverse Programme von Richard Lang, die ihm offenbar gut liegen.
Nun, dann gibt es ein stolzes Rating für den MC IV (2018), der meiner Ansicht nach (ich selbst habe den Supermondial II) irgendwo zwischen MM IV und MM V besser aufgehoben wäre.
Aber das liegt in der Natur der Sache. Ich verstehe jeden, der mit dem "kleinen" Schröder-Programm Partien gegen "Lang"-Rechner spielt. ;)

Einen weiteren Punkt, den ich für kritisch halte, ist wenn ein Programm gegen eine Vorgängerversion spielt. Das gibt dann mitunter zu klare Ergebnisse.
Ich betreibe "Mephisto Polgar - MM IV /20 MHz" auch deswegen nicht weiter. Denn das würde den MM IV unverhältnismäßig schlecht aussehen lassen, das Rating nach unten "verfälschen".

Gruß
Wolfgang

Also ich kann zur ganzen Diskussion wenig beitragen, möchte aber darauf hinweisen das in meinem Oldie Turnier der MC4/college
Von den Schröder Programmen am stärksten abschneidet.

12 Mephisto College 20/30
16 mm5 18,5/33
17 Nigel Short 18/30
20 Mega IV 15/32
21 Academy 15/31
25 Milano 13/30

Von rebel x, rebel oder polgar habe ich noch nicht genug Partien erspielt.
Aber ist es nicht erstaunlich das dieser Ableger von es so gut Scored ?!

Chessguru 16.01.2016 23:25

AW: ELO ist relativ
 
Zitieren:

Zitat von Solwac (Beitrag 56978)
Und das zweite Problem liegt in der Annahme einer Verteilungsfunktion. Bayes-ELO statt ELO-Stat ist eine Verbesserung, aber es bleibt immer noch ein Fehler.

Völlig richtig, nur welche Variante würdest du wählen? Gerade mit dem Blick auf das sehr breite Spektrum z.B. in der Aktivliste? Im Grunde passt da keines der Programme, denn je breiter die Streuung desto ungenauer wird die Liste.

Solwac 16.01.2016 23:51

AW: ELO ist relativ
 
Zitieren:

Zitat von Chessguru (Beitrag 56986)
Völlig richtig, nur welche Variante würdest du wählen? Gerade mit dem Blick auf das sehr breite Spektrum z.B. in der Aktivliste? Im Grunde passt da keines der Programme, denn je breiter die Streuung desto ungenauer wird die Liste.

Meine Statistikkenntnisse reichen zum verstehen, nicht zum erfinden. :ignore:

Das Problem wird meiner Meinung nach von den Eröffnungsbibliotheken verstärkt. Viele Programme nehmen nach dem Buch in schlechter bewerteten Stellungen die Stellungswiederholung, egal gegen welchen Gegner. Ich habe für eigene Auswertungen irgendwann mal festgestellt, dass bei Siegen unterhalb von 80% alles noch ganz gut funktioniert, das war noch bevor ich von Bayes-ELO gehört habe.

Remi Coulom hat aber schon eine Menge Gehirnschmalz verwendet, daher habe ich nur wenig Hoffnung auf eine weitere Verbesserung.

StefanT 17.01.2016 12:04

AW: ELO ist relativ
 
Die grundsache ist das noch immer die gespielten partien des forums mitglieder zum grundlage liegen !

Für mich mit solch eine umfangreiche Partien Datenbank sollte die Reihenfolge nicht wesentlich anders aussehen.

Was die interpretation des entgegens betrifft wo A von B , B von C, C von D und D von A wiederum besiegt werd oder sonnstige fälle, sollte auf eine menge partien keine oder weniger eine rolle spielen, weil diese specifischen scenario (s) während die Anzahl des Partien nur theoretisch ist....

Der ELOzahl legt nur das Verhalten fest, der Zahl kann wie in dieser fall so um und bei 50 ELO abgewertet sein. Es schaut sich an wegend die abwertung des SC die entsteht, das es eher die SSDF liste ernähert, aber da sollte wirklich die zwei listen SC nach SC einander nachlegen und Ihren relativen Position in eine Tabellenkalkulationprogramm eingegeben werden um so etwas zu bestätigen.

Wenn ich überhaupt über ELOstat/BayesELO lese, sollte BayesELO eher ausgeglichen sein. Vielleicht gibt es mitglieder die nicht einverstanden sind mit dem heutigen Reihenfolge, kann schon sein. Ich lese manchmal über die Polemik des SFC.

Eine ELOzahl entspricht am besten die Zahl des DWZ/FIDE oder USCF. Die Schweden haben sich dahin gemischt und daher die ELO des brettcomputer abgewertet und dies war nicht für jeder Computer zu recht ! Einige erhielten sich verhaltnungsgemass im Partien eher gut aber trotzdem bekommten den gleichen abzug wie SC die , auf die erhaltene Partien, gar nicht zu recht kommten.

Wenn es doch keine Konvertierung danach möglich ist, und partien gegen Mensche fehlen werde ich mich nicht mühen.

Ich weiss nicht ob die Arbeit nicht all so gross ist, sonst konnte beide Statistiken auf die wiki liste angezeigt werden für Ihre fangemeinde,
doch die Diskussion Pro oder Contra werde sicherlich nicht aufhören.

Für mich ist es egal ich sehe es wie eine convention, mehr nicht. Ich glaube meine hunger nach noch eine Zahl wie es beim Menschenschach explodiert sei besänftigt (National Standard , National Blitz ..., Fide Standard, Fide Blitz,..., DWZ, Höllandischen ELO, ...)

Ich werde auch bestätigen : Meine Statistikkenntnisse reichen zum verstehen, nicht zum erfinden !

Solwac 17.01.2016 14:40

AW: ELO ist relativ
 
Zitieren:

Zitat von StefanT (Beitrag 56988)
Eine ELOzahl entspricht am besten die Zahl des DWZ/FIDE oder USCF. Die Schweden haben sich dahin gemischt und daher die ELO des brettcomputer abgewertet und dies war nicht für jeder Computer zu recht ! Einige erhielten sich verhaltnungsgemass im Partien eher gut aber trotzdem bekommten den gleichen abzug wie SC die , auf die erhaltene Partien, gar nicht zu recht kommten.

Anders geht es ja auch nicht. Es geht nicht darum für einen Computer den besten Wert zu bestimmen, es soll über alle gerechnet der beste Wert berechnet werden.

Allerdings war das Vorgehen der Schweden mit einer Korrektur um 100 Punkte so nicht richtig (die 100 Punkte machen mich misstrauisch, hätte man um z.B. 93 Punkte korrigiert, dann wäre es für mich glaubhafter).

MaximinusThrax 17.01.2016 18:48

AW: ELO ist relativ
 
Zitieren:

Zitat von Solwac (Beitrag 56989)
Allerdings war das Vorgehen der Schweden mit einer Korrektur um 100 Punkte so nicht richtig

Ja natürlich nicht, manche Geräte wurden dadurch schwächer gemacht als sie in Wirklichkeit sind!

MaximinusThrax 17.01.2016 18:50

AW: ELO ist relativ
 
Zitieren:

Zitat von Solwac (Beitrag 56989)
Allerdings war das Vorgehen der Schweden mit einer Korrektur um 100 Punkte so nicht richtig

Ja natürlich nicht, manche Geräte wurden dadurch schwächer gemacht als sie in Wirklichkeit sind! Nur damit die gepimpten Elozahlen der Spitzen-PC's im oberen Teil der Liste nicht aus dem Ruder liefen.

Solwac 17.01.2016 23:36

AW: ELO ist relativ
 
Zitieren:

Zitat von MaximinusThrax (Beitrag 56994)
Ja natürlich nicht, manche Geräte wurden dadurch schwächer gemacht als sie in Wirklichkeit sind! Nur damit die gepimpten Elozahlen der Spitzen-PC's im oberen Teil der Liste nicht aus dem Ruder liefen.

Das ist ja auch in Ordnung. Wenn sich die Liste spreizt, dann sollten die Abweichungen oben und unten ähnlich groß sein. Leider gibt es im höheren Bereich weniger Partien zwischen Menschen und Computern. Eine Zeitlang waren die Spitzen-Mikros definitv schwächer als ihr allgemein anerkantes Rating der SSDF.

Heute ist es egal ob die Spitze bei 3300 oder 3100 liegt, der Wert ist kaum vergleichbar mit den besten Menschen.

Chessguru 18.01.2016 00:25

AW: ELO ist relativ
 
Hallo,

ganz interessant, unsere Turnierliste mit dem Rating Programm der SSDF berechnet:

Code:

      THE SSDF RATING LIST 2016-01-17    7550 games played by  125 computers
                                          Rating  +- Games  Won  Oppo
                                          ------  --- -----  ---  ----
  1 Tasc R40 V2.5                          2401  113    48  63%  2311
  2 Tasc R30 V2.23                          2378  119    40  56%  2334
  3 Phoenix Resurrection Ruffian            2376  69  110  56%  2331
  4 Tasc ChessMachine 32 MHz Gideon 3.1    2351  71  116  65%  2242
  5 Tasc R30 Gideon                        2337  116    40  48%  2355
  6 Tasc R30 V2.5                          2336  35  448  64%  2232
  7 Tasc R30 V2.2                          2326  57  156  56%  2280
  8 Fidelity Elite 68060 V11                2295  36  381  57%  2247
  9 Mephisto Genius 68030                  2276  100    55  56%  2231
  10 Mephisto London 68030                  2272  43  284  59%  2210
  11 Mephisto Berlin Professional London    2254  68  111  54%  2226
  11 Mephisto Risc 1MB                      2254  56  162  55%  2217
  13 Mephisto Berlin Professional            2253  37  354  55%  2220
  14 Saitek Sparc                            2252  42  284  53%  2229
  15 Saitek Risc 2500                        2249  35  403  58%  2192
  16 Mephisto Montreux                      2247  38  342  52%  2232
  17 Mephisto Risc 2                        2235  38  331  48%  2248
  18 Mephisto Magellan                      2225  37  364  53%  2203
  19 Mephisto London 68020                  2218  84    73  49%  2227
  20 Mephisto Vancouver 68020                2200  53  173  50%  2200
  21 Mephisto Atlanta                        2185  39  325  47%  2205
  22 Pewatronic Master Chess 24 MHz          2170  100    52  51%  2163
  23 Tasc ChessMachine 14 MHz King 2.2      2168  141    30  57%  2121
  24 Mephisto Lyon 68020                    2160  74    93  49%  2168
  25 Mephisto Vancouver 68000                2157  62  162  70%  2005
  26 Novag Star Diamond                      2149  31  515  49%  2153
  27 Saitek Chess Challenger 24 MHz          2146  238    22  75%  1956
  28 Phoenix Revelation Polgar              2143  123    36  53%  2123
  29 Mephisto Almeria 68020                  2139  135    32  56%  2094
  30 Novag Sapphire II / Diamond II          2137  45  242  52%  2123
  31 Mephisto Berlin 68000                  2131  55  162  52%  2120
  32 Mephisto Milano Pro / Master Chess      2123  52  190  55%  2089
  33 Fidelity Elite 68030 V9                2120  164    24  42%  2179
  34 Mephisto Lyon 68000                    2114  74    92  51%  2110
  35 Mephisto Portorose 68020                2113  77    91  59%  2050
  36 Novag Sapphire / Diamond                2109  42  277  45%  2141
  37 Phoenix Revelation Super Expert C      2106  134    30  50%  2106
  38 Fidelity Mach IV / Designer 2325 / V6  2102  59  157  39%  2182
  39 Phoenix Resurrection Deep Sjeng        2098  208    24  27%  2270
  40 Phoenix Revelation Amsterdam            2095  185    18  53%  2075
  41 Fidelity Par Excellence 16 MHz          2085  157    24  54%  2055
  42 Mephisto Almeria 68000                  2079  94    59  52%  2067
  43 Mephisto Nigel Short 10 MHz            2076  183    24  67%  1955
  44 Novag Diablo / Scorpio 68000            2073  44  254  54%  2042
  45 Mephisto Polgar 10 MHz                  2070  85    70  51%  2065
  46 Mephisto Roma 68020                    2046  57  156  55%  2007
  47 Mephisto MM V 10 MHz                    2044  116    41  45%  2078
  48 Novag Citrine                          2037  81    80  55%  2001
  49 Fidelity Mach III / Designer 2265 / V2  2023  46  244  42%  2083
  50 Mephisto Nigel Short                    2022  109    46  55%  1983
  51 Saitek Cougar / Mephisto Explorer Pro  2018  73    95  51%  2014
  52 Mephisto Milano                        2016  34  441  55%  1982
  53 Mephisto MM IV Turbo 16 MHz + HG440    2015  102    64  31%  2153
  54 Novag Super Expert / Forte C 6 MHz      2013  35  411  55%  1980
  54 Saitek Corona D+ 8 MHz                  2013  148    25  50%  2013
  56 Mephisto Monte Carlo IV LE              2005  47  218  50%  2004
  57 Saitek GK 2100                          2003  38  336  52%  1992
  57 Mephisto Schachakademie 24 MHz          2003  190    18  56%  1963
  59 Novag Star Ruby / Obsidian              1995  51  190  47%  2014
  60 Novag Super Expert / Forte B 6 MHz      1993  79    81  49%  1997
  61 Novag Super Expert / Forte C 5 MHz      1990  65  117  51%  1984
  62 Mephisto Roma II                        1989  101    52  53%  1969
  63 Novag Zircon II / Jade II              1984  53  180  48%  2000
  64 Novag Turquoise / Emerald classic plus  1982  140    29  53%  1957
  65 Mephisto Polgar                        1981  39  315  49%  1992
  66 Mephisto Dallas / Mondial 68000XL      1978  33  447  50%  1979
  67 Phoenix Revelation Rebell 5.0          1977  156    25  56%  1934
  68 Phoenix Revelation II Glasgow          1976  56  160  53%  1952
  69 Mephisto MM V + HG550                  1975  34  436  47%  1993
  70 Mephisto Modena 8 MHz                  1971  51  190  46%  2003
  71 Saitek Brute Force                      1968  130    44  30%  2121
  72 Mephisto Academy                        1953  63  125  50%  1951
  73 Saitek D+ 6 MHz                        1952  200    16  47%  1974
  74 Mephisto Schachakademie                1948  123    36  47%  1967
  75 Mephisto Travel Champion 2080          1946  136    38  33%  2071
  76 Saitek GK 2000                          1941  66  115  51%  1932
  77 Excalibur Grandmaster / Igor 24 MHz    1939  183    19  45%  1976
  78 Mephisto MM IV + HG440                  1934  70  106  54%  1904
  79 Mephisto Supermondial II / Monte Carlo  1930  67  111  49%  1936
  80 Saitek D++ 6 MHz                        1929  82    81  42%  1986
  81 Novag Super Expert / Forte A 5 MHz      1922  85    73  55%  1888
  82 CXG Sphinx Dominator 2.04              1908  62  140  40%  1980
  82 Novag Ruby / Emerald                    1908  81    81  56%  1864
  84 Fidelity Excel 68000                    1907  178    19  47%  1926
  85 Mephisto Mega IV                        1906  50  212  40%  1981
  86 Fidelity Excellence 5 MHz              1905  148    38  28%  2073
  87 Mephisto Modena                        1903  78    83  52%  1886
  88 Phoenix Revelation Glasgow              1891  139    28  50%  1891
  89 Fidelity Designer 2100                  1882  176    21  43%  1933
  89 Mephisto Supermondial / Monte Carlo    1882  65  118  49%  1888
  91 SciSys Turbo King II                    1876  65  134  36%  1976
  92 Mephisto Rebell 5.0                    1859  58  150  45%  1895
  93 Fidelity Par Excellence                1858  90    66  44%  1902
  93 Fidelity Excellence 4 MHz              1858  110    46  57%  1811
  95 Fidelity Kishon Chesster                1852  125    40  38%  1943
  96 Saitek Kasparov Blitz / Saitek Prisma  1850  204    19  37%  1945
  97 SciSys Turbo King                      1836  174    22  41%  1901
  98 Novag Constellation Forte B            1830  127    33  50%  1830
  99 Chafitz Steinitz Encore 20 MHz          1828  224    20  30%  1977
 100 Mephisto MM II + HG240                  1825  59  159  36%  1925
 101 Novag Constellation Expert              1820  145    28  45%  1858
 102 Fidelity Excellence 3 MHz              1816  101    51  48%  1830
 103 Novag Super Constellation              1809  47  249  36%  1910
 104 Krypton Challenge / Regency            1806  83    81  40%  1881
 105 Novag Super Nova                        1802  97    60  40%  1874
 106 SciSys Turbostar 432 + KSO              1798  66  115  49%  1804
 107 Saitek Simultano C + EGR II            1793  83    84  37%  1888
 108 Tiger Grenadier / Millennium Genesis    1778  188    26  29%  1936
 109 Fidelity Elite Privat                  1776  170    22  57%  1727
 110 Mephisto B&P                            1775  105    50  43%  1825
 111 Fidelity Avantgarde 2100                1770  222    22  27%  1941
 112 SciSys Superstar 36K                    1768  167    21  52%  1751
 112 Mephisto Europa / Europa A / Marco Polo 1768  152    26  44%  1809
 114 Fidelity Elite A/S Budapest            1737  125    38  41%  1803
 115 Saitek D 8 MHz                          1723  342    20  20%  1961
 116 Novag Primo / VIP                      1702  170    26  35%  1814
 116 Mephisto Mondial                        1702  170    26  35%  1814
 118 Novag Constellation 3.6 MHz            1686  115    43  43%  1736
 119 CXG Sphinx 40 / Sphinx 50              1667  114    65  23%  1875
 120 Yeno 416 XL                            1659  188    26  29%  1817
 121 Excalibur Alexandra                    1637  178    29  28%  1805
 122 Novag Constellation 2 MHz              1607  184    30  25%  1798
 123 Schneider Titan 16 MHz                  1560  512    15  10%  1922
 124 SciSys Astral / Turbo 16K / Conquistado 1550  149    50  19%  1799
 125 Mephisto III                            1525  347    27  15%  1821


Was fällt auf? Die SSDF verwendet(e) für ihre Berechnung den gleichen Algorithmus wie EloStat. Somit sollten wir ebenfalls bei EloStat (wenn auch fehlerbehaftet) verbleiben, um eine Vergleichbarkeit zu den alten SSDF Werten zu ermöglichen.

Gruß
Micha

Chesswalker 18.01.2016 10:56

AW: ELO ist relativ
 
Hi:)...
Es ist fraglich, ob überhaupt Schachprogramme oberhalb von ELO 3000 noch sinnvoll sind. Toll zwar als SuperSchachcomputer zum Lösen von Aufgaben
und Studien, aber es gibt keinen wirklichen Anreiz mehr gegen solche Schachprogramme zu spielen.
Ich muss auch über solche Postings lächeln (erfundenes Beispiel,aber ähnlich oft zu finden):

"Ach dieses Programm spielt nicht stark. Es hat Endspielschwächen und auch nur einen ELO-Wert von 2100"

....Kommentar überflüssig ;)

Wolfgang2 18.01.2016 12:37

AW: ELO ist relativ
 
Zitieren:

Zitat von Chesswalker (Beitrag 57007)
Hi:)...
...Ich muss auch über solche Postings lächeln (erfundenes Beispiel,aber ähnlich oft zu finden):

"Ach dieses Programm spielt nicht stark. Es hat Endspielschwächen und auch nur einen ELO-Wert von 2100"

....Kommentar überflüssig ;)

Nun ja. Ich sage etwas dazu. Das ist eine Frage der Betrachtungsweise: In meinem Thread "Im Schongang" zeigte ich die zwei einzigen selbst gespielte Turnierpartien gegen einem Ü 2100-Rechner. Wenn der Computer aufgrund einer sehr guten Leistung gewonnen hätte, hätte ich die Partien auch gezeigt.

Ich lasse mich gegen stärkere Schachcomputer (Ü2000) nie auf Komplikationen ein. Mit meiner Art zu spielen, habe ich gegen den London 68020 in schätzungsweise rund 20 lockeren Partien auch nur eine einzige gewonnen, aber grob geschätzt ein Drittel davon Remis gehalten.

Das Thema Endspiel ist sehr komplex, was Bewertungsfunktionen über Bauern angeht, das sieht man immer wieder.
a) Wann sind Randbauern stark oder nicht ?
b) Könnten sich starke Rand-Freibauern entwickeln, so dass sich der gegnerische König am Ende "zerreißen" müsste, um diese auf zu halten ?
c) Thema "Starker Doppelbauer". Da gibt es auch spezielle Literatur dazu

Worauf ich raus will: Wenn klassische Bewertungskriterien über Bauern (Randbauer, Doppelbauer --> Wertminderung) nicht zu treffen, dann hat man als Mensch eine Chance. Denn die beispielsweise rund 10-12 Halbzüge Suchtiefe sind für eine Lagebeurteilung oft zu wenig.

Aber damit kein Missverständnis aufkommt: In normalen lockeren Partien gegen MonteCarlo, MM II.. oder was ich so in der Nähe griffbereit habe, spiele ich auch "dynamischer" auf Angriff. Das oben beschriebene, im Prinzip von David Levy abgeschaute Rezept "Do nothing, but do it good" ist nur etwas, wenn es darauf ankommt.

Gruß
Wolfgang

Chesswalker 18.01.2016 14:19

AW: ELO ist relativ
 
Schach macht mir persönlich weniger Spass, wenn ich nur noch positionell aufpasse und schon froh bin, wenn ich gegen eine starke Maschine remis halten kann. Dieser "Erfolg" ist zweifelhaft. Es nimmt aufgrund positioneller Faktoren (Zwänge) das wunderbare und spanndende und verwickelte Schach Schaden.
Die Frage ist doch ob man vielleicht gar nur Remis halten will, weil man möglichst jedem Risko aus dem Wege geht und eigentlich im Hinterkopf hat,das Schachspiel zu vereinfachen ,um dann eine Maus (Remis) zu gebären? Mir macht so etwas keinen Spass.
David Levy spielte auch anders gegen Maschinen als gegen Menschen - auch diskussionswürdig ;). Dann spielt der Mensch in der Endkonsequenz nicht den Zug, den er für vernünftigsten hält ,sondern einen Zug , wo er hofft eine Schwäche der Maschine zu treffen. Und das soll das bezaubernde Schachpiel sein
mit seinen unbegrenzten Möglichkeiten?

MaximinusThrax 19.01.2016 00:59

AW: ELO ist relativ
 
Die Theoretiker streiten sich um ein paar weniger oder mehr Elo-Punkte auf dem Papier und die Praktiker spielen Schach - oder lassen spielen!


Alle Zeitangaben in WEZ +2. Es ist jetzt 12:16 Uhr.

Powered by vBulletin (Deutsch)
Copyright ©2000 - 2025, Jelsoft Enterprises Ltd.
©Schachcomputer.info