Schachcomputer.info Community - Test: Bei welchen Programmen wirkt sich Tuning am effektivsten aus ?

Schachcomputer.info Community (https://www.schachcomputer.info/forum/index.php)

- Technische Fragen und Probleme / Tuning (https://www.schachcomputer.info/forum/forumdisplay.php?f=12)

- - Test: Bei welchen Programmen wirkt sich Tuning am effektivsten aus ? (https://www.schachcomputer.info/forum/showthread.php?t=3919)

Paisano

26.06.2011 13:40

Bei welchen Programmen wirkt sich Tuning am effektivsten aus ?

Hallo,

Ich beschäftige mich im Moment mit einigen Versuchen, die „Tuningempfänglichkeit“ von verschiedenen Schachcomputern heraus zu finden.

Ausgangspunkt waren die Fragen, warum reagiert z. B. ein MM IV so stark auf eine Geschwindigkeitserhöhung und was ist möglicherweise von einem Atlanta 32 MHz zu erwarten.

Meine Überlegungen im Vorfeld stützten sich auf die Tatsache, dass bei reinem Hardwaretuning nur die Rechengeschwindigkeit erhöht und dadurch eine größere Rechentiefe erreicht
wird, welche sich wiederum in einem Elo-Zuwachs niederschlägt.

Es gibt einen Artikel, ich meine, es wäre Ken Thompson gewesen, bin mir da aber nicht absolut sicher, leider habe ich ihn trotz intensiver
Suche nicht mehr ausfindig machen können, vielleicht weiß ja jemand, wo das veröffentlicht wurde.

Der gesagte Artikel beschreibt, dass K. Thompson mit seinem Rechner Belle Tests durchgeführt hat, indem er verschiedene Versionen von Belle im Autoplay gegen-
einander spielen liess. Die Versionen unterschieden sich jeweils nur in der Rechentiefe, es spielten also Versionen mit einer maximalen Rechentiefe von 4, 5, 6, 7, 8 und 9
Halbzügen gegeneinander (können auch mehr oder weniger gewesen sein, wie gesagt, ich finde den Artikel nicht mehr).

Logischerweise schnitt die Version mit der höchsten Rechentiefe am Besten ab, aber die eigentliche Erkenntnis bestand darin, dass nach Auswertung der Ergebnisse
berechnet werden konnte, wie groß der Elo-Zuwachs mit jedem zusätzlichen Halbzug Rechentiefe war. Ebenso stellte Thompson fest, dass der Elo-Zuwachs mit zunehmender
Rechentiefe immer geringer wurde, eine Steigerung von durchschnittlich 7 auf 8 Halbzüge bringt also erheblich mehr als von 12 auf 13 Halbzüge.

Soweit, so gut… mein ursprünglicher Gedanke, warum manche Programme besser auf Tuning ansprechen als andere, war, dass eventuell manche Programme durch die Erhöhung
der Geschwindigkeit nicht nur einen, sondern möglicherweise hin und wieder sogar zwei Halbzüge tiefer rechnen.

Um das irgendwie praktisch zu überprüfen, habe ich schlichtweg bei diversen Programmen die Zeiten festgehalten, die jeweils bis zum Durchrechnen des nächst höheren
Halbzuges benötigt werden, normal ist hier der Faktor 5, also es ist entweder die 5-fache Geschwindigkeit oder die 5-fache Zeit für einen weiteren Halbzug erforderlich,
meine Theorie war jetzt, wenn ein Programm hier auf einen durchschnittlichen Faktor von etwas 2,5 kommt, müsste es eigentlich stärker vom Tuning profitieren.

Nachstehende Stellung aus der Partie Capablanca - Dus Chotimirski (Petersburg 1913) habe ich für den ersten Versuch ausgewählt, Weiss ist am Zug.

In der folgenden Tabelle sind die verschiedenen Programme mit ihren Zeiten (Angaben in Sekunden) sowie dem errechneten Faktor aufgelistet.
So richtig schlau werde ich aber nicht daraus, ausgerechnet der MM IV benötigt die meiste Zeit von Halbzug zu Halbzug und er profitiert
erwiesenermaßen sehr stark vom Tuning, mit dem 10. Halbzug bricht er regelrecht ein…, meine Theorie, je niedriger der Faktor, desto besser für's Tuning geeignet,
trifft nicht zu, mal vorausgesetzt, daß sich das überhaupt mit meinem Experiment nachweisen lässt:confused:.

Halbzug	Miami	Faktor	Explorer Pro	Faktor	Magellan	Faktor	Nigel Short	Faktor	MM V	Faktor	MM IV	Faktor	Super Forte B	Faktor
4	3	2	0	14	16	3	5
5	23	7,66	14	7	2	2	65	4,64	52	3,25	12	4,00	20	4,00
6	47	2,04	32	2,28	3	1,5	199	3,06	248	4,76	51	4,25	88	4,40
7	146	3,10	133	4,15	15	5	750	3,76	757	3,05	214	4,19	436	4,95
8	588	4,02	671	5,04	49	3,26	1667	2,22	3360	4,43	819	3,82	1439	3,30
9	1672	2,84	2400	3,57	143	2,91	7320	4,39	15970	4,75	3138	3,83	10545	7,32
10	7691	4,59	7080	2,95	418	2,92	26340	3,59	70500	4,41	66600	21,22	39881	3,78
Durchschnitt	-	4,042	-	4,165	-	2,932	-	3,610	-	4,108	-	8,262	-	4,625

Ich werde noch eine weitere Stellung mit vollem Brett zu Rate ziehen und abschliessend noch eine Endspielstellung mit wenig Figuren,
mal sehen, ob danach mehr Rückschlüsse bzw. eindeutigere Erkenntnisse möglich sind.

Aber vielleicht hat ja schon jetzt jemand eine Idee dazu oder zeigt mir einen möglichen Denkfehler auf…

Viele Grüße und schönen Sonntag
Uwe

Chessguru

26.06.2011 15:20

AW: Bei welchen Programmen wirkt sich Tuning am effektivsten aus ?

Hallo Uwe,

sehr interessante Idee bzw. Ansatz. Es bleibt aber die Frage, was stellt diese Tabelle dar?

Nichts anderes als die zeitlichen Auflistung, der erreichten Suchtiefen. Aber was sagt das über die Spielstärke bzw. Tuning-Tauglichkeit aus?

Führen wir uns das Suchverhalten eines Schachprogramms kurz vor Augen. Der Anfangszustand der zu analysierenden Stellung ist die Wurzel des Suchbaums. Von dieser Wurzel gehen bekanntlich Äste aus, die zu weiteren Knoten führen, von denen wieder Äste weiterführen. Dieser nun entstehende und immer weiter wachsende Suchbaum stellt das Programm vor die Frage, in welche Richtung sollte ich suchen, welchen Zug soll ich auswählen bzw. weiter verfolgen? Einfach gesagt, Suchbreite und Suchtiefe. Die Suchtiefe gibt z.B. an, wie viele Halbzüge man benötigt, um einen Knoten von der Wurzel aus zu erreichen. Die Suchbreite ist ein Maß dafür, ob man alle Zugfolgen oder nur ein Teil davon in den Suchvorgang mit einbeziehen möchte.

Das große bekannte Problem für die Stärke eines Schachprogramms besteht somit im Weiterverfolgen eines geeigneten Astes des Suchbaums, da die Hardware Ressourcen bekanntlich bei unseren Schachcomputer begrenzt sind und ein komplettes Durchsuchen unmöglich ist. Mögliche Endspieldatenbank lassen wir jetzt mal außen vor.

Welchen Weg sollte ein Programm wählen? Bekanntlich wählen Morsch-Kreaturen den schmalen und tiefen Weg in das Geäst des Baums, d.h. man schränkt die Suchbreite ein. Der bekannte Glasgow wählte einen völlig anderen Weg, die Einschränkung der Suche in die Tiefe. Der Spielbaum wurde nicht bis zu jedem Ende der Knoten vervollständigt, sondern die Tiefe und damit die Länge der Zugfolge wird begrenzt. Wie die Entwicklung gezeigt hat, ist der bessere Weg, die schnelle schmale Suche in die Tiefe.

Somit bringt uns aus meiner Sicht die Auflistung der Suchtiefen der einzelnen Programme zwar einen interessanten Einblick in das Suchverhalten, aber es sagt nichts aus, mit welchen Strategien vorgegangen wird bzw. wann, wie und wo der Suchbaum auf welche Art beschnitten wurde. Hinzu kommen weitere elementare Regeln, die jeder Anfänger kennt. Zentrum besetzen, Leichtfiguren schnell entwickeln, König in Sicherheit bringen (Rochade), Schwerfiguren auf offene und halboffene Linien bringen, Stellung des Königs in Endspielen, Initiative oder sogar psychologische Faktoren. Frei nach Lasker, der unangenehmste Zug für den Gegner, ist zugleich auch der stärkste Zug.

Es bleibt die abschließende Frage, wie soll so ein armes Programm nun all diesen Datenwust bewältigen? Da ich kein guter Programmierer bin, kann ich es nicht beantworten. Auch weiß ich nicht, wie man auf einfache Art die Tuning-Tauglichkeit von Programmen testen kann, außer natürlich indem man Partien spielt.

Um die Frage noch ein wenig schwerer zu machen, ein paar weitere Beispiele. Sowohl Novag SEC als auch Diablo scheinen von der Geschwindigkeitserhöhung im Revelation kaum zu profitieren. Hingegen wird das Spiel des SEB im Revelation deutlich solider und stärker. Bekanntlich wurde bei der C-Version an den selektiven Berechnungen gefeilt, zu Ungunsten der taktischen Schlagkraft, Thorsten hat das mal in der CSS sehr schön erläutert. Für die damalige 6 MHz Kiste brachte das eine bessere positionelle Stellungsbewertung, aber für spätere Tuninggeschichten scheint es negative Auswirkungen zu haben, da der Suchbaum anscheinend nicht entsprechend schnell in die Tiefe geht. Einige taktische Einschläge werden weder von der 6 noch von der 25 MHz Version gesehen. Ähnliches Verhalten zeigt sich beim Nachfolger Diablo 68000.

Ein hoch interessantes Thema, aber für uns schwer zu untersuchen. Was uns aber nicht daran hindern sollte, es weiter zu untersuchen. ;)

All das Geschriebene brauche ich dir natürlich nicht zu erzählen, da du dich seit Jahren mit der Computerschachthematik beschäftigst. Es sollte nur ein ganz allgemeiner Abriss sein, um die Problematik für "Außenstehende" ein wenig zu erläutern.

Gruß,
Micha

Gast146

26.06.2011 15:27

AW: Bei welchen Programmen wirkt sich Tuning am effektivsten aus ?

Zitieren:

Zitat von Paisano (Beitrag 37880)

(...)
Es gibt einen Artikel, ich meine, es wäre Ken Thompson gewesen, bin mir da aber nicht absolut sicher, leider habe ich ihn trotz intensiver
Suche nicht mehr ausfindig machen können, vielleicht weiß ja jemand, wo das veröffentlicht wurde.

Der gesagte Artikel beschreibt, dass K. Thompson mit seinem Rechner Belle Tests durchgeführt hat, indem er verschiedene Versionen von Belle im Autoplay gegen-
einander spielen liess. Die Versionen unterschieden sich jeweils nur in der Rechentiefe, es spielten also Versionen mit einer maximalen Rechentiefe von 4, 5, 6, 7, 8 und 9
Halbzügen gegeneinander (können auch mehr oder weniger gewesen sein, wie gesagt, ich finde den Artikel nicht mehr).

Logischerweise schnitt die Version mit der höchsten Rechentiefe am Besten ab, aber die eigentliche Erkenntnis bestand darin, dass nach Auswertung der Ergebnisse
berechnet werden konnte, wie groß der Elo-Zuwachs mit jedem zusätzlichen Halbzug Rechentiefe war. Ebenso stellte Thompson fest, dass der Elo-Zuwachs mit zunehmender
Rechentiefe immer geringer wurde, eine Steigerung von durchschnittlich 7 auf 8 Halbzüge bringt also erheblich mehr als von 12 auf 13 Halbzüge.
(...)

Dieter Steinwender, Frederic Friedel: Schach am PC, Verlag Markt &Technik, Haar bei München, 1995, S.248 ff.

3HZ: 1101 Elo
4HZ: 1235 Elo (+134)
5HZ: 1570 Elo (+235)
6HZ: 1826 Elo (+256)
7HZ: 2031 Elo (+205)
8HZ: 2208 Elo (+167) (ungefähre turnierstärke der BELLE)
9HZ: 2328 Elo (+120)

Robert

26.06.2011 18:45

AW: Bei welchen Programmen wirkt sich Tuning am effektivsten aus ?

Zitieren:

Zitat von Wandersleben (Beitrag 37884)

Ich denke mal, diesen Werten fehlt es wohl einfach an der nötigen Datenbasis (Horst als "CSS-Forum-Gestählter";) wird mir da evtl. zustimmen (@Horst: warst du nicht früher sogar Mathematiklehrer?); denn dass die Steigerung von 3 auf 4 HZ nur 134, aber z. B. von 5 auf 6 HZ 256 ELO betragen haben soll, ist für mich nicht einsehbar. Ab dem 6. HZ scheint es ja wieder zu passen, aber was da bei den niedrigeren Suchtiefen geschehen sein soll, kommt mir schon sehr merkwürdig vor...

Gab es den Autoplayer232 (mit dem man 2 PCs per seriellem Kabel miteinander verbinden und gegeneinander spielen lassen konnte) 1995 schon? Ich glaube eher nicht; ich kann mich erinnern, dass ich zwischen 1997 und 2000 damit experimentiert habe. Denn ohne die damit mögliche automatische Erzeugung von Beispielpartien ist es wohl kaum möglich, die für eine einigermaßen gesicherte Datenbasis nötige Partienzahl zu bekommen...

viele Grüße,
Robert

Gast146

26.06.2011 19:24

AW: Bei welchen Programmen wirkt sich Tuning am effektivsten aus ?

Hallo Robert!

Zitieren:

Zitat von Robert (Beitrag 37889)

In diesem datensatz fehlt der faktor zeit vollkommen. Ich habe noch einmal den zugehörigen text genauer studiert. Auch dort fehlt jede angabe, mit welchem zeitverbrauch BELLE die einzelnen halbzüge abgearbeitet hat.
Einen wichtigen aspekt möchte ich zusätzlich zitieren:
"Wie man sieht, ist das eine recht harmonische Kurve, die aber in der Extrapolation verschiedene Interpretationen zuläßt. Thompson, ein lupenreiner Wissenschaftler, hat sich selber nie an der Diskussion beteiligt. Für ihn gab es zu viele Ungenauigkeiten im Datenbestand: Der Sample ist sehr klein, die zu erwartende Zufallsstreuung zu groß, die Eigentümlichkeit, daß eine Maschine gegen sich selber spielt, unkalkulierbar. Das alles hielt seine peniblen Kollegen nicht davon ab, sehr heftig über die Konsequenzen zu spekulieren. (S.249)"

ps.
Es handelte sich um 420 partien, jeweils 20 jeder gegen jeden.

Zitieren:

Zitat von Robert (Beitrag 37889)

(...) Gab es den Autoplayer232 (mit dem man 2 PCs per seriellem Kabel miteinander verbinden und gegeneinander spielen lassen konnte) 1995 schon? Ich glaube eher nicht; (...)

Chrilly Donninger hat den Autoplayer ende 1994 programmiert:
http://www.scleinzell.schachvereine....toplayer.shtml

Viele grüße
Horst

Mythbuster

26.06.2011 20:49

AW: Bei welchen Programmen wirkt sich Tuning am effektivsten aus ?

Hallo Uwe,
wie ich an anderer Stelle schon mal schrieb und wie Micha auch schon angedeutet hat, ist es nur schwer zu sagen, wie sich Tuning auf welches Programm auswirkt.

Es gab früher (vor ca. 25 Jahren) zwei Grundsätze:

1. Eine Verdopplung der Rechengeschwindigkeit bringt ca. 70 Elo Punkte.

2. Ein zusätzlicher Halbzug (bei Brute Force Programmen) bringt ca. 200 Elo Punkte.

Zu Punkt 1: Diese Faustformel wurde schnell relativiert und man sprach von 50 bis 70 Elo Punkten bei einer Verdoppelung der Geschwindigkeit. Bei vielen Programmen traf das in den 80ern auch zu. Natürlich dachte man schnell darüber nach, was eine Steigerung um den Faktor 1.000 oder mehr bringen würde ...

In der Zwischenzeit hat sich gezeigt, daß die Faustformel nicht allgemeingültig ist, bzw. sich die Steigerung nicht beliebig fortsetzen lässt.
Das kann man leicht nachvollziehbar erklären:

Viele Schachprogramme treffen ihre Entscheidungen aufgrund ihres Wissens. Natürlich spielt auch die Suche eine Rolle, aber die einprogrammierten Regeln bestimmen dennoch den Zug! Wenn also ein Programm sich "mit voller Absicht" für den falschen Zug entscheidet, so wird es das immer tun, egal, wie tief es rechnet.

Als Beispiel hierfür möchte ich den Mephisto III bzw. Glasgow anführen. Dieses Programm wähle ich, weil es bekannt ist, daß es seine Entscheidungen nach menschlichen Kriterien trifft, langsam ist und dennoch "vernünftig" spielt. Außerdem können wir das Programm auch ideal aus "Tuning Sicht" betrachten, Mess Emu und Revelation sei Dank.

Was stellen wir nun beim Glasgow fest? Die erste große Beschleunigung im Revelation auf 66 MHz (Faktor 6,5) bringt tatsächlich einen Zuwachs an Spielstärke. In diesem Fall 143 Elo Punkte ... es liegt also im Rahmen der Regel. Was passiert nun, wenn man den Revelation als Basis nimmt und die Geschwindigkeit noch einmal um den Faktor 16 steigert? Eigentlich sollte die Elo Zahl dann um weitere 200 Punkte zunehmen ... Das ist jedoch nicht der Fall. Wenn überhaupt, spielt so ein "Turbo Glasgow" maximal 50 Punkte besser. Hier zeigt sich deutlich, daß eine weitere Steigerung der Geschwindigkeit keinen Zuwachs mehr bringt. Der Glasgow spielt die gleichen falschen Züge, nur schneller!

Wenn ein Programm hingegen wenig wissen hat und seine Züge rein aufgrund von schnellen, tiefen Berechnungen findet, kann man in der Theorie davon ausgehen, daß es "länger" dauert, bis der tote Punkt im Tuning erreicht ist ... aber natürlich gilt auch hier: Das Programm bildet aufgrund von Kriterien seine Entscheidung ... und manchmal auch die falschen Entscheidungen ... da hilft dann auch kein Tuning mehr.

Einfache Beispiele hierfür: Wenn ein Programm keine Ahnung vom "Falsche Läufer Spiel" hat, wird es fast immer den falschen Zug spielen ... auf der anderen Seite: Wenn ein Programm die Regel kennt, spielt es immer richtig, dann ist das Tuning ebenfalls meist nutzlos ... außer es kann im Suchbaum zu einer Stellung gelangen, in der ihm das Wissen hilft und diese herbeizwingen.

Dank Mess Emu und Revelation konnte ich mittlerweile viele Programme "getunt" beobachten ... und bis jetzt habe ich keine Regel gefunden, welche Programme mehr profitieren: Die "dummen Rechner" oder die "intelligenten Spieler" ... es gibt in beiden Lagern Beispiele für beide Varianten.

Offenbar ist es so, daß manche Programme schon ziemlich am möglichen Optimum sind, auch ohne Tuning ... und andere Programme durchaus mit besserer Hardware mehr Leistung bringen.

Es gibt eine Ausnahme. Und damit kommen wir zu Punkt 2: Dies gilt für reine Brute Force Brüter, wie die damaligen Weltmeister (Belle und Co) ...
Hier gilt in der Tat: Ein zusätzlicher Halbzug bringt 200 Punkte ... und die Steigerung der Rechengeschwindigkeit um Faktor 5 bringt diesen Halbzug ...

Zumindest gilt das bis zu einer Spielstärkte von ca. 2500 Punkten ... warum nur bis hier?

Die reinen Brute Force Monster sind taktisch in ihrem Bereich und ihrer Rechentiefe nicht zu schlagen ... dennoch können sie nur bis zu einer bestimmten Tiefe rechnen ... einfach weil im BF Suchverfahren die Zugzahl extrem ansteigt. Menschliche Spitzenspieler, die in diesen Regionen spielen, planen in aller Regel sehr langfristig, weit länger, als ein Brüter dies kann. Hier zählt Strategie und Intuition. Spitzenspieler sind in aller Regel in der Lage, ihre Stellung taktisch sicher zu halten. Somit kann ein Computer, der rein auf dieser Basis gerechnet hat, von Meisterspielern bezwungen werden ... die Kiste müsste schon extrem beschleunigt werden, um diesen Effekt zu egalisieren.

Gruß,
Sascha

Paisano

26.06.2011 23:08

AW: Bei welchen Programmen wirkt sich Tuning am effektivsten aus ?

Hallo Micha,

Zitieren:

Zitat von Chessguru (Beitrag 37883)

vielleicht habe ich meinen "Grundgedanken" nicht deutlich genug dargestellt, grad weil Du die in der Tabelle gelisteten Suchtiefen und Zeiten ansprichst,
das sind ja nicht die relevanten Daten, die hätte ich auch weglassen können, mit ging es einzig um den Faktor, der sich aus diesen Werten errechnet.

Lass es mich an einem Beispiel verdeutlichen... nehmen wir einfach mal rein hypothetisch an, die in der Tabelle stehenden Faktoren wären korrekt und
behalten gleichzeitig im Hinterkopf die Tatsache, daß ein zuätzlicher Halbzug Rechentiefe für einen von unseren alten Schachcomputern einen Zuwachs an
Spielstärke von X Elo mit sich bringt (wievie ein Halbzug bringt, ist an dieser Stelle jetzt auch egal, diese Frage muss man als separate Frage diskutieren,
Fakt ist aber, dass ein Zuwachs vorhanden ist).

Dann müsste ich einen Magellan "nur" (schmunzel) um ca. 290 %, einen Super Forte B aber um ca. 460 % beschleunigen, um quasi den gleichen Effekt zu erzielen,
nämlich grundsätzlich einen Halbzug mehr zu berechnen wie eine ungetunte Version des gleichen Programms.

Würde man diesen Sachverhalt ohne nähere Betrachtung von anderen Faktoren als gegeben hinnehmen, dann kommt man zwangsläufig zu dem Schluss,
daß es "lohnenswerter" ist, einen Magellan zu beschleunigen als einen Super Forte, oder ?;).

Aber ich weiss, ganz so einfach ist das natürlich nicht und wie Du sagtest, ob wir bestimmte Dinge jemals in Erfahrung bringen werden, ist fraglich,
aber wenn's keiner ausprobiert, dann mit Sicherheit nicht !!:D

Nur noch so am Rande bemerkt, die ganzen technischen Möglichkeiten, bei welchem Gerät was möglich ist und was nicht, habe ich jetzt hier natürlich völlig aussen vor gelassen,
es sind rein theoretische Überlegungen, die ich hier angestellt habe und die vielleicht den einen oder anderen Rückschluss ermöglichen.

Viele Grüße
Uwe

@Sascha Ich komme später auf Deine Ausführungen zurück, dafür reicht heut die Zeit nicht mehr

Mythbuster

26.06.2011 23:25

AW: Bei welchen Programmen wirkt sich Tuning am effektivsten aus ?

Hallo Uwe,
um Dein Beispiel zu nehmen: Computer A muss um 290% beschleunigt werden, um die Brute Force Basis um einen Halbzug zu erhöhen und Computer B um 400% ....

Aber: Dennoch würde die Spielstärke vermutlich nicht im gleichen Maß ansteigen, auch wenn in der Theorie ein zusätzlicher HZ 200 Elo Punkte bringen sollte.

Die Theorie stimmt nur bei reinen Brute Force Rechnern ... da aber nahezu jeder Computer selektive Teile hat, sind die Auswirkungen unterschiedlich ....

Auch hier gibt es sehr viele Variablen:

1. Nicht jeder Computer erhöht die BF und die selektive Suchtiefe im gleichen Maß. Und auch nicht fortlaufend. So kann es sein, daß Computer A 4 HZ Brute Force rechnet und 10 HZ selektiv .... wenn er aber HZ 5 berechnet, geht er vielleicht selektiv bis 15 Halbzüge tief ... während Computer B vielleicht immer fix 3, 4 oder 5 Züge auf den BF Sockel aufsattelt ...
Man kann also gar nicht aussagen, wie sich der zusätzliche HZ Brute Force letztlich auf das Gesamtrechenergebnis in Elo auswirkt, da die selektiven Spitzen sehr unterschiedlich sein können ... und bei vielen Programmen situationsabhängig unabhängig vom BF Sockel in die Tiefe gehen.

2. Ebenso muss man dann wissen, wie groß der prozentuale Rechenanteil der Programme für den Sockel und die Spitzen ist ...

3. Programme mit wenig Wissen rechnen in der Regel schnell und werden auch schneller in die Tiefe kommen ... in der Theorie sollten sie durch eine Erhöhung der Tiefe eher profitieren, da sie mit Rechenkraft fehlendes Wissen ausgleichen müssen.

Aber das ist alles graue Theorie ...

Gruß,
Sascha

Paisano

26.06.2011 23:33

AW: Bei welchen Programmen wirkt sich Tuning am effektivsten aus ?

Hallo Horst,

danke erstmal für Deinen Hinweis auf die Quelle, ich habe die Informationen auch in dem Buch gesucht, aber nur in dem Abschnitt über K. Thompson/Belle:o

Zitieren:

Zitat von Wandersleben (Beitrag 37890)

Soweit ich das verstanden habe, spielte der Zeitfaktor in dem Versuch von Thompson auch keine Rolle, da die einzelnen Versionen ja ihren Zug jeweils nach Erreichen der jeweiligen Rechentiefe ausgespielt haben.

Viele Grüße
Uwe

mclane

27.06.2011 01:15

AW: Bei welchen Programmen wirkt sich Tuning am effektivsten aus ?

ich möchte eine andere ueberlegung bringen.
den branching faktor zu ermitteln. na gut. das ist alles ganz nett.
aber sagt uns das was ueber das tuning aus ? ich glaube NICHT.

es sagt uns nur etwas ueber die ZEIT aus die das programm benötigt um tiefer zu kommen. aber fuers tuning ist TIEFER kommen wohl entscheidend (das ist richtig),
aber viel wichtiger ist: wann ändert das programm seinen zug.
denn eine durch tuning relevante verbesserung erfolgt nur, wenn
die durchs tuning längere rechenzeit einfluss auf den ZUG nehmen kann.

messt also mal wie OFT sich in Rechentiefen nochmals der 1. Zug verändert.

wenn sich der zug verändert, hat das programm ueberhaupt die möglichkeit seinen zug zu ändern.

nehmen wir an ein programm hat denselben zug seit 2 minuten.
nun kommt eine neue rechentiefe. immer noch derselbe zug.
dann einen halbzug weiter, endlich die veränderung.

ein anderes programm ist da ganz anders. es rechnet sehr häufig andere zuege als beste zuege.

es wird durch das tuning VIEL EHER zu anderen zuegen kommen.

wenn ein programm kaum die 1. Halbzuege der HV ändert, was soll ein noch so gutes tuning da denn bringen ??

da wird selbst eine verdopplung oder verdreifachung kaum was reissen.

diese frequenz, das wäre interessant zu ermitteln.

vielleicht ist das eine besser erklärende theorie.

EberlW

27.06.2011 11:33

AW: Bei welchen Programmen wirkt sich Tuning am effektivsten aus ?

Hallo Jungs, hier mal meine wirren Gedanken dazu (sorry, bin noch nicht ganz wach):

Wenn ein Programm seinen bisherigen Zug "verbessern" soll, muss es die Gelegenheit bekommen ihn verwerfen zu können. Da die meisten Programme gerne die erste (also ihrer Ansicht nach "beste") Variante bis zum Schluss durchrechnen bevor sie ziehen, wird hier eine Menge Zeit verbraucht. In der Regel würde es an der Spielstärke der Programme nichts ändern, wenn sie unmittelbar nach Abschluss einer Suchtiefe ihren Zug ausführen - denn was bringt es, wenn sie die erste Variante noch einmal in der nächsten Tiefe noch einmal durchkauen, nur um dann doch diesen Zug zu spielen? Programme, die eine Suchtiefe immer komplett abarbeiten bevor sie ziehen scheinen mir da einen gewissen Vorteil zu haben, denn gerade das weitere Berechnen ausschließlich der ersten Zugmöglichkeit in einer weiteren Suchtiefe kostet sehr viel Zeit. Einziger Vorteil des erneuten Durchkauens eines zuges der 'eh ausgespielt wird: Der Computer kann eine mögliche Wendung entdecken und schon mal darauf pondern, während der andere Programmtyp das nicht kann. Da Pondertreffer nich an der Tagesordnung sind, ist das pure Zeitverschwendung.

Dennoch dürften beide Programmtypen (ich will sie aber nicht zu empirisch trennen, da es hin und wieder Abweichungen von diesen Verhaltensmustern gibt - situationsbedingt eben) im Mittel gleichermaßen von einer Verlängerung der Bedenkzeit profitieren, die sich ja quasi durch das Tuning ergibt. Sei es, weil der erste Programmtyp dadurch auf den besseren Antwortzug pondert, oder weil der zweite Programmtyp beim Abarbeiten der folgenden Zugmöglichkeiten einen bessern Zug findet, den er ausspielen wird.

Wenn jetzt -egal welchen Programmtyp betreffend- eine jeweils weitere Suchtiefe bedeutet, dass zwischen 3 und 5 mal so lange gerechnet werden muss als bisher, wäre es logisch sich beim Tuning auf ein Mittel von 4 einzustellen. Das ist natürlich eine Hausnummer und nur in seltenen Fällen zu erreichen, Emulationen mal ausgeklammert. Entscheidend dürfte dennoch eher das Zeitmanagement sein, denn wenn eine weitere Suchtiefe das eine Mal "nur" 3-fache Zeit benötigt, dann kann sich das Programm irgendwann auch mal die 5-fache Zeit lassen um tiefer zu kommen. Von daher dürften die Programme dann am Besten mit der zusätzlichen Zeit etwas Positives erreichen, wenn sie auf Spielstufen mit durchschnittlichen Bedenkzeiten eingestellt sind. Da wir meistens schon über einen Tunigfaktor "2" froh sein können, wird es natürlich schwer für die Programme, sich für einen besseren Zug zu entscheiden, denn die "angesparte" Zeit wird nun viel seltener reichen um mal etwas tiefer zu gehen.

Natürlich - wenn ein Programm aufgrund "mangelndem Wissens" einen falschen Zug anstrebt, so ändert ein Halbzug mehr Suchtiefe auch nichts daran. Rettung kann man dann vielleicht erwarten, wenn zufällig die selektiven Spitzen noch etwas weiter reichen und dadurch -vielleicht- der Fehler erkannt wird weil eine Verluststellung ausgerechnet werden kann (der Computer also sein mangelndes Wissen durch Suchtiefe ersetzen konnte). Funktionieren kann das eher bei den Programmen, die keine feste selektive Suchtiefe auf den BF-Sockel aufschlagen, sondern hier variabel sind. Doch auch hier dürfte im praktischen Spielbetrieb nur selten Wissen durch Tiefe ersetzt werden. Bei der vergleichsweise geringen CPU-Leistung aller klassichen Schachcomputer müsste das Brett wohl fast schon leer sein, bevor soetwas greift und dann ist es doch in aller Regel schon gelaufen...

Ob Tuning bei dem einen Gerät mehr bringt als bei dem anderen, hängt offenbar von sehr vielen Faktoren ab. Einen weiteren wichtigen Faktor haben wir noch nicht beleuchtet: Die aktuelle Spielsituation! Bei einer Testpositon "A" beispielsweise rechnet das eine Gerät nach Taktverdreifachung einen satten Halbzug tiefer als ohne Tuning und ein anderes Gerät schafft es unter gleichen Bedingungen vielleicht nicht einmal die nächsten zwei oder drei weiteren Zugmöglichkeit näher anzuschauen. Das kann sich bei Testposition "B" glatt umkehren, denn entscheidend sind doch die vielen diversen Algorythmen, die jedes Schachprogramm durchlaufen muss um eine einzige Stellungsbeurteilung zu errechnen.

Ich glaube nicht, dass man durch Herauspicken nur des einen oder anderen Faktors darauf schließen kann, ob ein Gerät besser auf Tuning reagiert als ein anderes. Nur das praktische Spiel kann uns Aufschlüsse liefern - und dazu gehören weit mehr als nur eine Handvoll Partien.

Gruß, Wilfried

Paisano

29.06.2011 23:25

AW: Bei welchen Programmen wirkt sich Tuning am effektivsten aus ?

Hallo Sascha

Zitieren:

Zitat von Mythbuster (Beitrag 37894)

Hallo Uwe,
wie ich an anderer Stelle schon mal schrieb und wie Micha auch schon angedeutet hat, ist es nur schwer zu sagen, wie sich Tuning auf welches Programm auswirkt.

jaaa..., ist mir auch bewusst und gerade deswegen habe ich nach einem "Weg" gesucht, der neben dem subjektiven Empfinden während einer Partie und möglicherweise
vor dem Absolvieren von hunderten Partien einen Hinweis liefern könnte:)

Zitieren:

Zitat von Mythbuster (Beitrag 37894)

Es gab früher (vor ca. 25 Jahren) zwei Grundsätze:

1. Eine Verdopplung der Rechengeschwindigkeit bringt ca. 70 Elo Punkte.

2. Ein zusätzlicher Halbzug (bei Brute Force Programmen) bringt ca. 200 Elo Punkte.

Zu Punkt 1: Diese Faustformel wurde schnell relativiert und man sprach von 50 bis 70 Elo Punkten bei einer Verdoppelung der Geschwindigkeit. Bei vielen Programmen traf das in den 80ern auch zu. Natürlich dachte man schnell darüber nach, was eine Steigerung um den Faktor 1.000 oder mehr bringen würde ...

In der Zwischenzeit hat sich gezeigt, daß die Faustformel nicht allgemeingültig ist, bzw. sich die Steigerung nicht beliebig fortsetzen lässt.
Das kann man leicht nachvollziehbar erklären:

Viele Schachprogramme treffen ihre Entscheidungen aufgrund ihres Wissens. Natürlich spielt auch die Suche eine Rolle, aber die einprogrammierten Regeln bestimmen dennoch den Zug! Wenn also ein Programm sich "mit voller Absicht" für den falschen Zug entscheidet, so wird es das immer tun, egal, wie tief es rechnet.

Das sehe ich etwas anders, das vorhandene oder einprogrammierte Wissen wirkt sich meiner Meinung nach nur in einem Bruchteil von Stellungen aus, nur um mal eine Zahl zu nennen,
ich würde den Anteil mal auf 5 % bei einem Programm wie Polgar oder Super Forte C schätzen, bei den Lang Programmen vielleicht etwas mehr, aber der Rest der Züge wird einfach nur ausgerechnet.

Erklärend dazu muss ich allerdings sagen, daß ich das Verhalten eines Programms à la -> besetze mit dem Turm eine offene Linie oder postiere einen Springer so, daß er möglichst
viele Felder "bestreicht" nicht als Wissen werte. das sind für mich ganz normale Regeln, die jedes einigermaßen gutes Schachprogramm in seiner Bewertungsfunktion berücksichtigt.

Echtes "Wissen" stellen für mich Fähigkeiten wie z. B. Mattführung mit Springer/Läufer, falscher Läufer oder auch das Erkennen, daß zwei Springer nicht Mattsetzen können und unter
Umständen auch die Bauernstrukturen z. B. beim Vancouver dar, aber diese Fähigkeiten spielen nur eine untergeordnete Rolle
hinsichtlich der Spielstärke bzw. sind im Fall der Bauernstrukturen auch völlig unabhängig vom Tuning.

Ich denke, man muss hier auch unterscheiden zwischen, ich nenn es mal statisches und dynamisches Wissen, wobei sich statisches Wissen in Reinkultur
äussert in der Erkennung, daß zwei Könige allein auf dem Brett ein Remis zur Folge hat. Dynamisches Wissen zeigt sich beispielsweise als das Ergebnis einer intelligenten
und ausgewogenen Bewertungsfunktion, die ein Programm dazu veranlasst, seinen Turm hinter einen Freibauern zu bringen.

Aus das Thema Tuning bezogen spielt also aus meiner Sicht das statische Wissen eine untergeordnete Rolle, da es einfach zu selten "greift", ich habe
schon hunderte von Computerpartien gespielt und kann mich nicht an ein Endspiel mit Springer/Läufer gegen König erinnern und das würde ich garantiert;)....
ja, ich weiß, es kommt vor, aber wie gesagt, nicht entscheidend um sichtbare Auswirkungen auf die Spielstärke nach sich zu ziehen.

Zitieren:

Zitat von Mythbuster (Beitrag 37894)

Als Beispiel hierfür möchte ich den Mephisto III bzw. Glasgow anführen. Dieses Programm wähle ich, weil es bekannt ist, daß es seine Entscheidungen nach menschlichen Kriterien trifft, langsam ist und dennoch "vernünftig" spielt. Außerdem können wir das Programm auch ideal aus "Tuning Sicht" betrachten, Mess Emu und Revelation sei Dank.

Was stellen wir nun beim Glasgow fest? Die erste große Beschleunigung im Revelation auf 66 MHz (Faktor 6,5) bringt tatsächlich einen Zuwachs an Spielstärke. In diesem Fall 143 Elo Punkte ... es liegt also im Rahmen der Regel. Was passiert nun, wenn man den Revelation als Basis nimmt und die Geschwindigkeit noch einmal um den Faktor 16 steigert? Eigentlich sollte die Elo Zahl dann um weitere 200 Punkte zunehmen ... Das ist jedoch nicht der Fall. Wenn überhaupt, spielt so ein "Turbo Glasgow" maximal 50 Punkte besser. Hier zeigt sich deutlich, daß eine weitere Steigerung der Geschwindigkeit keinen Zuwachs mehr bringt. Der Glasgow spielt die gleichen falschen Züge, nur schneller!

Hab mir schon gedacht, daß Du den Glasgow in diesem Zusammenhang erwähnst;), aber...

in dieser Diskussion und Thematik würde ich ihn gern außen vor lassen bzw. einer separaten Betrachtung unterziehen, die Erklärung ist ja auch ganz einfach:
der Glasgow rechnet völlig anders als alle anderen Programme und sein Suchverhalten ist in keinster Weise z. B. mit dem eines MM IV oder Magellan vergleichbar.

Für die Programme von Nitsche/Henne gelten andere Kriterien, wie schon gesagt, dieses Programm muß man für sich allein unter die Lupe nehmen und ich bin
mir ziemlich sicher, daß es sich in Bezug auf Tuning ebenso anders verhält als die breite Masse.

Zitieren:

Zitat von Mythbuster (Beitrag 37894)

Wenn ein Programm hingegen wenig wissen hat und seine Züge rein aufgrund von schnellen, tiefen Berechnungen findet, kann man in der Theorie davon ausgehen, daß es "länger" dauert, bis der tote Punkt im Tuning erreicht ist ... aber natürlich gilt auch hier: Das Programm bildet aufgrund von Kriterien seine Entscheidung ... und manchmal auch die falschen Entscheidungen ... da hilft dann auch kein Tuning mehr.
Einfache Beispiele hierfür: Wenn ein Programm keine Ahnung vom "Falsche Läufer Spiel" hat, wird es fast immer den falschen Zug spielen ... auf der anderen Seite: Wenn ein Programm die Regel kennt, spielt es immer richtig, dann ist das Tuning ebenfalls meist nutzlos ... außer es kann im Suchbaum zu einer Stellung gelangen, in der ihm das Wissen hilft und diese herbeizwingen.

Wie gesagt, kommt meiner Meinung nach einfach zu selten vor um Relevanz zu haben.

Zitieren:

Zitat von Mythbuster (Beitrag 37894)

Dank Mess Emu und Revelation konnte ich mittlerweile viele Programme "getunt" beobachten ... und bis jetzt habe ich keine Regel gefunden, welche Programme mehr profitieren: Die "dummen Rechner" oder die "intelligenten Spieler" ... es gibt in beiden Lagern Beispiele für beide Varianten.

Muss es denn davon abhängen, ob "dumm" oder "intelligent"?, ich tendiere mehr in die Richtung "langsam" oder "schnell" durch den Suchbaum...

Zitieren:

Zitat von Mythbuster (Beitrag 37894)

Offenbar ist es so, daß manche Programme schon ziemlich am möglichen Optimum sind, auch ohne Tuning ... und andere Programme durchaus mit besserer Hardware mehr Leistung bringen.

Ja, damit kommen wir wieder auf den Titel dieses Threads zurück :D, aber auch wenn wir keine endgültige Antwort auf diese Frage finden, lohnt es sich, darüber zu diskutieren.

Grüße
Uwe

Paisano

26.07.2011 15:34

AW: Bei welchen Programmen wirkt sich Tuning am effektivsten aus ?

Hallo zusammen,

der Vollständigkeit halber habe ich noch eine weitere Stellung untersucht, allerdings (erwartungsgemäß) ohne zu eindeutigeren Schlussfolgerungen zu gelangen,
aus diesem Grund habe ich mir die Mühe erspart, diese Tabelle zu erstellen, die zusätzliche Rechentiefe allein ist nicht der entscheidende Faktor beim Tuning.

Die von Thorsten geäusserte Theorie -->Zitat :messt also mal wie OFT sich in Rechentiefen nochmals der 1. Zug verändert wäre ein weiterer Ansatzpunkt,
scheint mir aber nur äussert schwierig umzusetzen, man dürfte das Display quasi über längere Zeit nicht aus den Augen lassen:dead:.

Eine abschliessende Vermutung von mir, Programme, die bei zunehmender Rechentiefe den Suchbaum sowohl in die Breite als auch in Tiefe erweitern,
werden stärker vom Tuning profitieren als Programme, die die zunehmende Rechentiefe überwiegend dazu nutzen, die selektiven Erweiterungen zu vertiefen.

Vielleicht ist das ja auch die Ursache, warum der Diablo mit höherer Geschwindigkeit kaum zulegt, eventuell bringt hier eine Verringerung der Selektivität eine Änderung...

Noch ein Wort zum 32 MHz Atlanta, so ganz will ich mich mit der von Micha geäusserten Vermutung noch nicht abfinden;), sicher ist der Erfolg gegen die "Oberklasse" eher bescheiden ausgefallen,
aber ich tendiere immer noch zu der Ansicht, daß der beschleunigte Atlanta gegen Geräte in seinem näheren Umfeld deutlich besser abschneiden wird wie die Normalversion.

Ich spiele im Moment Partien gegen den Vancouver 68000, den Mach IV 25 MHz und den Star Diamond, gegen den Risc 2500 erreichte der Atlanta ein 3,5 - 1,5,
die Resultate der geplanten Zweikämpfe werde ich dann nachreichen.

Grüße
Uwe

EberlW

26.07.2011 16:34

AW: Bei welchen Programmen wirkt sich Tuning am effektivsten aus ?

Zitieren:

Zitat von Paisano (Beitrag 38781)

Noch ein Wort zum 32 MHz Atlanta, so ganz will ich mich mit der von Micha geäusserten Vermutung noch nicht abfinden;), sicher ist der Erfolg gegen die "Oberklasse" eher bescheiden ausgefallen,
aber ich tendiere immer noch zu der Ansicht, daß der beschleunigte Atlanta gegen Geräte in seinem näheren Umfeld deutlich besser abschneiden wird wie die Normalversion.

Ich spiele im Moment Partien gegen den Vancouver 68000, den Mach IV 25 MHz und den Star Diamond, gegen den Risc 2500 erreichte der Atlanta ein 3,5 - 1,5,
die Resultate der geplanten Zweikämpfe werde ich dann nachreichen.

Grüße
Uwe

Nun ja, Uwe...

irgendwo ist immer mal das "Ende der Fahnenstange" erreicht und vielleicht ist der ungetunte Atlanta ja wirklich ganz in der Nähe davon angesiedelt? Allerdings kann man das sicher nicht völlig pauschalieren, denn mehr Rechentempo bedeutet mehr Varianten und gelegentlich mehr Tiefe - die "Fahnenstange" kann also durchaus auch mal etwas verlängert werden. Nur muss der Atlanta dann auch hochklettern! :D

Ich nehme an, Du machst die Kämpfe mit einem getunten Atlanta?
Um eine bessere Vergleichbarkeit zu bekommen und das Tuning beim Atlanta schneller als "positiv" oder "witzlos" einstufen zu können, würde ich persönlich hergehen und nach Abschluss aller Partien den Vergleich noch einmal mit der ungetunten Kiste vornehmen - natürlich unter Wiederholung der zuvor gespielten Eröffnungsvarianten. Es sollten sich nur wenige Züge nach Verlassen der Bibis andere Partien ergeben - ob der getunte Atlanta damit besser klarkommt, wird sich dann ja schnell zeigen.

Gruß, Wilfried

PS: Vancouver 68000 und Star Diamond halte ich auch gegen einen ungetunten Atlanta für etwas schwach auf der Brust - die spielen meiner Erfahrung nach gerade mal auf MP-Niveau. Risc 2500 und Mach IV/25 kann ich hingegen nicht beurteilen...

Mythbuster

27.07.2011 15:57

AW: Bei welchen Programmen wirkt sich Tuning am effektivsten aus ?

Hallo zusammen,
ich habe mir noch einmal Gedanken gemacht. Ich frage mich, ob es sein kann, daß sich das Rechenverhalten bei einigen Programmen mit der verfügbaren Zugzeit ändert.

Hintergrund: Novag schreibt im Handbuch des Diablo, daß die Werte für Selektivität bei Turnierpartien auf 5 gestellt werden sollten, hingegen bei kurzen Bedenkzeiten auf 3.

Meine Überlegung: Technisch wäre es kein großer Aufwand, dem Programm zu sagen: "Bei kurzer Bedenkzeit versuche so breit wie möglich zu rechnen und nur wenige Züge selektiv verfolgen" ... um möglichst taktisch sicher zu stehen. Und weiter ... "Bei Turnierbedenkzeit verfolge mehr Züge selektiv und tiefer" ... um eher langfristige Strategien zu verfolgen ...

Sollte es tatsächlich so sein, könnte es sein, daß Programme, bei denen die Uhr korrekt läuft, anders auf Tuning reagieren, als Programme, deren Uhren mit beschleunigt werden.

Ob Programme diese Funktion überhaupt haben könnte man überprüfen, ob sich Suchverhalten / Lösezeiten ändern, wenn man Stellungen bei 30 Sekunden pro Zug, 3 Minuten pro Zug und auf der Analysestufe durchrechnen lässt.

Wäre auf jeden Fall ein Denkansatz.

Gruß,
Sascha

Paisano

27.07.2011 23:20

AW: Bei welchen Programmen wirkt sich Tuning am effektivsten aus ?

Hi Willi,

Zitieren:

Zitat von EberlW (Beitrag 38786)

Nun ja, Uwe...

irgendwo ist immer mal das "Ende der Fahnenstange" erreicht und vielleicht ist der ungetunte Atlanta ja wirklich ganz in der Nähe davon angesiedelt?

kann sein, muss aber nicht, immerhin hat sich das Tuning bei den Morsch-Programmen bisher durchaus positiv bemerkbar gemacht, wenn man mal von Achim's Explorer absieht,
aber der hat auch noch nicht viele Partien gespielt.

Zitieren:

Zitat von EberlW (Beitrag 38786)

Ich nehme an, Du machst die Kämpfe mit einem getunten Atlanta?

jawoll!:D

Zitieren:

Zitat von EberlW (Beitrag 38786)

Um eine bessere Vergleichbarkeit zu bekommen und das Tuning beim Atlanta schneller als "positiv" oder "witzlos" einstufen zu können, würde ich persönlich hergehen und nach Abschluss aller Partien den Vergleich noch einmal mit der ungetunten Kiste vornehmen - natürlich unter Wiederholung der zuvor gespielten Eröffnungsvarianten. Es sollten sich nur wenige Züge nach Verlassen der Bibis andere Partien ergeben - ob der getunte Atlanta damit besser klarkommt, wird sich dann ja schnell zeigen.

äähhhmmm..., hier kann ich nicht ganz folgen, klar ergeben sich mit Sicherheit nach wenigen Zügen andere Partienverläufe, aber alle Zweikämpfe nochmal austragen ?:confused:

Zitieren:

Zitat von EberlW (Beitrag 38786)

PS: Vancouver 68000 und Star Diamond halte ich auch gegen einen ungetunten Atlanta für etwas schwach auf der Brust - die spielen meiner Erfahrung nach gerade mal auf MP-Niveau. Risc 2500 und Mach IV/25 kann ich hingegen nicht beurteilen...

Das ist ja in gewisserweise Teil des Plans;), auch wenn die genannten Geräte nicht ganz auf Augenhöhe mit dem Atlanta sind, machen diese Partien durchaus Sinn,
schließlich bildet sich ja die Elozahl nicht nur aus Begegnungen mit Geräten, die höher eingestuft sind. Allerdings werde ich keine Partien gegen noch schwächere Geräte spielen,
aber ich habe mich nach einigem Überlegen jetzt doch entschlossen, eine Reihe von Partien gegen den normalen Magellan auszutragen.

Viele Grüße
Uwe

PS. Der Vancouver 68000 wurde inzwischen mit 4,5 : 0,5 abgefertigt.

EberlW

28.07.2011 16:27

AW: Bei welchen Programmen wirkt sich Tuning am effektivsten aus ?

Zitieren:

Zitat von Paisano (Beitrag 38812)

Hi Willi,kann sein, muss aber nicht, immerhin hat sich das Tuning bei den Morsch-Programmen bisher durchaus positiv bemerkbar gemacht, wenn man mal von Achim's Explorer absieht,
aber der hat auch noch nicht viele Partien gespielt.

Ja, die Morschis reagieren im allgemeinen sehr gut auf's Tuning. Mein Miami hatte mit 24MHz eine recht beeindruckende Leistung gegen so manches "Dickschiff" gezeigt. Das dasselbe Programm mit sogar noch mehr Speed (Achim's Explorer auf 32MHz) aber auch wieder eins auf die Mütze bekommen kann, wurde ebenso eindrucksvoll demonstriert. Wir erleben ja immer nur "Momentaufnahmen", mit teilweise recht ausgeprägten "Ausreissern", die sich manchmal sogar über den Verlauf eines ganzes Turnieres hinziehen können. Solche Geschichten sind m.E. einerseits vom jeweiligen Gegner abhängig, wie andererseits auch von den gewählten Eröffnungen.

Zitieren:

äähhhmmm..., hier kann ich nicht ganz folgen, klar ergeben sich mit Sicherheit nach wenigen Zügen andere Partienverläufe, aber alle Zweikämpfe nochmal austragen ?:confused:

Ja, ich weiss das hört sich öde an, doch sehe ich hierin den besten Weg, ein möglichst aussagekräftiges Ergebnis zu erhalten. Dazu eine kleine Erläuterung, was sich in meinen wahnhaften Gedankengängen abspielt:

Das Tuning bei Stellungstests immer etwas bringt, steht völlig ausser Frage, doch nur im praktischen Spiel zeigt sich die wahre Effektivität, die sich letztlich auch in praktisch erspielten Elos niederschlagen kann. Allerdings sehe ich hier den Haken an den (naturgemäß) regelmäßig verschiedenen Bedingungen wie eben der verschiedenen Gegner und Eröffnungen.

Will man das kompensieren, bleibt nur die Eröffnungswiederholung gegen denselben Gegner. Eröffnungssuiten wie sie bei PCs gerne hergenommen wurden sind irrelevant, weil sie nicht zwingend aus der Praxis der Geräte (bzw. deren Bibliotheken) stammen. Wenn aber beispielsweise der ungetunte Atlanta gegen die V11 zehn verschiedene Eröffnungen gespielt hat, dann sind diese Eröffnungen "praktisch relevant" und können bei gleicher Farbverteilung unter Verwendung des getunten Atlanta hergenommen werden mit dem Ziel festzustellen, ob durch die sich anschließend zwangsweise ändernde Partie die Erfolgsquote des Atlanta beeinflusst wird.

Dergleichen macht man auch im Vergleich zu anderen Gegnern und kann dann recht einfach sehen, ob das Tuning effektiv eine nennenswerte Wirkung zeigt oder nicht. Natürlich können auch vom ungetunten Atlanta siegreich weitergeführte Eröffnungen beim getunten Atlanta in die Hose gehen, aber so ist halt das Leben.

Ich kann nur sagen, dass ich hierin die "akademischste" Ergebnissquelle sehe (die wegen der 100% praktischen Nachvollziehbarkeit sogar in unsere Listen einfließen darf). Natürlich kann ich damit auf dem Holzweg sein und nur das "aka dämlichste" von mir gegeben haben - ich nehme ja jederzeit Lehre an und kann auch ansonsten mit anderen Meinungen leben. Es ist mir auch völlig klar, dass dieser Weg ziemlich trist erscheinen mag. Persönlich halte ich ihn für spannend... ;)

Zitieren:

Ja Uwe, schon klar dass auch gegen (etwas) schwächere Geräte gespielt werden muss - es war ja auch nicht als Kritik gemeint, sondern eher als Hinweis an jene Leser, welche die Spielstärken der Geräte nicht ad hoc aus dem Gedächtnis rufen können. Ein Vergleich mit dem Maggi ist sicher auch nicht schlecht. Wenn es den Erwartungen (den meinen...) entsprechend verläuft, holt der getunte Atlanta locker 60-70%. Das Ergebnis gegen den Vancouver ist recht imposant, sind die Langs doch oft sehr unbequeme Gegner für die Morschis. Hast Du zufällig getunte 68020er Langs in petto? Da hat der Atlanta auch getuned einiges zu knabbern. Ich würde ihm auch o.g. V11 auf den Hals hetzen und den R30, aber bei all' diesen "Dickschiffen" muss ich natürlich passen. Doch das haben andere Schachfreunde bereits getan, soweit ich weiss...
Was ich mal machen kann ist, einen älteren Vergleich zwischen Atlanta und King 2.54 herauszukramen (habe derzeit keinen Zugriff auf die Festplatte ... heul!) und diesen dann mit dem getunten Atlanta wiederholen. Damals hat der Atlanta den Vergleich knapp verloren - könnte bei Wiederholung gut und gerne ausgeglichen enden.

Gruß, Wilfried

Robert

28.07.2011 17:02

AW: Bei welchen Programmen wirkt sich Tuning am effektivsten aus ?

Hallo Willi,

Zitieren:

Zitat von EberlW (Beitrag 38822)

Will man das kompensieren, bleibt nur die Eröffnungswiederholung gegen denselben Gegner.

du meinst vermutlich mit getauschten Farben?
Prinzipiell gebe ich dir recht; aber ich frage mich, ob das entsprechende Gerät die fragliche Eröffnung ebenfalls aktiv (sprich aus eigenem Antrieb) spielen würde (ein Lang-Programm wird wohl kaum riskante Gambitvarianten bevorzugen, mit denen ein Risc2500 im "Hinspiel" vielleicht ganz gut zurecht kam)

Ich könnte mir vorstellen, dass da so manches Programm benachteiligt sein könnte.

Andererseits muss ein Risc2500 aber auch mit den geschlossenen Varianten eines Lang-Programms zurechtkommen...:D

Gruß,
Robert

Sportsfreund

28.07.2011 21:22

AW: Bei welchen Programmen wirkt sich Tuning am effektivsten aus ?

Wenn man sich mal sich mal zwei Programme vorstellt, die jeweils 180000 Positionen in 3 Minuten berechnen, dann werden sie bei einer Verdoppelung der Geschwindigkeit 360000 Züge in 3 Minuten berechnen. Wenn man jetzt mal annimmt, daß die guten Züge stochastisch im Suchbaum verteilt sind (was nicht ganz stimmt, weil es Korrelationen gibt), dann würde die Ausgangsfrage implizieren, daß ein Programm (A) sich plötzlich nur noch die Rosinen herauspickt, während das andere Programm (B) genauso plötzlich nur noch Fettnäpfchen erwischt.

Wenn das so ist, dann müssen sich Programm A und B derart unterscheiden, daß mit zunehmender Rechentiefe die Effektivität der Algorithmen von Programm B gegenüber Programm A immer weiter abfällt. Das könnte zum Beispiel dadurch passieren, daß mit zunehmender Rechentiefe Algorithmen (Programmwissen) abgeschaltet werden, oder aber die Algorithmen an Effektivität verlieren.

An dieser Stelle liegt die Vermutung nahe, und wurde in der Praxis durch leistungsfähige Rechner bereits bestätigt, daß allzuviel "Programmwissen" mit zunehmender Rechenleistung eher störend ist. Effektive Algorithmen müssen schnell sein und sich der Stellung dynamisch anpassen (siehe Rybka).

Ein einfaches Beispiel ist die Regel, daß ein Läufer mehr Wert ist als ein Bauer. Ein starker Spieler wird aber, wenn der Läufer auf d3 steht und Schwarz kurz rochiert hat, mit dem Läufer auf h7 einschlagen. Ein sehr starker Spieler wird aber erkennen, daß das Läuferopfer manchmal auch in die berühmte Hose gehen kann. Wenn ein Programm allzuviel Wissen oder sonstige Restriktionen und starre algorithmische Strukturen vorgegeben bekommt, dann kann das im Nahbereich durchaus noch hilfreich sein, ist aber mit zunehmender Rechenleistung eher von Nachteil. Willi's Beobachtung, daß die Geräte von Frans Morsch sehr gut auf ein Tuning reagieren, bestätigt dieses Verhalten.

Viele Grüße,
Frank

EberlW

29.07.2011 16:50

AW: Bei welchen Programmen wirkt sich Tuning am effektivsten aus ?

Zitieren:

Zitat von Robert (Beitrag 38824)

Hallo Willi,

du meinst vermutlich mit getauschten Farben?

Nein Robert,

Du hast mein Anliegen gänzlich missverstanden. Es geht nicht um eine identische Eröffnung bei vertauschten Farben. Das hier nicht alle Bibis gleich sind, liegt ja auf der Hand.

Mir geht es darum, mit möglichst einfachen Mitteln zu überprüfen, ob eine Takterhöung wirklich zu besseren Spielergebnissen kommt. Deshalb -so stelle ich mir vor- sollte ein Gerät welches auf seine Verbesserung durch Tuning getestet werden soll, zunächst UNGETUNED einige Partien gegen diverse Gegner spielen.

Unter der Annahme, dass eine Wiederholung der einzelnen Partien -unter Berücksichtigung einer exakten Eröffnungswiederholung- zu einem identischen Endresultat und sogar zu identischen Partien zwischen den jeweiligen Gegnern führt (das dürfte in 99,9% aller Fälle zutreffen), bin ich der Meinung, dass bei eben einer solchen Wiederholung MIT GETUNTEM GERÄT der sich zwangsläufig ändernde Partieverlauf maßgeblich das Endresultat einer der jeweiligen Partien beeinflussen wird.

Daran sollte sich erkennen lassen, ob ein Gerät durch das Tuning wirklich nennenswerte Leistungssteigerungen erfährt.

Da üblicherweise einfach drauf losgespielt wird, ohne die Eröffnungen zu berücksichtigen, ist meiner Meinung nach nicht so ohne Weiteres festzustellen, ob eine Tuningmaßnahme zu einem bestimmten Matchresultat führte, oder die zufällige Eröffnungswahl. Da gerade die "Dickschiffe" sehr große Bücher haben und entsprechend viele Varianten auch aus dem Turnierbuch gespielt werden, kann so eine gefühlte Ewigkeit dauern, bis man Klarheit erhält. Nimmt man aber bereits gespielte Partien zwischen zwei definierten Geräten als Ausgangsbasis, tuned nun eines davon und wiederholt die Eröffnungen, dann kann man sich schon viel eher ein Bild machen, weil man den "Zufallsfaktor Bibi" damit erfolgreich ausschaltet - und zwar OHNE dass man versehentlich Eröffnungen wählt, die in der Praxis nie vorkämen, so wie es bei Eröffnungssuiten gerne mal passieren kann.

Nun verstanden, was ich meine? ;)

Gruß, Wilfried

Robert

29.07.2011 17:19

AW: Bei welchen Programmen wirkt sich Tuning am effektivsten aus ?

Zitieren:

Zitat von EberlW (Beitrag 38836)

Nun verstanden, was ich meine? ;)

jetzt ist mir alles klar! ;)

Gruß,
Robert

Paisano

30.07.2011 19:23

AW: Bei welchen Programmen wirkt sich Tuning am effektivsten aus ?

Hi Wilfried,

Zitieren:

Zitat von EberlW (Beitrag 38822)

Das Tuning bei Stellungstests immer etwas bringt, steht völlig ausser Frage, doch nur im praktischen Spiel zeigt sich die wahre Effektivität, die sich letztlich auch in praktisch erspielten Elos niederschlagen kann. Allerdings sehe ich hier den Haken an den (naturgemäß) regelmäßig verschiedenen Bedingungen wie eben der verschiedenen Gegner und Eröffnungen.

Will man das kompensieren, bleibt nur die Eröffnungswiederholung gegen denselben Gegner. Eröffnungssuiten wie sie bei PCs gerne hergenommen wurden sind irrelevant, weil sie nicht zwingend aus der Praxis der Geräte (bzw. deren Bibliotheken) stammen. Wenn aber beispielsweise der ungetunte Atlanta gegen die V11 zehn verschiedene Eröffnungen gespielt hat, dann sind diese Eröffnungen "praktisch relevant" und können bei gleicher Farbverteilung unter Verwendung des getunten Atlanta hergenommen werden mit dem Ziel festzustellen, ob durch die sich anschließend zwangsweise ändernde Partie die Erfolgsquote des Atlanta beeinflusst wird.

Dergleichen macht man auch im Vergleich zu anderen Gegnern und kann dann recht einfach sehen, ob das Tuning effektiv eine nennenswerte Wirkung zeigt oder nicht. Natürlich können auch vom ungetunten Atlanta siegreich weitergeführte Eröffnungen beim getunten Atlanta in die Hose gehen, aber so ist halt das Leben.

Ich kann nur sagen, dass ich hierin die "akademischste" Ergebnissquelle sehe (die wegen der 100% praktischen Nachvollziehbarkeit sogar in unsere Listen einfließen darf). Natürlich kann ich damit auf dem Holzweg sein und nur das "aka dämlichste" von mir gegeben haben - ich nehme ja jederzeit Lehre an und kann auch ansonsten mit anderen Meinungen leben. Es ist mir auch völlig klar, dass dieser Weg ziemlich trist erscheinen mag. Persönlich halte ich ihn für spannend... ;)

ok, Ziel erkannt:), aber der Weg ist mir zu lang;) und ich sehe die Problematik mit den Eröffnungen auch etwas gelassener. Wenn ein Gerät irgendwann zwei-, dreihundert oder mehr Partien absolviert hat, wird sich eine Eröffungswiederholung gegen denselben Gegner mehr oder weniger von selbst ergeben und Partien vom ungetunten Atlanta sind ja reichlich da, wozu also nochmal wiederholen...

Nehmen wir mal als Beispiel den Star Diamond, der bis jetzt 26 Partien gegen den ungetunten Atlanta gespielt hat und ich spiele jetzt auch 26 Partien gegen den SD mit dem getunten Atlanta, heraus kommt eine bestimmte Erfolgsquote, die der bisherigen gegenübergestellt werden kann. Da steckt zwar jetzt noch ein gewisser "Unsicherheitsfaktor" drin, weil die Eröffnungen mit Sicherheit nicht identisch waren, aber den nehm ich in Kauf
und schenke mir die Wiederholung der 26 Partien.

Aber versteh mich nicht falsch, wir unterhalten uns hier über eine Frage, auf die das Sprichwort "Viele (in diesem Fall aber nicht alle) Wege führen nach Rom" sehr gut passt:), so wie Deine akademische Lösung.

Zitieren:

Zitat von EberlW (Beitrag 38822)

Hast Du zufällig getunte 68020er Langs in petto? Da hat der Atlanta auch getuned einiges zu knabbern.

leider nicht...

Zitieren:

Zitat von EberlW (Beitrag 38822)

Ich würde ihm auch o.g. V11 auf den Hals hetzen und den R30, aber bei all' diesen "Dickschiffen" muss ich natürlich passen. Doch das haben andere Schachfreunde bereits getan, soweit ich weiss...

ja, hier war Micha schon fleissig. gegen die V11 hat der Atlanta recht ordentlich abgeschnitten. Gegen den Mach IV 25 MHz allerdings hat sich der Atlanta überraschend schwer getan,
3,5 - 1,5, wobei in dem Ergebnis zwei eher schmeichelhafte Siege des Atlanta stecken.

Zitieren:

Zitat von EberlW (Beitrag 38822)

Was ich mal machen kann ist, einen älteren Vergleich zwischen Atlanta und King 2.54 herauszukramen (habe derzeit keinen Zugriff auf die Festplatte ... heul!) und diesen dann mit dem getunten Atlanta wiederholen. Damals hat der Atlanta den Vergleich knapp verloren - könnte bei Wiederholung gut und gerne ausgeglichen enden.

mit Sicherheit interessant, zumal der Atlanta mit dem Risc 2500 "gut" zurecht kommt, aber da steckt ja eine ältere Version vom King dahinter.

Viele Grüße
Uwe

Alle Zeitangaben in WEZ +1. Es ist jetzt 23:47 Uhr.