Einzelnen Beitrag anzeigen
  #436  
Alt 11.05.2018, 23:49
Hartmut Hartmut ist offline
Lebende Foren Legende
 
Registriert seit: 01.04.2010
Ort: Nürnberg
Alter: 60
Land:
Beiträge: 2.174
Abgegebene Danke: 3.225
Erhielt 1.544 Danke für 898 Beiträge
Aktivitäten Langlebigkeit
3/20 14/20
Heute Beiträge
0/3 sssss2174
AW: Selbstlernende KI: Neue Engine spielt auf Profi-Niveau

 Zitat von applechess Beitrag anzeigen
Wir haben bei Alpha Zero nur gerade 10 Partien gesehen. Vielleicht - oder gar wahrscheinlicher - hätte man unter den restlichen 90 Partien auch Schwächen entdeckt, die uns in Erstaunen gesetzt hätten wie klar verpatzte Gewinnstellungen oder durch Stockfish nicht ausgenutzte Gewinnstellungen. Wir sind also schlicht nicht in der Lage, das Können von Alpha Zero richtig einzuschätzen. Betrachten wir nur die 10 besten je von LCZero gespielten Partien, dann sind wir ja auch bass erstaunt ob der gezeigten Leistung.
Gruss
Kurt
Zudem darf man nicht vergessen, dass bei den 4 Stunden von Alpha Zero ja eine enorme Rechenleistung der Spezialprozessoren dahintersteckte. Selbst mit der Hilfe der Internetcommunity sind die 4 Stunden von AlphaZero hier auf mehrere Monate verteilt. Um genau zu sein, was AlphaZero in einer Minute gemacht hat, dauert hier trotz aller Unterstützung der Internet-Community im Schnitt einen ganzen Tag.

Vielleicht schwenke ich mal um und gebe ein wenig Mathematiknachhilfe. Sprich wir schauen uns das ganze mal rein rechnerisch an.

Alpha Zero hat in 4 Stunden 44 Millionen Partien gespielt, also 11 Millionen pro Stunde. Das entspricht etwa 183333 Partien pro Minute oder 3056 Partien pro Sekunde!!!

LeelaZero hatte ihren höchsten Elo Punkt bei Network ID 253 nach 11.500.787 Partien.

Nach dem gewaltigen Abfall der ELO hatte sie ihren tiefsten Stand bei ID 276 nach 12.412.740 Partien. Danach wieder ein gewaltiger Anstieg.

Ich weiss jetzt nicht, ob es wirklich ein Bug im Programm ist. Aber wenn ich das mal genau betrachte umfasst dieser Elo-Absturz einen Partienanzahl von 911.953 Partien.

Bei der Geschwindigkeit mit der AlphaZero die Partien gespielt hat wäre das der gewaltige Zeitraum von 298 Sekunden, also nicht mal 5 Minuten. Und ob es bei den 4 Stunden Training über einen Zeitraum von 5 Minuten mal einen Absturz der Elo gegeben hat wissen wir nicht. Es wäre aber durchaus denkbar. Der Unterschied ist nur: Die AlphaZero-Entwickler wären erstmal rausgegangen, hätten sich nen Kaffee geholt und eine geraucht und nach 15-20 Minuten mal wieder nachgeschaut, bevor sie über einen Bug auch nur nachgedacht hätten. Zum Vergleich, das entspräche bei Leela dem Zeitraum von 2-3 Wochen.

Wir sehen diesen Absturz doch nur weil diese 5 Minuten sich bei uns über 5 Tage ziehen (Network 253 erstellt am 6. Mai 2018 07:21:22, Network 276 erstellt am 11. Mai 2018 06:09:27) und weder Lust haben 3 Wochen lang Kaffeerausch auszuhalten oder 3 Wocen Kette zu rauchen.

Bei AlphaZero wäre die Dauer dieses Absturzes noch nicht mal der Zeitraum, den die Betreuer der Anlage brauchten um in der Kantine eine Tasse Kaffee zu trinken und sie hätten daher den Ansturz allenfalls zwischen 2 solchen Kantinengängen in einem Logfile registriert, während wir hier über Tage hinweg wie die erschrockenen Hühner dasitzen und Bugs suchen die wir hier zwar vermuten, die aber vielleicht gar nicht existieren. Wie gesagt, wir merken es nur, weil 1 AlphaZero-Minute einem Leela-Tag entspricht. Wir haben dann aber wieder Momente, wo der Elo-Graph wieder fast genauso stark ansteigt, wie er vorher abgestiegen ist.

Wir hatten einmal einen gewaltigen Anstieg zwischen ID 226 und 227, danach waren die Änderungen eher in geringerem Umfang und beständig nach oben (wenngleich es immer mal kleine Abstürze gab, z.B. zwischen 234 und 236). Nun haben wir eben mal den umgekehrten Fall und auch einen sehr "nervösen" Graphen zwischen ID 274 und 278, aber auch das sind Fluktuationen, die bei AlphaZero nur wenige Sekunden ausgemacht hätten, vergleichbar mit der kurzzeitigen Erhöhung der Herzfrequenz wenn jemand hinter der Tür vorspringt und "Buuuuh" schreit. Aber genauso wie der Herzschlag sich wieder beruhigen wird, wird das auch der Elo-Graph von Leela tun und auch irgendwann wieder nach oben wandern. Und sollte es wirklich ein Bug sein, wird man ihn finden und ggf. 10 AlphaZero-Minuten (also vielleicht 10 Tage) länger fürs Training brauchen. Davon geht die Neuronale Welt mit Sicherheit nicht unter.

Es ist schon komisch. Als Leela den gewaltigen Sprung nach oben zwischen ID 226 und 227 gemacht hat, hat auch keiner nach einem Bug gerufen. Nun geht es halt mal ein paar AlphaZero-Minuten lang nach unten und alle sind nahe am Herzinfarkt... Ganz echt... wenn man das mal relativ zu den wenigen Minuten betrachtet, die dieser Zeitraum von wenigen Tagen bei AlphaZero umfasst, könnt ich mich wegen der Aufregung vor lauter Lachen fast nass machen...
__________________
Mein Profil beim ICCF (International Correspondence Chess Federation)
https://www.iccf.com/player?id=89948&tab=3

Geändert von Hartmut (12.05.2018 um 00:26 Uhr)
Mit Zitat antworten
Folgende 4 Benutzer sagen Danke zu Hartmut für den nützlichen Beitrag:
applechess (12.05.2018), Egbert (12.05.2018), RetroComp (12.05.2018), Theo (12.05.2018)