spielbar.com

Arbeitslos und KI dabei

Neulich hatte ich mir wieder Matrix angeschaut, weil das auch irgendwie regelmäßig sein muss. Gute Filme kann man immer wieder genießen und muss nicht immer den neusten Kram im Kino anschauen, oder? Wobei sich neue Filme und alte Filme ja nicht widersprechen müssen. Egal. Eigentlich wollte ich ja auf was anders ansprechen. Im Film geht es um die KI, die alles unterjocht. Warum Filme mit einer Menschheitunterdrückender KI immer spannender sind, als welche mit einer unterstützenden KI ist so eine Frage die auch 2001 oder Terminator nicht so richtig beantworten können. Aber all diese Fantasien spielen in naher Zukunft, da dort der Zuschauer noch mitgenommen werden kann. In Ferner Zukunft wie bei das fünfte Element wirkt das ja doch eher unrealistisch. Und wenn der Film noch so grün ist.

Aber wie realistisch ist eine KI im Brettspielbereich? Es gibt etliche Apps die sind sehr gut auf ihre KI programmiert. Manches Spiel lässt sich gut mathematisch zerlegen und die KI kann entsprechend angepasst gute Spielzüge machen. Einige Apps haben fast schon unschlagbare KIs und andere haben das nicht zu Ende gedacht und haben nur locker easy schlagbare KIs eingebaut. Aber das ist ein gut untersuchtes Gebiet. Ich hatte in meiner Studienzeit auch ein Semester lang KI belegt und da ging es immer erstmal nur um klassische Spiele: Mühle, Dame, Schach, etc… Die Klassiker zerlegt und analysiert. Alles kein Ding und lässt sich auch wunderbar auf moderne Spiele anwenden.

Aber was wäre wenn eine KI ein eigenes Spiel entwerfen sollte?

Es gibt ein spannendes Projekt, welches mir vermittelt wie weit wir damit sind: RoboRosewater. Der Name leitet sich von Mark Rosewater ab. Er ist der Head-Designer für Magic The Gathering. Er entwickelt rund 10000 Karten im Jahr und etwa 200 davon werden dann auch veröffentlicht. Er leitet ein größeres Team und die bringen vier Sets und noch ein paar Spezialprodukte jedes Jahr raus. Ein weiteres ebenso großes Team geht über die Karten und achtet darauf, dass die Ideen auch ausbalanciert sind und das Spielen damit auch am Ende noch Spaß macht. Da ist eine Menge Arbeit, es sind eine Menge Leute und es ergibt ein großes Ergebnis, welches sich, gemessen an den steigenden Umsatzzahlen jedes Jahr, wohl auch lohnt.

Mark Rosewater ist aber auch eine Art Aushängeschild. Er hat ein großes Mitteilungsbedürfnis und kümmert sich daher neben seiner Arbeit um einen Podcast, den er im Auto auf dem Weg zur Arbeit aufnimmt, er beantworte etliche Hundert Fragen täglich auf Tumblr, er macht eine täglichen Comic, den er per Twitter rumschickt, und noch so einiges mehr. In seinen wöchentlichen Design-Artikeln pflegt er ab und zu noch ein alter Ego namens Evil MaRo (die ersten beiden Buchstaben des Vor und Nachnamens). Eine künstliche Intelligenz nach ihm zu benennen macht also ordentlich Sinn, wenn es um Magic-Karten geht. Denn RoboRosewater versucht selbst Magic-Karten zu designen.

Dabei ist der Prozess noch sehr im Anfang gerade. Der Entwickler hat alle Magic-Karten die es gibt in die Datenbank geworfen und hat dem Programm gesagt das er durch zusammensetzen selber daraus Karten entwickeln soll. Etwa jede zehnte Karte dabei ist ordentlich oder stark. Ein weiteres zehntel ist ok oder schwach. Die verbleibenden 80% sind aber kompletter Schwachsinn, der nicht etwa schwach ist, sondern technisch keinen Sinn macht. Ich weiß nicht wie viel der Programmierer von dem ausgeworfenen selber aussortiert, aber die Karten sind zum Teil echt unter aller Kanone. Eine Karte mit Aktivierungskosten von zwei mal tappen, eine Karte die Spieler in den Friedhof mischt, oder auch einfach nur Sätze die selbst mit bestem Willen keinen Sinn ergeben sind da nicht selten.

Doch das macht Spaß das zu lesen. Als jemand der fünf Jahre lang offiziell Karten getestet hat, 10 Jahre Lang Turniere veranstalte und als Level 3 Schiedsrichter viele Regelfragen beantworten musste, kann ich die Qualität des Outputs vielleicht auch eher nachvollziehen. Ich weiß nicht in wie weit sich der Prozess verbessern lassen könnte, um die Qualität der Karten zu steigern und das Ergebnis dabei mit weniger unsinnigen Karten zu füllen, welche aber durchaus ihren Unterhaltungswert haben. Zum Teil entwickelt RoboRosewater ja auch eigene Schlüsselbegriffe, aber die sind alle lausig. In meinen Augen ist da bestimmt noch was drin. Aber selbst dann wird das so schnell kein ganzes Set ausspucken können, da ein übergeordnetes Thema fehlt. Und für den Unterhaltungswert alleine würde ich da auch nichts ändern wollen.

Wie groß ist die Chance, dass einmal eine KI ein ganzes Brettspiel selber entwickelt? Derzeit bestimmt nur sehr gering. So kann diese doch nur aus den bekannten Brettspielen Elemente nehmen und diese dann verbinden. Das dabei was cooles rauskommt ist bestimmt mehr Arbeit durch die Ergebnisse zu gehen als gleich was selber zu entwickeln. Das aber etwas neues rauskommt, wenn eine KI das versucht, werde ich wohl nicht mehr erleben. Will ich das denn eigentlich überhaupt? Zum Glück werden die wenigsten Autoren reich, und selbst die, die davon leben können, sind keine Millionäre. Es wird auf kurz oder lang auch keiner die Energie in solche eine KI stecken werden, denn der Output wäre nicht gewinnbringend. Aber als Belustigung wie RoboRosewater finde ich die klasse.

Und doch bin ich Neugierig. Vielleicht baut ja jemand so etwas mal für Brettspiele.

Matthias Nagy

7 Kommentare

  • 10000 Karten im Jahr? Wenn er 365 Tage im Jahr 24 Stunden Karten “entwickelt”, benötigt er 54 Minuten pro Karte – im Schnitt. Also realistisch 15-20 Minuten. Wenn er *nichts anderes* tut wohlgemerkt. Kann man da noch von “entwickeln” sprechen? Oder ist es nicht eher ein rausrotzen? Oder da ist ne 0 zuviel (vermutlich)

  • @Peer: Ich glaube nicht, dass das Yavalath durch einen Computer entworfen wurde, allenfalls mit Hilfe eines Computers. Aber mit Hilfe eines Computers wird viel gemacht, Stupides und Kreatives.

    Irgendein Mensch (oder zumindest ein Affe, dem ohne seine Fotokamera langweilig war), muss den Wunsch gehabt haben, ein Spiel zu entwickeln und den Computer mit irgendeinem Input gefüttert haben: Regeln, Material, Bewertungsmaßstäbe. Das Ergebnis ist nicht besonders innvoativ: Hexfeld + 4 oder mehr in einer Reihe gewinnt + 3 in einer Reihe verliert.

    Ob und wie sehr das Spiel wem Spaß macht, kann der Computer nur beurteilen, wenn ihm auch dafür vom Menschen eine Bewertungsroutine eingegeben wird. Das mag theoretisch möglich sein, ich glaube aber eher, dass der Computer ein formal funktionierendes Spiel ausgerechnet hat (es gibt einen Sieger, keine Unendlichschleife, unterschiedliche Stellungen, die sich beurteilen lassen). Persönliches, Individuelles ist erst gegeben, wenn sehr persönliche Bewertungskriterien eingegeben werden: Spielzug-Ästhetik, Spannungskurve, Spielgefühl, ….

    Interessant ist, dass man Karten testen kann, der Autor aber niemanden ernst nnimmt, der ein veröffentlichtes Spiel testet (https://www.spielbar.com/wordpress/2015/12/20/15735 ). Die ‘Objektivität’, die es in der Entwicklungsphase geben soll, wenn von Kartenqualität die rede ist, soll nicht mehr gegeben sein, wenn das Werk veröffentlicht ist? Dann entzieht es sich qualitativen Tests?

    Interessant hierbei find eich auch, dass ein großes Team ‘Ideen ausbalanciert’, nicht etwas Regeln, Spielmechanismen, …

    Matthias, die Themen, die du anschneidest, sind interessant und bieten Diskussionsansätze, aber inhaltlich finde ich beide Artikel wirklich sehr unausgegoren.

  • Es gibt übrigens auch gedicht-Generatoren, z.B. auf
    http://www.poetron-zone.de/poetron.php

    Hab da mal folgendes eingegeben:
    Person: Spieleautor Substantiv: Idee Verb: entwickeln Adjektiv: genial

    Heraus kam innerhalb einer Sekunde:

    Das Entwickeln der Ideen

    Ideen wollen säuseln.
    Sie säuseln genial und kurz.
    Sie säuseln deutlich und antiquiert.

    Spieleautor, genial bist auch du!
    Genial und kurz.

    Ach was wohl säuseln, was entwickeln?
    Die Schösser!?
    Säuselnde Ideen!
    Genial säuseln die Ideen,
    genial und antiquiert.

    Gedicht Nummer 8679096

  • Soweit ich weiß wurde ein Algorythmus entworfen, mit dem der Computer selbstständig abstrakte Zweipersonenspiele nach Mechanismen untersucht, daraus einige auswählt, neu kombiniert und das ganze auf einfache Strategien (wie spiegeln etc.) prüft.
    Es ist richtig, dass keine KI das selbstständig geschrieben hat, sondern es war ein Programmierer am Werk, der das ganze geschrieben hat und so zum einen den Impuls gab als auch den Algorythmus entworfen hat. Ist er nun der Autor oder der Computer? Immerhin war das Ergebnis durch den Programmierer nicht vorherzusehen.

    Diese Frage hat sogar einen imho interessanten Hintergrund: Genau dieselbe Frage stellt sich bei mathematischen Beweisen übrigens auch. Gerade bei dem Beweis zur Vierfarbtheorie durch Haken/Appel wurde über die Frage lange gestritten. Auch hat ein ähnliches Programm einige mathematische Beweise beträchtlich verkürzt.

    Was die Qualität des Spieles betrifft: Das Spiel hat einen erstaunlich guten Ruf, immerhin mit einer 7,1 – Wertung bei BGG und es ist tatsächlich auch veröffentliucht (durch nestorgames). Damit ist es vermutlich ein Stückweit besser als das Gedicht :-)

  • Ein Spiel kann ‘qualitativ gut’ sein, ohne dabei originell zu sein. Beides sollte man nicht durcheinanderbringen. Gerade wenn es einen Algorithmus gibt, nach dem entschieden wird, dass es möglichst vielen Menschen gefällt, ist das Ergebnis nicht individuell, sondern von geringer Schöpfungshöhe. Es verdeutlicht das Problem, das ich im Rahmen der ‘Test’-Diskussion stark vereinfachend ‘Professionalität reduziert Individualität’ genannt habe.

    Das Programm wird sicherlich nicht selbständig Spielanleitungen gelesen haben, sondern mit einzelnen Mechanismen gefüttert worden sein, die Bestandteile der Regelwerke sind. Zumindest müssen die Regelwerke in computerlesbare Regeln zerstückelt werden. Hier findet zunächst eine Vorauswahl der Spiele statt. Ich behaupte mal Dixit war nicht dabei.

    Es wird sicherlich viele Ergebnisse gegeben haben, die funktionieren. Hieraus die auszuwählen, die marktfähig sind, lässt sich möglicherweise auch durch einen Computer erledigen (Spielzeit, Berechenbarkeit von x Zügen im Voraus, …). Ein Spiel auszuwählen, das dem individuellen Geschmack entspricht, bedarf aber individueller Kriterien. Diese müssen dem Programm vorgegeben werden. Und dann stellt sich noch die Frage: Wieviele Spiele sind dabei insgesamt herausgekommen? Welche wurden von einem menschlichem Bewerter verworfen; warum ist eines übrig geblieben?

    Wenn du an einem abstrakten Taktikspiel arbeitest, hast du doch auch oft mehrere Möglichkeiten, reduzierst die nach Brauchbarkeit und Geschmack. Die Behauptung, das Computerprogramm habe alles allein entschieden, steht im Raum, wie das geschehen sein soll, ist aber nicht konkret beschrieben.

  • Kurz zwei Punkte: Ja, Dixit war nicht dabei – es waren nur abstrakte Zweipersonenspiele (wie ich auch geschrieben habe). Welche es waren, weiß ich nicht.
    Auch weiß ich nicht, wie das Programm ausgewählt hat. Dazu steht leider nichts im Netz – zumindest habe ich nix gefunden. Der Autor hat das Programm im Rahmen seiner Doktorarbeit entwickelt, für genauere Analysen wird man die wohlk lesen müssen. Ist aber nicht mein Fachgebiet, also bezweifle ich, dass ich da viel verstehen werde ;-)

    Noch eine weitere Anmerkung (jetzt nicht auf deine Beiträge bezogen) um einem Missverständnis vorzubeugen: Ein Algorythmus heißt tatsächich nicht, dass der Programmierer schon annähernd weiß, was rauskommt. Es gibt z.B. ein ganzes Fachgebiet, dass sich mit “Ertdbeerfeldtheorie” beschäftigt. Im Wesentlichen geht darum: Man nimmt ein gemustertes Feld, z.B. ein Schachbrett. Nun gibt man ein einfaches Programm für eine “Ameise” vor, die über das Brett läuft, vor, z.B.:
    1.) Wenn von schwarzen Feld auf weißes Feld: Nichts passiert, gehe gerade aus.
    2.) Wenn von weißen Feld auf schwarzes Feld: Färbe das schwarze Feld weiß ein und drehe dich um 90° nach links bevor du weiterläufst
    3.) Wenn von weiß auf weiß: Färbe das zweite Feld schwarz ein und drehe dich 90° nach rechts bevor du weiterläufst
    4.) Wenn von schwarz auf schwarz: Nichts passiert, laufe geradeazs weiter.

    Der Witz ist: Ohne das konkret auszuprobieren, kann man nicht vorhersagen, wo die Ameise nach x Zügen ist und dasselbe gilt auch für Muster. Und da sind noch nicht einmal Zufallsprozesse am Werk.
    Entsprechendes gilt -vermute ich – für das Programm, das Yavalath hervorgehbracht hat, wobei ich da noch Zufallsprozesse vermute. Etwa: Wähle zwei regeln zufällig aus, Kombiniere die, Probiere ob sie sich wiedersprechend etc.
    Auch gibt es eine Reihe Programme, die versuchen Gemeinsamkeiten von Texten oder Bildern zu finden. Das ist nicht immer was man erwatet. Ich kenne eine Geschichte (ob wahr oder nicht weiß ich nicht) von einem Programm, dem Bilder mit Panzern und ohne Panzern gefüttert wurde. Ziel war ein programm,. dass auch getarnte Panzer auf Fotos finden konnte. Hat nicht ganz geklappt, denn das Programm hat als Gemeinsamkeit der “Treffer”-Bilder gefunden: Die Sionne scheint nicht.

    Ich will damit nur sagen: Der Programmier hat sich sicherlich eine schwere Aufgabe gestellt und anscheinend gut gelöst. Wie viel Entscheidungen er jenseits der Anfangsparameter (abstraktes Zweipersonenspiel, nicht trivial lösbar) gefällt hat, lässt sich aber von hier wirklich nicht sagen.
    Das hat natürlich durchaus interessante Auswirkungen auf den Begriff “Schöpfungshöhe”. Und wenn Originalität natürlich etwas anderes ist als Spielspaß, so haben originelle Spiele vermutlich eher eine ausreichende Schöpfungshöhe als Nicht-originelle :-)