Wiederholtes Gefangenendilemma

Das wiederholte Gefangenendilemma ist ein Begriff der Spieltheorie und impliziert ein über mehrere Runden gespieltes Gefangenendilemma.

Inhaltsverzeichnis

Begriffsgeschichte

Der Erfinder des Gefangenendilemmas (oder zumindest der „Geschichte“ zur Auszahlungstabelle) ist laut Straffin (1980) Albert W. Tucker, der Doktorvater von John Nash. Tucker konzipierte das Gefangenendilemma 1950 in einer Notiz eher als Anekdote für einen Vortrag. Erstmals veröffentlicht worden ist diese Notiz in Tucker (1980).^[1] Ursprünglich wurde hiermit die Situation zweier Personen beschrieben, die gemeinsam ein Verbrechen begangen haben, verhaftet worden sind und in getrennten Zellen gefangen gehalten werden.

Eigenschaft

Das Gefangenendilemma ist ein Modell für viele ökonomische Situationen, in denen individuell rationale Entscheidungen zu Situationen führen können, die manchmal gesellschaftlich nicht optimal sind. Dabei hat die Problematik des Betruges eine interessante Rolle. Der Betrug wird sich oft nicht lohnen, wenn Spiele mit denselben Teilnehmern mehr als einmal gespielt werden. Allerdings kann man ermitteln, dass sich bei unbekannt häufiger Wiederholung des Gefangenendilemma-Spiels im Laufe der Zeit die Kooperationslösung, also die Situation gemeinsamen Schweigens einstellen kann.^[2]

Situation

Bei der sogenannten Situation, wo zwei Gefangene verdächtig sind, haben sie keine Möglichkeit sich über ihr Vorgehen abzustimmen. Jeder der Gefangenen muss zwischen zwei Aktionen entscheiden: schweigen oder gestehen, in anderen Wörter: kooperieren oder nicht kooperieren. Für die mögliche Entwicklung dieses Spiels gibt es vier möglichen Zugkombinationen und deren Punktwerte, die folgende in einer Pay-off Matrix angegeben werden.^[3]

1) Wenn der Gefangene A auspackt, und somit der Gefangene B belastet, kommt A ohne Strafe davon und B muss fünf Jahre ins Gefängnis absitzen. Das heißt, entweder (0, -5) oder (-5, 0).

2) Wenn beide schweigen, hat der Richter genügend Indizienbeweise, um beiden Gefangenen für zwei Jahre einzusperren. Das heißt, (-2,-2).

3) Wenn beide gestehen, müssen sie vier Jahre ins Gefängnis verbringen. Das heißt, (-4,-4).

	B schweigt	B gesteht
A schweigt	(-2,-2)	(-5, 0)
A gesteht	( 0,-5)	(-4,-4)

Ein einzelner Spieler berechnet getrennt jede der Strategiekombinationen, die einnehmen können und entscheidet sich für diejenige, die für ihn den größten Gewinn bringt. Jeder der beiden Gefangenen will seinen Gewinn maximieren, das heißt, sie haben kein Interesse zu wissen, wie viel Punkte der Gegenspieler hat, sondern nur sein eigenes besseren Ergebnis. Für sie ist ein Geständnis die ideale Strategie: Wenn einer schweigt, ist es für den anderen günstiger zu gestehen. Wenn aber einer gesteht, ist der andere erst unklug, wenn er es nicht tut. Ganz egal, was der eine macht, den anderen wird es zum Geständnis zwängen und das gilt eben für beide. Wenn beide gestehen, bekommt jeder eine harte Strafe. Hier führt die egoistische Verfolgung des Eigeninteresses zu einem abfälligen Ergebnis. Wenn keiner gesteht, ist das Resultat für beide besser.^[4]. Das Problem ist, wie sich eine solche Kooperation erreichen lässt, wenn sie keine Chance haben, sich vorher einmal zu treffen und die Dinge durchzusprechen.

Der Grund für das Gefangenendilemma liegt nicht in mangelnder Kommunikation, sondern in der fehlenden Möglichkeit, bindende Verträge einzugehen: Selbst wenn die Beteiligten des Spiels sich gegenseitig verpflichtet hätten, kein festgelegte Entscheidung zu treffen, würden sie sich nicht daran halten.^[5]

Wenn für jede der möglichen Kombinationen die gleiche Strategie gewählt wird, wird diese Strategie als dominante Strategie genannt. Das Gleichgewicht einer dominanten Strategie tritt nur ein, wenn beide Spieler dieser Zugmöglichkeit folgen werden.^[6]

Abbildung 1: Gefangenendilemma. Extensive Form. Auszahlungen an (A,B)

Das Szenario in Abbildung 1 stellt die extensive Form von den Auszahlungen des statischen Gefangenendilemmas dar. Es zeigt hier, dass das Gefangenendilemma in seiner Grundversion als Stufenspiel ein eindeutiges Gleichgewicht hat.

Zweistufiges Spiel

Wenn das Gefangenendilemma zweimal hintereinander gespielt wird, wird diese Spielt $G^{2}$ genannt. Die Auszahlungen ergeben sich jeweils als Summe der Auszahlung aus dem Spiel der ersten Stufe und der Auszahlung aus dem Spiel der zweiten Stufe. Diese Überlegung ist in extensiver Form in Abbildung 2 dargestellt.

Abbildung 2: Zweistufiges Gefangenendilemma

G^{2}

. Extensive Form. Auszahlungen an (A,B)

Die Strategien für A müssen jeweils eine Aktion (von jeweils zwei verfügbaren) pro relevanter Entscheidungssituation spezifizieren. Insgesamt existieren für A fünf Möglichkeiten: Die Entscheidung im Wurzelknoten sowie Entscheidungen nach A:g, B:g, nach A:g, B:s, nach A:s, B:g und nach A:s, B:s. Die Aktionsmenge ist jeweils {s,g}, hat also zwei Elemente.

s=schweigen, g=gestehen.

Damit resultieren für A $2^{5}$ =32 Strategien im Spiel $G^{2}$ . Ähnliches gilt für die Strategien für B, die für B jeweils eine Aktion von B pro distinkter Informationsmenge spezifizieren müssen, also insgesamt fünf Aktionen. Damit gibt es auch für B 32 verschiedene Strategien.^[7]

Endlich oft wiederholtes Spiel

Dieses Gleichgewicht ändert sich wenn das Spiel in eine bekannte Anzahl von Runden wiederholt wird. Die gleiche Überlegung wie beim zweistufigen Gefangenendilemma gilt für jede endliche Wiederholung des Spiels, also für $G^{t}$ mit $T<\infty$ . In der letzten Stufe, in Stufe T wird in jedem Fall (gestehen,gestehen) also (g,g) gespielt. Da dies gewiss ist, können beide Spieler auch in Stufe T – 1 (g,g) spielen. Dies ist so sicher, das auch in Stufe T – 2 (g,g) das Aktionsprofil der Wahl ist.^[8].

In diesem Fall weiß jeder Spieler im Voraus welche Runde die letzte ist. In dieser letzten Runde versucht auf jeden Fall einer der Spieler seine dominante Strategie durchzusetzen, denn es gibt keine Möglichkeit zur Rachenahme durch den unterlegenen Spieler mehr. Wenn beide Spieler beliebig weit in die Zukunft und rational denken, werden sie in der letzten Runde nicht kooperieren, das heißt, sie werden defektieren. Diese letzte Zugkombination ist die einzige rationale Strategie bei einer bekannten Anzahl von Runden.

Das defektieren eines jeden Spiels ist das einzige Nash-Gleichgewicht, in der kein Spieler durch Veränderung seiner Strategie seines Ergebnisses erhöhen kann.^[9]

Zu einer Kooperation im Sinne beidseitigen „Schweigens“ wird es bei endlicher Wiederholung nicht kommen.^[10].

Unbestimmt oft wiederholtes Spiel

Wenn das Gefangenendilemma unendlich oft oder bestimmt oft wiederholt, kann es sinnvoll sein, zu kooperieren. Durch das Fehlen einer definitiv letzten Runde des Spiels ist eine Analyse mit Hilfe des Rückwärtsinduktion nicht mehr möglich. Für die Analyse soll folgende Annahme geben: In jeder Runde des wiederholten Spiels ist unsicher, ob eine weitere Runde folgen wird. Die Wahrscheinlichkeit, dass eine weitere Runde gäbe, betrage p. Entsprechend ist die Wahrscheinlichkeit nach der aktuelle Runde gleich $1-p$ . Folglich ist die Wahrscheinlichkeit, dass Runde Nummer t überhaupt erreicht wird, gleich $p^{t}$ .^[11].

Die dynamische Strategie fordert, so lange zu kooperieren, bis der Gegner defektiert, dann aber immer selbst zu defektieren. Falls beide Spieler diese Strategie folgen, wird keiner der beiden defektieren. Die Auszahlung beträgt für jeden der Spieler in jeder Runde also – 2. Die erwartete Auszahlung aus dem kompletten Spiel, $E[\pi (C{,}C)]$ , lautet:^[12].

E[\pi (C{,}C)]=-2+p\cdot (-2)+p^{2}\cdot (-2)+...

Wenn einer der Spieler ab Runde Nummer N defektiert, wird sein Gegner bis einschließlich Runde N kooperieren und danach defektieren. In den ersten (N-1) Runden erhält eine Auszahlung von -2 (beide kooperieren), in Runde N eine Auszahlung von 0 (Er defektiert, der Gegner kooperiert) und in allen restlichen Runden eine Auszahlung von -4 (beide defektieren). Die erwartete Auszahlung über alle Runden, $E[\pi (D_{\text{N}}{,}{\text{dynamische Strategie}})]$ , lautet:^[13].

E[\pi (D_{\text{N}}{,}{\text{dynamische Strategie}})]=-2+p\cdot (-2)+p^{2}\cdot (-2)+...+p^{N-1}\cdot (-2)+p^{N}\cdot (0)+p^{N+1}\cdot (-4)+p^{N+2}\cdot (-4)+...

Einflussfaktoren

Die strategischen Möglichkeiten ändern sich stark, wenn das Gefangenendilemma wiederholt zwischen denselben Spielern gespielt wird. Allerdings hängt es von verschiedenen Einflussfaktoren ab, ob diese Spieler zu einer Kooperation gelangen können oder nicht.^[14] Die Einflussfaktoren können sowohl die Kommunikation zwischen den Spielern, als auch Informationen über ihre gewählten Entscheidungen sein.

Beispiel

Im wiederholten Gefangenendilemma-Spiel mit vier Personen von Sell und Wilson (1991) besteht anonyme Kommunikation aus Informationen über die vergangene Kooperationsbereitschaft der Individuen. Dabei werden die anderen Gruppenmitglieder nicht identifiziert, sondern die Experimentatoren informieren nur über die Strategien, welche von den anderen Akteuren in früheren Spielen gewählt wurden. Die individuelle Kooperationsbereitschaft ist in diese Experiment im Durchschnitt aller zehn Runden signifikant höher, wenn die Individuen vollkommen über das Verhalten der anderen informiert sind. Die Ergebnisse von diese Autoren unterstützen den Gesprächeffekt: Individuen kooperieren mehr, wenn sie ihre Verhaltenserwartungen mittels Informationen über die anderen Mitspieler spezifizieren können.^[15]

Wiederholte Gefangenendilemma-Spiele mit wiederholten Kommunikationsmöglichkeiten ergeben sich häufig noch höhere Kooperationsquoten als einmalige Kommunikationsspiele gemäß experimenteller Studien von Sally (1995).^[16]

Anwendungen

Die Eigenschaften des Gefangenendilemmas sind für eine ganze Reihe von ökonomischen Entscheidungssituationen charakteristisch. Die Struktur dieses Spiels lässt sich durch geeignete Interpretation von Strategienmenge und Auszahlungsmatrix auf sehr unterschiedliche Fragestellungen übertragen. Mann kann das kurz an einigen folgenden Anwendungen verdeutlichen.^[17]

Kartellabsprachen in einem Dyopol

Zwei Produzenten (C und D) treffen sich an einem Ort, um über die Bildung eines Kartells zu beraten. Bisher haben beide nur einen Gewinn von 10 erzielt. Sie wissen, dass jeder einen Gewinn in Höhe von 50 erzielen könnte, wenn sie durch eine Kartellabsprache die Produktion stark einschränken könnten. Es gibt eine besondere Situation: Wenn eine der Konkurrenten sich an die Vereinbarung hält, kann der Gewinn der andere steigern, indem er mehr als vereinbart produziert. Der Gewinn betrügt dann sogar 100, während der andere Konkurrent gar keinen Gewinn erzielt und auch umgekehrt.^[18]

Die folgende Auszahlungsmatrix zeigt, dass hier die typische Situation des Gefangenendilemmas vorliegt. Die Absprache nicht einzuhalten, ist für jeden Produzenten die strikt dominante Strategie.^[19]

	D Absprache einhalten	D Absprache brechen
C Absprache einhalten	(50,50)	(0,100)
C Absprache brechen	(100,0)	(10,10)

Er scheint intuitiv evident, dass sich Konkurrenten in einem Spiel, zu einem Kartell zusammenschließen werden, um langfristige Vorteile aus einer Kooperation zu sichern, wenn diese die kurzfristigen Vorteile durch Nichtkooperation übersteigen. Überraschenderweise kommt aber eine spieltheoretische Analyse gerade zu dem gegensätzlichen Schluss: selbst bei beliebig langer, endlicher Widerholung des Kartellspiels werden Konkurrenten eine Kartellvereinbarung von Anfang niemals einhalten. Das einzige Gleichgewicht bei gegebener Endperiode T besteht darin, dass alle Spieler ihre nicht-kooperative Strategie verfolgen.^[20]

Marktentrittspiel

Ähnliche Ergebnisse erhält man, wenn das Markteintrittspiel endlich oft wiederholt wird. Ein potentieller Konkurrent wird in der letzten Periode auf jeden Fall in den Markt eintreten, weil dann eine Abschreckung in der Zukunft nicht mehr möglich ist. Aufgrund der Rückwärtsinduktion kann bereits in der Anfangsperiode ein Markteintritt nicht verhindert werden.^[21]

Nukleare Abrüstung

Viele Menschen, Unternehmen und Ländern sind von diesem wiederholten Gefangenendilemma getroffen worden. Ein Beispiel hierfür bietet die nukleare Abrüstung. Jeder Supermacht wäre es natürlich am liebsten, wenn die andere Seite entwaffnet wäre, sie selbst dagegen ihr Arsenal behielte. Selbst aufzurüsten, während die andere Seite ihre Waffe behält, wäre die schlimmste Entscheidung. Jede Beteiligte wird daher am liebsten ihre Waffen behalten wollen, ganz gleich was der andere tut. Das Problem ist die beiderseitige Abhängigkeit der Entscheidungen: die gemeinsam bevorzugte Variante kommt nur zustande, wenn jede Beteiligte für sich genommen ihre schlechtere Strategie wählt.^[22]. Die Frage ist, ob die beiden wechselseitig genügend Glaubwürdigkeit verschaffen können, wenn jede Seite den Anreiz hat, sich heimlich zu bewaffnen.

Tarifverhandlung

Die Geschichte von Gefangenendilemma präzisiert auch einen allgemeinen Punkt: die meisten ökonomischen, politischen oder sozialen Spielen unterscheiden sich von Spielen wie Fußball oder Poker, wo der Gewinn des einen, Verlust für den anderen bedeutet. Das Gefangenendilemma beinhaltet aber sowohl Möglichkeiten zum beiderseitigen Vorteil als auch Interessenkonflikte. Zum Beispiel besteht bei Tarifverhandlungen zwischen Arbeitgebern und Arbeitnehmern ein vergleichbarer Interessenkonflikt insofern, als die eine Seite lieber niedrige Löhne hätte, die andere lieber hohe. Wenn ein Abbruch der Verhandlungen gäbe, der zum Streik führt, wäre für beide Seiten noch schlimmer. Man sollte in der Realität, in der Lage sein, eine vernünftige Mischung von Interessenkonflikt und Interessenharmonie zu berücksichtigen.^[23]

Einzelnachweise

↑ Vgl. Thomas Riechmann (2008): Spieltheorie, S. 42.
↑ Vgl. Thomas Riechmann (2008): Spieltheorie, S. 44.
↑ Vgl.Universität Osnabrueck: „Gefangenendilemma“-Situation.
↑ Vgl.Avinash K. Dixit, Barry J. Nalebuff: Spieltheorie für Einsteiger, S. 91.
↑ Vgl. M. Holler, G. Illing (2006): Einführung in die Spieltheorie, S. 20.
↑ Vgl.Universität Osnabrueck: „Dominante Strategien“.
↑ Vgl. Thomas Riechmann (2008): Spieltheorie, S. 143.
↑ Vgl. Thomas Riechmann (2008): Spieltheorie, S. 143 ff.
↑ Uwe Nowak Webseite: „Einführung in die Spieltheorie“.
↑ Thomas Riechmann (2008): Spieltheorie, S. 146.
↑ Vgl. Thomas Riechmann (2008): Spieltheorie, S. 146.
↑ Vgl. Thomas Riechmann (2008): Spieltheorie, S. 147.
↑ Vgl. Thomas Riechmann (2008): Spieltheorie, S. 147.
↑ Vgl. Professor Rieck's Spieltheorie-Seite: „Gefangenendilemma“.
↑ Vgl. I. Bohnet (1997): Kooperation und Kommunikation: Eine ökonomische Analyse individueller Entscheidungen, S. 73.
↑ Vgl. I. Bohnet (1997): Kooperation und Kommunikation: Eine ökonomische Analyse individueller Entscheidungen, S. 135.
↑ Vgl. M. Holler, G. Illing (2006): Einführung in die Spieltheorie, S. 7.
↑ Vgl. M. Holler, G. Illing (2006): Einführung in die Spieltheorie, S. 7ff.
↑ Vgl. M. Holler, G. Illing (2006): Einführung in die Spieltheorie, S. 7.
↑ Vgl. M. Holler, G. Illing (2006): Einführung in die Spieltheorie, S. 21.
↑ Vgl. M. Holler, G. Illing (2006): Einführung in die Spieltheorie, S. 22.
↑ Vgl.Avinash K. Dixit, Barry J. Nalebuff: Spieltheorie für Einsteiger, S. 17.
↑ Vgl.Avinash K. Dixit, Barry J. Nalebuff: Spieltheorie für Einsteiger, S. 17-18.

Literatur

Avinash K. Dixit / Barry J. Nalebuff: Spieltheorie für Einsteiger – Strategisches Know-how für Gewinner, Schäffer-Poeschel-Verlag, Stuttgart 1997, ISBN 3-7910-1239-8.
Bohnet, Iris (Hrsg.): Kooperation und Kommunikation: Eine ökonomische Analyse individueller Entscheidungen, Mohr Verlag, 1997, ISBN 3-16-146053-7, 198 Seiten.
Holler, Manfred J., Illing, Gerhard (Hrsg.): Einführung in die Spieltheorie, Springer Verlag, 2006, ISBN 978-3-540-27880-1, 429 Seiten.
Thomas Riechmann: Spieltheorie, 2. Auflage. Verlag Franz Vahlen, München 2008, ISBN 978-3-8006-3505-4.

Weblinks

[1] Vgl. Thomas Riechmann (2008): Spieltheorie, S. 42.

[2] Vgl. Thomas Riechmann (2008): Spieltheorie, S. 44.

[3] Vgl.Universität Osnabrueck: „Gefangenendilemma“-Situation.

[4] Vgl.Avinash K. Dixit, Barry J. Nalebuff: Spieltheorie für Einsteiger, S. 91.

[5] Vgl. M. Holler, G. Illing (2006): Einführung in die Spieltheorie, S. 20.

[6] Vgl.Universität Osnabrueck: „Dominante Strategien“.

[7] Vgl. Thomas Riechmann (2008): Spieltheorie, S. 143.

[8] Vgl. Thomas Riechmann (2008): Spieltheorie, S. 143 ff.

[9] Uwe Nowak Webseite: „Einführung in die Spieltheorie“.

[10] Thomas Riechmann (2008): Spieltheorie, S. 146.

[11] Vgl. Thomas Riechmann (2008): Spieltheorie, S. 146.

[12] Vgl. Thomas Riechmann (2008): Spieltheorie, S. 147.

[13] Vgl. Thomas Riechmann (2008): Spieltheorie, S. 147.

[14] Vgl. Professor Rieck's Spieltheorie-Seite: „Gefangenendilemma“.

[15] Vgl. I. Bohnet (1997): Kooperation und Kommunikation: Eine ökonomische Analyse individueller Entscheidungen, S. 73.

[16] Vgl. I. Bohnet (1997): Kooperation und Kommunikation: Eine ökonomische Analyse individueller Entscheidungen, S. 135.

[17] Vgl. M. Holler, G. Illing (2006): Einführung in die Spieltheorie, S. 7.

[18] Vgl. M. Holler, G. Illing (2006): Einführung in die Spieltheorie, S. 7ff.

[19] Vgl. M. Holler, G. Illing (2006): Einführung in die Spieltheorie, S. 7.

[20] Vgl. M. Holler, G. Illing (2006): Einführung in die Spieltheorie, S. 21.

[21] Vgl. M. Holler, G. Illing (2006): Einführung in die Spieltheorie, S. 22.

[22] Vgl.Avinash K. Dixit, Barry J. Nalebuff: Spieltheorie für Einsteiger, S. 17.

[23] Vgl.Avinash K. Dixit, Barry J. Nalebuff: Spieltheorie für Einsteiger, S. 17-18.

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[10]

[11]

[12]

[13]

[14]

[15]

[16]

[17]

[18]

[19]

[20]

[21]

[22]

[23]