Was das Modell des Gefangenendilemmas über Kooperation bei Fragen des Klimawandels lehrt

 

Abstract

Der Klimawandel stellt eine der großen Herausforderungen der Menschheit dar. Gleichzeitig ist er jedoch aufgrund seiner Komplexität schwerlich greifbar. In diesem Paper widmen wir uns einem Ausschnitt aus diesem Problem mithilfe des Instrumentariums der Spiel- als auch der Moraltheorie und ihren Konzepten, indem wir ausgehend von dem wohlerrichteten Modell des Gefangenendilemmas ein fiktives, gleichwohl repräsentatives (strategisches) Umweltspiel kreieren. Es werden daran systematisch rationale, also ökonomische Strategien sowie moralische Argumente unter Würdigung eines Paradoxes der Klugheit vorgestellt und die Frage nach der Etablierung von Kooperation zwischen (scheinbar) im Konflikt stehenden Parteien (Spielern) diskutiert. Diese Untersuchung führt dabei zweierlei zutage: Erstens zeigen wir, wie Dilemmata sowohl technisch als auch theoretisch und politisch in Umweltspielen (unterschieden nach Einmal-/Mehrfachbetrachtungen sowie Kommunikationsmöglichkeiten) aufgelöst werden können. Und zweitens werden neue Impulse für die Vereinbarkeit von Moral und Eigeninteresse geliefert.

 

1. Einleitung

Zwei Ganoven begehen gemeinsam einen Banküberfall und werden anschließend gefasst, ohne dass ihnen jedoch der Raub nachgewiesen werden könnte. Die Indizien reichen aber aus, sie wegen eines leichteren Vergehens, z.B. wegen unerlaubten Waffenbesitzes, zu verurteilen. Der Gefängnisdirektor, wohl einer der ersten Spieltheoretiker, steckt die beiden in getrennte Zellen und unterbreitet jedem einzeln folgendes Angebot: (i) Wer die Straftat gesteht, während der Partner leugnet, wird aufgrund einer Kronzeugenregelung freigesprochen. (ii) Wer leugnet, während der Partner gesteht, bekommt die Höchststrafe von fünf Jahren Gefängnis. (iii) Leugnen beide, ist ihnen der Überfall nicht nachzuweisen; sie werden dann wegen unerlaubten Waffenbesitzes mit einem Jahr Gefängnis bestraft. (iv) Gestehen beide den Raub, so erhalten beide wegen ihrer Kooperation mit dem Gefängnisdirektor vier Jahre. Die Frage ist nun: Wie werden sich die beiden Gefangenen entscheiden?

Dies ist nur eine unter zahlreichen Erzählweisen der Cover Story des Prisoner’s Dilemma (Gefangenendilemma oder kurz: GD), dem wahrscheinlich bekanntesten (strategischen) Spiel überhaupt:[1] Allein in der Sozialpsychologie sollen tausend Papiere darüber existieren, insgesamt sind es wahrscheinlich noch sehr viel mehr, insbesondere seit der mehrfachen Nobelpreise für Spieltheoretiker. Dieser Ruhm kommt nicht von ungefähr: Es ist eines der interessantesten Spiele und erhitzt immer wieder die Gemüter; gleichzeitig beschäftigt neben den Sozialwissenschaften auch die Ethik die wichtige Frage, wie bei diesem Interaktionsmuster Kooperation zustande kommen kann. Da, wie das konkrete GD-Spiel hier zeigt, die weitere Beschäftigung mit dem Thema der GDs aus aktuellem Anlass, nämlich vor dem Hintergrund der Bekämpfung der Folgen des Klimawandels lohnt, alles in allem Grund genug, dass auch diese Arbeit sich jener Frage nach Kooperation verschreibt.

Zwar mag das eigentliche GD die vermutlich einfachste Form des sozialen Dilemmas sein und als eher ungeeignet erscheinen, reale Situationen widerzuspiegeln (weil beispielsweise mehr als zwei Spieler beteiligt sind), nichtsdestotrotz genügt jener Grundtyp, um diverse Sachverhalte zu modellieren.[2] So ist das GD auch Modell für viele ökonomische Situationen, darunter das prominente Beispiel der Nutzung (reiner und unreiner) öffentlicher Güter.[3]

Die vorliegende Arbeit ist wie folgt aufgebaut: Zunächst erörtern wir in Abschnitt 2 ein Fallbeispiel, das ein unreines öffentliches Gut betrifft, nämlich die Nutzung der Atmosphäre als Schadstoffsenke und in welchem zwei Akteure A und B zwischen hohen und verminderten Luftschadstoffemissionen wählen können. In Abschnitt 3 wird ausgehend von dem zuvor beschriebenen Umweltspiel erläutert, warum es sich hierbei um ein Paradox handelt. Freilich ziehen wir dafür und an anderen Stellen das Instrumentarium der Spieltheorie (v.a. deren Begriffe) heran, aber nicht um es/sie in den Vordergrund zu rücken, sondern vielmehr um die grundlegende Logik von Interaktionen zu verdeutlichen, um dann zu zeigen, mit welchen Ansätzen, was uns zu Abschnitt 4 bringt, man den Problemen, die sich aus dieser Logik ergeben, beikommen kann. Am Ende wird es also um die Frage gehen, ob und wie es möglich ist, das unbefriedigende Resultat beim Umweltspiel – soviel sei bereits vorweggenommen – zu vermeiden: Das ist eine ethische Frage. Schließlich fasst Abschnitt 5 zusammen und bettet die Diskussion in einen größeren, moraltheoretischen Zusammenhang ein.

 

2. Vorstellung des Fallbeispiels

Wir betrachten die Rolle von Vorstandsmitgliedern zweier stahlerzeugender Unternehmen (UN) in einer spezifischen Entscheidungssituation. Die beiden UN A AG und B AG erzeugen das gleiche Produkt (ein homogenes Gut), nämlich spezielle Fernwärmerohre, für welche sonst keine Anbieter auf dem Markt auftreten (Duopol). Sie stehen darum miteinander in starker Preiskonkurrenz.

Beide UN sehen sich folgender Situation gegenüber:

  1. Der jährliche Umsatz an Fernwärmerohren beider Betriebe ist gleich groß, d.h. sie besitzen gleich große Marktanteile.
  2. Die Stahl- und Rohrerzeugung ist mit hohen Luftschadstoffemissionen verbunden, die durch Filteranlagen und Katalysatoren (mit einer Nutzungsdauer [ND] von je 1 Jahr) maßgeblich reduziert werden können. Mit der Errichtung und dem Betrieb dieser Anlagen gehen aber beträchtliche Investitions- und Betriebskosten einher. Preiserhöhungen sind am Markt wiederum nicht durchsetzbar (vollkommener Konkurrenzmarkt). Eine Diversifikation der Produktion wird von beiden UN nicht erwogen, der Geschäftszweck sowohl der A AG als auch der B AG liegt allein in der Herstellung jener spezieller Fernwärmerohre.
  3. Im Dorf Unbeliebtheim, welches die einzige Wohnsiedlung im engeren Umkreis ist und sich in einem Tal unweit von den beiden Fabrikgeländen befindet, erkranken überdurchschnittlich viele Bewohner (im Vergleich zu weiter von den Fabriken entfernten Siedlungen) an Asthma und anderen Atemwegserkrankungen; darunter auch viele Arbeiter und einige Angestellte der UN. Denn es besteht eine positive Korrelation zwischen der Ausstoßmenge an Schadstoffen der A AG und der B AG und der Zahl der Erkrankungen. Daneben wirkt sich die Luftverschmutzung auch schädlich auf Flora und Fauna aus. Die Vorstandsmitglieder beider UN sind sich all dessen durchaus bewusst, doch vermuten sie lediglich einen Zusammenhang, da bis dato keine wissenschaftliche Studie dazu angestellt wurde, die ihre Überzeugung hätte untermauern können. Eine zu diesem speziellen Fall initiierte Studie, die also das Dorf Unbeliebtheim und die nähere Umgebung zum Gegenstand hat, ist künftig nicht zu erwarten. Abgesehen von der gravierenden Situation in Unbeliebtheim weiß der Staat um die negativen externen Effekte durch Luftverschmutzung und verlangt daher von UN mit hohen Luftschadstoffemissionen Entschädigungszahlungen.
  4. Die Höhe der Strafzahlungen ist abhängig von dem Grad der Verschmutzung des jeweiligen Luftraums, der durch emittierende UN belastet UN A und B belasten den gleichen Luftraum. (Geographisch benachbarte Industrien verunreinigen einen anderen Luftraum.)
  5. Die Vorstände sind den Schadstoffen kaum ausgesetzt nicht von gesundheitlichen Beeinträchtigungen betroffen. Demungeachtet identifizieren sie sich stark mit ihrem jeweiligen UN, weshalb ihnen viel an einem langfristigen Wohlergehen der Betriebe gelegen ist. Der dauerhafte Aktionärsstamm von UN A respektive B wünscht gar eine verantwortungsvolle UN-Führung.
  6. Werden die Emissionen unvermindert ausgestoßen (nicht vermieden), so ersparen sich beide Betriebe beträchtliche Investitionskosten, sie müssen aber Entschädigungszahlungen an den Staat leisten, was bei beiden UN zu bescheidenen Gewinnen führt (17,5 Mio./ annum für beide UN).
  7. Vermeiden beide UN die Emissionen, so entfallen zwar die Strafzahlungen, aber der Periodenüberschuss beider UN ist unter dem Blickwinkel der Gewinnmaximierung immer noch relativ unzufriedenstellend (35 Mio./ annum für beide UN).
  8. Vermeidet UN A die Emissionen, UN B aber nicht, so kann die B AG durch eine Ausweitung der Produktion wegen der niedrigeren Kosten und trotz der Entschädigungszahlungen den vergleichsweise höchsten Gewinn verbuchen (B: 38,125 / annum); hingegen verzeichnet die A AG das vergleichsweise schlechteste Betriebsergebnis durch die Kosten der Filter und Katalysatoren sowie den Verlust an Marktanteilen (A: 10 Mio./ annum). Entsprechendes gilt für die umgekehrte Konstellation (wenn B statt A die Emissionen senkt).

 

Daraus ergibt sich folgende Auszahlungsmatrix (in Mio. GE), wobei der Vorstand der A AG dem Spieler A und analog der Vorstand der B AG dem Spieler B entspricht (eben weil dieses Organ die operative Leitung hat und daher die Entscheidung zwischen H1 und H2 fällt):

 

B
H1: vermeidet H2: vermeidet nicht
A H1: vermeidet 35;             35 10;        38,125
H2: vermeidet nicht 38,125;    10 17,5;     17,5

 

Abb. 1: GD-Struktur des Umweltspiels in Normalform auf Basis monetärer Werte

 

Die monetären Werte spiegeln jedoch nicht zweifelsfrei die Nutzenwerte wider. Wir wollen zwar nicht danach fragen, ob A einen anderen Nutzen aus einem Geldwert zieht als B, aber gilt es insbesondere weiterhin zu berücksichtigen:

6´) Infolge der Kombination von H2 und H2 bleibt die Luftqualität schlecht, aber sie verschlechtert sich nicht weiter. [4] Es ist dennoch mit weiteren Krankheitsfällen, eventuell auch mit teils zu verantwortenden Todesfällen in Unbeliebtheim zu rechnen. Jedenfalls ist eine Zunahme an Leid bei Mensch und Tier um UN A und B herum sehr wahrscheinlich.

7´) Aufgrund einer drastisch abnehmenden Luftverunreinigung sind bei dem Strategienpaar H1 und H1 gegenteilige Konsequenzen zu erwarten.

8´) Sofern  ein  Spieler  H1  und  der  andere  H2  spielt,  ähneln  die  Verhältnisse  denen  in  6´),  da einer  Reduktion  an  Emissionen  durch  Filter  und  Katalysatoren  bei  dem  einen  Hersteller  eine Ausweitung der Produktion und darum der Emissionen bei dem anderen gegenübersteht.

 

Weitere Implikationen der einzelnen Strategienpaare sind durchaus denkbar. Doch wollen wir der Einfachheit und der Übersichtlichkeit halber von solchen Anstrengungen einmal absehen, welche die Bestimmung weiterer Determinanten der jeweiligen Auszahlungen [5] von A bzw. B zum Ziel haben. Der Fokus liegt vielmehr auf der Frage, wie nun A und B die bisher genannten Auswirkungen bewerten, welchen Nutzen sie ihnen zuweisen. Dies ist von anthropologischen Annahmen abhängig:

 

  1. Annahme: Spieler A und B sind rigorose Altruisten. Wenn A und B allein durch fremdnütziges Handeln glücklich werden, dann streben sie danach, das Glück/den Nutzen der anderen zu maximieren. In der durch die obigen Punkte festgelegten Situation erweist sich vor dem Hintergrund die Handlung H1 als diejenige, die den größten Nutzen für A respektive B besitzt, weil die Installation von Filtern und Katalysatoren das relativ große Leid einer relativ großen Zahl, nämlich der Bewohner von Unbeliebtheim (und der in der Umgebung verbreiteten Tiere) sukzessive mindert (oder positiv formuliert: ihr Glück erhöht). Eine Präferenzordnung der Spieler über die drei anderen Spielausgänge ist nicht nötig, da kein Spieler einen Anreiz hat, von der Strategie H1 abzuweichen.[6] Sicherlich ist es aber aus mindestens zweierlei Gründen nicht plausibel, Annahme 1 zu treffen: (i) Wer menschliches Handeln unvoreingenommen betrachtet, wird auf vielfältige Handlungsmotive stoßen. Von Ausnahmen abgesehen, sind Menschen weder völlig egoistisch noch völlig altruistisch. (ii) Rigoroser Altruismus (vom Schlage Albert Schweitzers etwa) und Ökonomie scheinen im Handlungsvollzug in einer Marktwirtschaft, in der sich die Akteure klassischerweise durch ein Gewinnstreben – also durch ein Verfolgen des Eigeninteresses –  auszeichnen, in einem unlösbaren Gegensatz zu stehen (siehe dazu auch Abschnitt 5): Dieser Antagonismus spiegelt die Lebenserfahrung vieler Akteure in der Wirtschaft wider. Ersetzen wir also die erste Annahme durch eine zweite.

 

  1. Annahme: Spieler A und B sind keine homines oeconomici[7], dennoch verfolgen sie hinreichend stark ihr Eigeninteresse. Jenseits des Schwarz-Weiß-Denkens öffnet diese zweite Annahme den UN A und B den Raum zwischen den Extremen eines rigorosen Altruismus und eines puren Egoismus. So mag es durchaus einleuchten, UN auch fremdnützige Handlungen zu unterstellen. Ferner erfreuen sich A und B daran, wenn sie eine Handlung mit moralischem Wert ausführen. Die Vorstände stellen deshalb Reflexionen darüber an, was in ihrer konkreten Entscheidungssituation moralisch geboten ist. Das Matrixfeld H1 – H1 bildet die moralisch richtige Lösung ab, da es einerseits der Intuition, unserem Alltagsurteil entspricht und da andererseits auch theoretische Überlegungen dafür sprechen, etwa weil (und insofern) dieser Spielausgang den Gesamtnutzen maximiert (Utilitarismus), um nur auf die bedeutendste konsequentialistische Ethik Bezug zu nehmen.[8] Nichtsdestotrotz bleibt das unmittelbar handlungsleitende Motiv von Wirtschaftssubjekten die Verfolgung des eigenen Interesses, das Gemeinwohl kommt (wenn überhaupt) eher als Nebenprodukt dieses Eigeninteresses zum Zuge. Dies ist der Sinn des berühmten Satzes von Adam Smith:

 

“Nicht vom Wohlwollen des Metzgers, Brauers und Bäckers erwarten wir das, was wir zum Essen brauchen, sondern davon, dass sie ihre eigenen Interessen wahrnehmen. Wir wenden uns nicht an ihre Menschen-, sondern an ihre Eigenliebe, und wir erwähnen nicht die eigenen Bedürfnisse, sondern sprechen von ihrem Vorteil. (Smith 1776/1978, S. 17)”

 

Schließlich gilt nun Folgendes für die Auszahlungsmatrix auf Basis von Nutzenwerten: (i) Da also das Eigeninteresse ausschlaggebend für die Bevorzugung einer der beiden Wahlmöglichkeiten ist, ergeben sich bei der Beachtung von 6´) – 8´) keine relevanten Veränderungen gegenüber Abb. 1. A und B empfinden vermutlich zwar Mitleid mit den geschädigten Dorfbewohnern bzw. Tieren usw., was wiederum in den entsprechenden Nutzenwerten berücksichtigt, aber trotzdem unwichtig ist, weil sich die Präferenzordnung (über die Spielausgänge) nicht verändert. (ii) Wir behalten allein die Präferenzen der Spieler im Blick. Wir sind nicht darum bemüht, einen Nutzen durch einen Zahlenwert auf einer Skala zu repräsentieren, sodass der Zahlenwert etwas über die absolute Höhe der Nutzenempfindung aussagt (die Werte auf dieser Skala hätten dann prinzipiell die gleichen Eigenschaften wie eine physikalische Maßeinheit). Es bedarf also keiner problematischen kardinalen Nutzenwerte, es genügt eine ordinale Skalierung:

 

 

B mit  I)              s < p < r < t
und II)             2r > s + t
H1: vermeidet H2: vermeidet nicht
A H1: vermeidet r,    r s,    t
H2: vermeidet nicht t,    s p,    p

 

Abb. 2: GD-Struktur des Umweltspiels in Normalform auf Basis von ordinalen Nutzenwerten[9] 

 

 

3. Das Paradox der Klugheit

Nachdem wir uns gerade die Entscheidungssituation der Vorstandsmitglieder der A AG und der B AG klargelegt haben, wenden wir uns jetzt der Entscheidungsfindung, dann dem Spielverlauf – unter obigen Rahmenbedingungen – zu. Es ist also zunächst zu ergründen, welche Strategie A und B vernünftigerweise spielen sollten. Rufen wir uns ins Gedächtnis, dass beide das jeweils für sie günstigste Ergebnis anstreben;[10] sie wissen aber, dass das tatsächliche Ergebnis nicht nur von ihrer eigenen Entscheidung, sondern auch von der ihres Antagonisten abhängt. Der Vorstand von A bzw. B wird daher nachstehende Überlegung anstellen: “Wenn unser Konkurrent den Luftschadstoffausstoß nicht vermeidet, fahren wir besser, wenn wir es ihm gleich tun (weil p > s). Wenn unser Konkurrent hingegen die Emissionen durch den Einbau technischer Anlagen reduziert, dann erhalten wir einen Vorteil, wenn wir keine Filter und Katalysatoren installieren, sondern stattdessen unsere Produktion ausweiten (da t > r).” Unabhängig von der Strategieentscheidung des anderen ist es also für beide UN günstiger H2 zu spielen. Mit anderen Worten: H2 ist eine streng dominante Strategie.[11]

Da sich nun beide Spieler für die Handlungsoption H2 entscheiden, ergibt sich für sie nicht das gewünschte Resultat t, sondern das Resultat p. Dieses Ergebnis ist suboptimal: Es ist das zweit-schlechteste der überhaupt möglichen Ergebnisse bzw. erreichen sie mit p/p denjenigen Zustand, der für beide zusammengenommen am schlechtesten ist. Hätten sich beide für H1 entschieden, so könnten sie jeweils einen höheren (Geld-)Gewinn (jeweils 35 Mio. GE) realisieren sowie Mensch und Tier vor einer gefährlich hohen Konzentration an Luftschadstoffen bewahren, wodurch sich A und B wiederum daran erfreuen würden, moralisch gehandelt zu haben. Kurzum: Sie hätten dann den Gesamtnutzen maximiert (r + r + …) und eine faire Pareto-optimale Aufteilung der Einheiten ordinalen Nutzens erlangt (in welcher man keinen Beteiligten besser stellen kann, ohne einen anderen schlechter zu stellen).[12] Dies setzt aber voraus, dass A und B H1 wählen. Aus der Sicht jedes einzelnen Spielers ist dies allerdings eine extrem risikoreiche, weil ausbeutbare Strategie (wer nämlich H1 wählt, während der andere H2 wählt, bekommt die vergleichsweise schlechteste Auszahlung, während der andere die vergleichsweise beste erhält). Und das heißt: Unter den gegebenen Bedingungen ist H2 für beide Spieler individuell rational, sie ist unter den vorhandenen Optionen die klügste, wenngleich damit – wie sich häufig die Formulierung findet – die individuelle Rationalität der kollektiven Rationalität widerspricht.[13] Wir kommen damit zu einem Ergebnis, das in der Literatur oft als paradox charakterisiert worden ist. Die Spieler erzielen ein schlechtes Resultat, obwohl beide sich klug (rational im Hinblick auf ihre eigenen Interessen, besser: ihre eigenen Vorstellungen) entscheiden. Man könnte sogar sagen, dass sie zu Opfern ihrer eigenen Klugheit werden. Wie ist dieser Befund zu erklären?

Er beruht auf zwei Voraussetzungen: (i) Das De-facto-Verhalten von A ist wesentlich auch davon abhängig, was B – vielleicht in (antizipierter) Reaktion auf das Verhalten von A – tut; die Theorie spricht von der Interdependenz des Verhaltens. Und da die Auszahlung für jeden der beiden Spieler nicht nur von der eigenen Strategie abhängt, sondern immer auch von der des anderen, führen also die eigenen Entscheidungen nicht direkt zu dem angestrebten Ergebnis. Klugheit fördert daher nicht unbedingt die eigenen Interessen. (ii) Selbst wenn A und B sich angesichts der misslichen Lage beraten und mündlich vereinbaren, zum gegenseitigen Interesse H1 zu spielen (Kooperation), gelingt es den Akteuren nicht, eine glaubwürdige Verhaltensbindung zu beschließen. Solange das Versprechen beider, zu kooperieren, nicht glaubwürdig ist – in der Fachsprache: cheap talk bleibt – muss jeder damit rechnen, dass der andere sich nicht an die Übereinkunft hält und defektiert. Die häufig vertretene Behauptung, das GD sei durch Kommunikation zwischen den Spielern zu lösen, ist also falsch.

Im Folgenden werden wir sehen, worin eine glaubwürdige Verhaltensbindung überhaupt besteht und wie es diese neben weiteren Ansätzen ermöglicht, dem GD zu entgehen. Doch zuvor wollen wir ergänzend festhalten: In unserem Umweltspiel führt nicht nur individuell rationales Verhalten zu kollektiver Irrationalität, sondern darüber hinaus haben A und B keinen (vernünftigen) Grund, hier moralisch zu sein, wiewohl dies für alle nützlich wäre, respektive A und B eigentlich eine moralische Gesinnung besitzen. Dies bedeutet aber auch umgekehrt zu konstatieren, dass moralisch Handelnde (aus der Sicht des Einzelnen) in unserem Fall (und in anderen) irrational agieren. Es gilt darum, im nächsten Kapitel auch die Versöhnung von Moral und Klugheit im Blick zu bewahren.

 

4. Wege aus dem Gefangenendilemma

Unsere bisherige Analyse des Fallbeispiels bezog sich, ohne dass dies ausdrücklich erwähnt wurde, auf ein Einmalspiel (one shot game): ein Spiel, das genau einmal gespielt wird.

Andernfalls spielen A und B ein anderes Spiel, weil sich bei einem wiederholten Umweltspiel strategische Möglichkeiten eröffnen (d.h. ganz neue Strategien entstehen und nicht nur einfach die Anzahlen der Strategien pro Wiederholung addiert werden darf), die bei einem Einmalspiel unberücksichtigt bleiben. Im Hinblick auf die Lösungsansätze für das Umweltspiel greifen wir die getroffene Zweiteilung zwischen einem einmalig stattfindenden und einem iterierten Spiel wieder auf.

 

 

4.1. Das Einmalspiel

Nehmen wir also an, die UN A und B stehen einmalig vor der Entscheidungssituation zwischen H1 und H2. Wie entrinnen sie aber unter diesen Umständen der sozialen Falle (p/p) oder besser gefragt: Wie gelangen sie zu dem gewünschten Interaktionsergebnis, das für beide (zusammengenommen) am besten wäre und zugleich das moralisch bewertete Ziel bildet (r/r)? Immerhin geht es ja auch um die Aufhebung der Persistenz moralischer Übel (menschliches Leid, Umweltverschmutzung, Folgen des Klimawandels usw.).

An dieser Stelle bietet sich eine Fallunterscheidung an:

 

  1. Fall: Der Vorstand von A (bzw. B) trifft seine Entscheidung, ohne sich zuvor mit dem Vorstand von B (bzw. A) abzustimmen (Spiel ohne Kommunikation). Die Parteien haben zwar danach nicht die Möglichkeit, bindende oder überhaupt Vereinbarungen einzugehen, dennoch kann man sich eine ganz einfache Lösung vorstellen: Angesichts der Problemaufmachung, dass das Spielen von H1 (und somit auch moralisch motivierter Vor- und Mehrleistungen) ausbeutbar ist und deswegen unterlassen wird, sollte dieser Anreiz zur Ausbeutung genommen werden.Technisch gesprochen ist insofern eine Maßnahme einzuleiten, mit welcher man den Payoff beim Spielen von H2 hinreichend senkt respektive den Payoff beim Spielen von H1 hinreichend erhöht. Dies meint konkret, dass die Auszahlung an die Spieler auf die Weise anzupassen ist, dass gilt: t < r (III). Darüber hinaus ist es ratsam (doch nicht notwendig), die Bedingung IV: p < s zu erfüllen.[14] Weiterhin soll gelten, dass V: p < r.[15] Schließlich haben wir dann unser Umweltspiel derartig transformiert, dass das paretosuperiore Resultat auch ein Nash-Gleichgewicht ist. Mit anderen Worten: Die beiderseitige Wahl der Alternative H1, welche für die Gruppe (A und B) klar das beste Ergebnis ist, liegt jetzt auch dank der obigen Modifikationen am Spiel im Interesse des Einzelnen. Spieltheoretisch heißt das ferner, dass wir nun ein Spiel mit anderen Regeln, und drum ein anderes Spiel spielen. Die Dilemmastruktur, von der wir ausgegangen waren, ist beseitigt.Politisch bedeutet das, dass eine Instanz von außen hinzukommen muss, welche den Anreiz setzt, H1 zu spielen. Diese Funktion erfüllen Regierungen und Quasi-Regierungsapparate. So ist es gar eine der Hauptfunktionen einer Regierung, Auswege aus GD-Situationen zu ermöglichen: sicherzustellen, dass Individuen auch dann gezwungen sind, das sozial erwünschte Verhalten zu zeigen, wenn sie keine privaten Anreize zur Kooperation besitzen (Axelrod 1984/2005, S. 119). Bei unserem Umweltspiel kann ein über das Gewaltmonopol verfügender Staat z.B. wie folgt intervenieren: (i) Sanktionen: Der Staat kann etwa die Entschädigungszahlungen für unverminderte Emissionen erhöhen, sodass die Veränderung der monetären Auszahlungen an A und B eine Präferenzverschiebung sicherstellt, die III – V genügt; oder er kann die Höhe der Strafzahlungen an der Schadstoffausstoßmenge jedes einzelnen UNs bemessen, statt einen pauschalen Betrag pro Luftraum und Luftverunreinigungsniveau von Emittenten einzufordern. (ii) Subventionen: Zum gleichen Zweck kann der Staat beispielsweise die Installation der Filter und Katalysatoren finanziell unterstützen. (iii) Privatisierung des öffentlichen Gutes: Der Staat hat die Möglichkeit, einen Markt für Verschmutzungsrechte einzurichten, wobei die Politik eine konkrete Obergrenze der Gesamtemission als Umweltziel direkt vorgibt. Dies ist die Grundidee des sog. Emissionsrechtehandels.[16] Emissionen, die ohne Emissionsrecht erfolgen, werden mit einer Strafe belegt. (iv) Setzung neuer Standards durch Gesetze: Daneben kann die Regierung ein Gesetz verabschieden, welches A und B vorschreibt, den Luftschadstoffausstoß auf ein gewünschtes Niveau zu senken (ein Verstoß führt wiederum zu Sanktionen). (v) Förderung von Altruismus durch Sozialisation: Schließlich mag es langfristig auch helfen, die Menschen dazu zu bewegen – dafür sind ihre Wertvorstellungen entsprechend zu formen – sich um das Wohlergehen der anderen zu sorgen.[17]

 

  1. Fall: Die Vorstände haben die Möglichkeit, sich im Vorhinein abzustimmen (Spiel mit Kommunikation). Nun war es bereits eine der zentralen Einsichten von Hobbes gewesen – was auch zuvor schon in dieser Arbeit bestätigt wurde – dass man sich auf verbale Übereinkünfte, Versprechungen oder dergleichen nicht verlassen kann. Da die Bindungswirkung einer solchen Übereinkunft viel zu schwach ist, um einem überwiegenden Eigeninteresse der Spieler standhalten zu können, muss sie von außen verstärkt werden. Es obliegt schließlich dem Staat, die Verletzung von Übereinkünften zu sanktionieren. Zwar teilen wir nicht sein Diktum vom homo homini lupus (weil es der hier getroffenen anthropologischen Annahme zuwiderläuft), doch sieht auch die Hobbessche Lösung die Rolle des Staates darin, alle nicht nur zur Einhaltung der Gesetze zu zwingen, sondern ebenso zur Erfüllung der zwischen den Bürgern eingegangenen privatrechtlichen Verträge:

     

    Wird ein Vertrag abgeschlossen, bei dem keine der Parteien sofort erfüllt, sondern nur im gegenseitigen Vertrauen, so ist er im reinen Naturzustand – im Zustand des Krieges eines jeden gegen jeden – bei jedem vernünftigen Verdacht unwirksam. Steht aber über beiden eine allgemeine, über beide gesetzte Macht, der Recht und Gewalt zur Verfügung stehen, die ausreichen, um die Erfüllung zu erzwingen, so ist er nicht unwirksam. Denn wer zuerst erfüllt, kann nicht sicher sein, daß der andere daraufhin erfüllen wird, da das Band der Worte viel zu schwach ist, um den Ehrgeiz, die Habgier, den Zorn und die anderen menschlichen Leiden-schaften ohne die Furcht vor einer Zwangsgewalt zu zügeln. (Hobbes 1651/1976, S. 104f.)

     

    Wenn also die Top-Manager von A und B einen gültigen Vertrag aufsetzen, der beide UN zur Installation und Inbetriebnahme von x Katalysatoren und Filteranlagen binnen eines Zeitraums y verpflichtet (bzw. auch eine fortlaufende Nutzung dieser Gerätschaften über die gesamte ND vorsieht), sowie obendrein eine hinreichend hohe Geldstrafe (etwa 50 Mio. GE) für jeden Vertragsbruch fixiert ist, dann garantiert der Staat die Einhaltung der Vertragskonditionen (insbesondere die Geltung der Konventionalstrafe). Bemerkenswert ist, dass dieser staatliche Eingriff im Interesse beider Spieler ist. Denn erst jetzt, aufgrund der staatlichen Sanktionsdrohung, kann die von beiden gewünschte Kooperation zustande kommen. Man muss in einem funktionierenden Staat kein Altruist, kein moralischer Mensch sein, um sich an abgeschlossene Verträge zu halten. Die Rücksicht auf das Selbstinteresse reicht aus.

 

Die bisher entwickelten Lösungen basieren systematisch auf einer glaubwürdigen, d.h. in der Regel: sanktionsbewehrten, kollektiven Selbstbindung. Sie wird traditionell durch den Staat etabliert und durchgesetzt. Abschließend bleibt aber einzuwenden: (i) Die Abbildung unseres Umweltspiels als Einmalspiel erscheint bei näherem Hinsehen nicht plausibel. Denn streng genommen setzt ein Einmalspiel nämlich voraus, dass die Spieler keinerlei gemeinsame Vergangenheit oder Zukunft haben. Aber UN A und B kommen nicht aus dem Nichts, spielen das Umweltspiel und verschwinden dann wieder ins Nichts. (ii) Im Hinblick auf die Moral kann der voreilige Rückgriff auf den Staat, der damit zu einem deus ex machina (Gauthier 1986, S. 10) wird, nicht unbedingt überzeugen. Im Unterschied zum Recht ist die Moral ein informelles System der Handlungsorientierung; es legt dem individuellen Handeln Schranken auch dort auf, wo andere (z.B. rechtliche Normen) nicht greifen. Es bleibt die Frage offen, ob der heikle Schritt von der moralischen Einigung zu ihrer tatsächlichen Einhaltung nicht doch mit anderen Mitteln bewerkstelligt werden kann.

 

4.2. Das iterierte Umweltspiel (ein Spiel über n Runden)

Die bislang aufgezeigten Lösungsvorschläge greifen klarerweise auch, wenn wir uns nun der realistischen Annahme zuwenden, dass die UN A und B auch abseits der hier analysierten Spielsituation miteinander interagieren. Doch bietet dies darüber hinaus A bzw. B die Möglichkeit, sich am jeweils anderen in einer zukünftigen Situation zu rächen, sofern man zuvor ausgebeutet wurde. Insbesondere möchten wir in diesem Kapitel den Umstand erwägen, dass A und B das Umweltspiel mehrmalig spielen. Zu diesem Zweck gehen wir von keinen wesentlichen Änderungen der Spielregeln im Zeitablauf aus, d.h. das Umweltspiel erfüllt über alle Runden  die Bedingungen I und II, d.h. nicht, dass die Auszahlungswerte konstant bleiben.[18] Unter dieser Restriktion leuchtet ein iteriertes Umweltspiel ein, da wir annehmen, dass (für jede Runde) sowohl H1 als auch H2 das Verhalten der Spieler für nur und konstant ein Jahr festschreibt, was wiederum durchaus plausibel ist, weil die ND der Filteranlagen und Katalysatoren etwa eben genau einem Jahr entspricht[19] und weil sich die monetären Auszahlungswerte erst am Ende der jeweiligen Periode (= 1 Jahr) als Periodenerfolg (im Jahresabschluss der UN) ergeben. Demnach stehen die Vorstände alljährlich erneut vor der Wahl zwischen H1 und H2. Nehmen wir weiter an: Die Vorstände beraten sich gegenseitig, geben jeweils ihre Kooperationsbereitschaft vor und versuchen, den anderen zur Kooperation zu verleiten. Schließlich kommt es in jedem Jahr unabhängig vom Spielausgang der vorhergehenden Runde zu Gesprächen anlässlich des Umweltspiels. Treffen wir nun folgende Differenzierung:

 

  1. Fall: 1 < n < ∞ und n: eine den Spielern bekannte Größe. Halten wir fest: Wenn das Umweltspiel über eine bekannte endliche Anzahl von Durchgängen läuft, haben A und B immer noch keinen Anreiz zu kooperieren: Das gilt sicherlich für die letzte Runde n, weil es dann keine gemeinsame Zukunft gibt, die durch sie beeinflusst wird. Sodann wird in der vorletzten Runde n-1 keiner der Spieler einen Anreiz zur Kooperation besitzen, weil beide die Defektion des anderen Spielers in der letzten Runde antizipieren können. Aus diesem Gedankengang ergibt sich für jede Folge von Spieldurchgängen, die von bekannter endlicher Länge ist, dass sich das Spiel über alle Runden zurück zu beiderseitiger Defektion ab dem ersten Schritt auflösen wird (Luce und Raiffa 1957, S. 94-102). Diese Rückwärtsinduktion, wie es in der Spieltheorie heißt, zeigt also, dass sich die Sachlage bei einem endlich oft wiederholten Umweltspiel (worüber Common knowledge vorausgesetzt ist) gegenüber dem Einmalspiel nicht ändert.Scheint das Ergebnis aber nicht umso frustrierender, je größer n ist? Denn immerhin wird die Differenz, die Kluft zwischen den kumulierten Auszahlungswerten bei gewünschter Kooperation vs. jenen bei individuell rationaler Defektion mit wachsendem n immer größer. Sollte ein wirklich kluger Spieler nicht die Maximierung seines Gesamtnutzens im Blick behalten, statt einer punktuellen Rationalität nachzujagen? Zu diesem Zweck aber darf er seine Handlungsentscheidungen nicht fallweise treffen. Er muss seine gesamte Strategie, die sog. Superstrategie ändern und an verbalen Absprachen auch dann festhalten, wenn er aus ihrer Verletzung einen kurzfristigen Vorteil ziehen könnte.Wir knüpfen damit an den Grundgedanken an, den Rationalitätsbegriff selbst zu hinterfragen. So hat etwa David Gauthier für eine Ersetzung des in der Ökonomie und Spieltheorie üblichen Rationalitätskonzepts durch ein anderes plädiert. Das erste geht davon aus, dass eine Entscheidung rational ist, gdw. durch sie der Erwartungsnutzen des Handelnden maximiert wird. Während hier einzelne Handlungen der zentrale Gegenstand der Entscheidung sind, bezieht sich die von Gauthier vertretene Rationalitätskonzeption auf Handlungsdispositionen. Eine Disposition ist danach dann und nur dann rational, wenn der Handelnde, der sie hat, davon ausgehen kann, dass seine Entscheidungen zu einem nicht geringeren Nutzen für ihn führen werden, als es bei den Entscheidungen der Fall wäre, die er treffen würde, falls er irgendeine andere Disposition hätte (Gauthier 1986, S. 182f.).Der dem üblichen Rationalitätskonzept anhängende direkte Maximierer (straightforward maximizer) wird in GD-Situationen das unbefriedigende Resultat (p/p) herbeiführen und muss erwarten, von kooperativen Unternehmungen ausgeschlossen zu werden. Ein beschränkter Maximierer (constrained maximizer), der dem Gauthierschen Konzept folgt, muss solche Sanktionen nicht befürchten; er ist ein gern gesehener Partner in kooperativen Unternehmungen und hat daher bessere Möglichkeiten, von ihnen zu profitieren. Obwohl er sich bei seinen Entscheidungen bestimmte Beschränkungen auferlegt, kann er aufgrund seiner größeren Wahlmöglichkeiten (unter bestimmten Annahmen, die hier vernachlässigbar sind) einen insgesamt höheren Nutzen erzielen. Es ist für ihn folglich rational, die Übereinkunft mit den anderen nicht bloß einzugehen, sondern auch einzuhalten. Und selbst wer anfangs eine Disposition zur direkten Maximierung gewählt hat, kann sich aufgrund besserer Einsicht später für eine Disposition zur beschränkten Maximierung entscheiden; denn: “At the core of our rational capacity is the ability to engage in self-critical reflection. The fully rational being is able to reflect on his standard of deliberation, and to change that standard in the light of reflection” (Gauthier 1986, S. 183).Gauthier unterstellt somit ein zweistufiges Wahlvermögen: Als rationale Wesen können Menschen nicht nur ihre Handlungen wählen, sondern auch ihre Handlungsdispositionen. Wer sich für eine Disposition zur beschränkten Maximierung entscheidet, bekundet damit seine eigene Natur als sowohl rationales als auch moralisches Wesen. Denn Moralität ist nicht als etwas von der individuellen Sorge um das eigene Wohlergehen Unterschiedenes zu begreifen, sondern erwächst aus dieser Sorge: Die Moral ist ein wesentlicher Teil der Nutzenmaximierung (Gauthier 1986, S. 184).

 

  1. Fall: n = ∞ oder n: eine den Spielern unbekannte Größe. Ob Gauthier die Fixierung der Individuen auf die punktuelle Maximierung ihres Nutzens mit einem “Mechanismus” der Dispositionen zu durchbrechen vermag, ist sicherlich kontrovers; doch braucht es nicht einmal solche Mühen, sofern wir ein Spiel mit einer unbestimmten Anzahl an Durchgängen betrachten; d.h. wenn die Spieler nicht sicher sein können, wann die letzte Interaktion zwischen ihnen stattfinden wird: Da es jetzt keinen Induktionsbeginn für die Rückwärtsinduktion gibt, erweist sich die Wahl einer kooperativen (Super-)Strategie auch für primär selbstinteressierte Spieler als attraktiv. Die Aussicht auf eine immerwährende lukrative Kooperation zum gegenseitigen Vorteil überwiegt den Nutzen aus punktuellen Extragewinnen durch Defektion, weil man bei letzterem die Chancen einer langfristigen Zusammenarbeit (die zu kumulativ höheren Auszahlungen führt) aufs Spiel setzt. Allerdings ist es für diese Abwägung notwendig, dass die Spieler künftige (Kooperations-) Gewinne mit einer hinreichend kleinen Rate diskontieren.[20] Wenn nämlich einem Spieler besonders an kurzfristig hohen Auszahlungen gelegen ist (wenn seine Diskontrate also hoch ist), wird sich die Wahl einer nichtkooperativen Strategie für ihn eher lohnen (weil er dadurch einen schnellen und relativ hohen Extragewinn einheimsen kann). Wir nehmen aber hingegen an, dass A und B künftige Gewinne im Vergleich zu gegenwärtigen genügend hoch bewerten, weil sie sich ein langfristiges sowie erfolgreiches Bestehen am Markt wünschen (um etwa Arbeitsplätze zu sichern). Und wenn die (künftigen) Gewinne aus kooperativem Verhalten auf lange Sicht höher sind als die Gewinne, die aus Defektion zu ziehen sind, dann wird es auch für A bzw. B rational, die verbalen Absprachen einzuhalten, die sie ohnehin schon immer befürwortet haben. Wir benötigen dafür weder eine vorgängige moralische Einstellung auf Seiten der Akteure, noch benötigen wir eine externe Instanz (einen Staat à la Hobbes), die unkooperatives Verhalten sanktioniert. Die Kooperation erwächst aus der internen Logik des Spiels und bleibt aufgrund dieser Logik auch stabil.Ist die beunruhigende Diskrepanz zwischen Moral und Klugheit damit verschwunden? Wer über den Tellerrand kurzfristiger Erfolge hinausdenkt; wer seine Interessen mit Weitblick und langem Atem zu maximieren sucht; wer also wirklich klug ist, der scheint gute Gründe für moralkonformes Handeln zu besitzen. Selbstlosigkeit ist nicht verlangt und ist auch nicht nötig. Moral ist die beste Politik.

 

5. Fazit und Ausblick: Ein (bloß) instrumentelles Moralverständnis?

Auch wenn sich dank anreizstiftender (Staats-)Maßnahmen und mit dem Übergang zu wiederholten Interaktionen die Befürchtung einer prinzipiellen Unvereinbarkeit von Moral und Eigeninteresse nicht bestätigt hat, sind wir von einer echten Versöhnung beider noch weit entfernt. Dies zeigt sich schon daran, dass die Bereitschaft zur Kooperation im Umweltspiel nicht durch intrinsische moralische Motive der Spieler erzeugt wird, sondern allein durch von außen gesetzte Anreize respektive durch die mit der Kooperation verbundenen Gewinnerwartungen. Die Akteure operieren bloß auf Basis von Klugheitsüberlegungen; moralische Reflexionen fließen zwar in ihre Nutzenwerte mit ein, doch sind diese wohl von eher marginaler Bedeutung, da sie nicht die Präferenzordnung der Spieler verändern. Und somit drängt sich ein begrifflicher Einwand gegen die Versöhnungshoffnung auf: Wenn all unsere Bemühungen lediglich darauf abzielen, Quasi-Egoisten dahin zu bringen, moralkonform zu handeln, ohne dass sie dafür aufhören müssen, Quasi-Egoisten zu sein, dann handelt es sich statt einer Versöhnung doch nur um eine Reduktion von Moral auf Klugheit. Wir scheinen drum über ein instrumentelles Moralverständnis nicht hinauszukommen, insofern Moral als ein Instrument der Interessenrealisierung fungiert. Und dies hätten Repräsentanten eines klassischen Verständnisses niemals als Moral akzeptiert.[21] Pointiert gefragt: Überzeugen wir A und B mithilfe unserer entwickelten Lösungsvorschläge von der Moral oder nicht vielmehr von der Überlegenheit einer klügeren (nämlich langfristigen) Strategie zur Sicherung ihres Selbstinteresses?

Eine solche Kritik am Instrumentalismus ist allerdings selbst nicht ganz unproblematisch. In den Augen vieler Wirtschaftsethiker (insbesondere nach der Homannschen Schule) beruhe sie auf einem antiquierten Moralverständnis, gegen das verschiedene Einwände zu erheben seien. (i) Das Postulat, das moralisch Richtige nicht um seines Nutzens, sondern um seiner moralischen Richtigkeit willen zu tun, läuft auf eine ethische Variante des l´art pour l´art hinaus. Die Moral scheint als ein Wert an sich, nicht als ein Wert für reale Menschen, was im scharfen Kontrast zu Homanns Forderung steht: “Moralische Regeln [können] nur unter der Voraussetzung in Geltung gesetzt werden, dass ihre Anreizkompatibilität gegeben ist bzw. hergestellt werden kann” (Homann und Lütge 2005, S. 51). Damit bildet die anreizkompatible Implementierbarkeit die Bedingung der normativen Gültigkeit. (ii) Die tatsächliche Verfasstheit des Menschen ist eine andere, als es die klassische Moralphilosophie vorgibt. Menschen sind keine ätherischen Wesen, die einer reinen praktischen Vernunft à la Kant folgen könnten, ohne dabei von eigenen Bedürfnissen und Interessen behelligt zu werden. Homann macht dagegen deutlich, dass das Motiv für Moral nur das individuelle Vorteilsstreben sein kann: “Damit erweist sich die bis tief in die Wissenschaften hinein vertretene Auffassung, unmoralisches Verhalten lasse sich von moralischem Verhalten mit Hilfe der Unterscheidung zwischen »Egoismus« und »Altruismus« diskriminieren, als unterkomplex: Auch der Moral geht es um die individuelle Besserstellung” (Homann und Lütge 2005, S. 52f.). Und (iii) schließlich fußt das klassische Moralverständnis auf religiösen und metaphysischen Voraussetzungen, die heute keinen Anspruch auf allgemeine Anerkennung mehr erheben dürfen (Homann und Blome-Drees 1992, S. 11f.).

So zeigt sich, dass wir dem begrifflichen Einwand inhaltlich zustimmen können, nur lediglich bestreiten, dass es sich um einen Einwand handelt. Dennoch bleibt es kritisch zu hinterfragen, ob und inwieweit wir dem moralischen Sollen wirklich ökonomische Restriktionen à la Homann auferlegen (aufzwingen) sollten oder ob der Übergang vom kurzsichtigen Egoismus zur langfristigen Klugheit und von dort zur Moral doch nicht als eine lineare und kontinuierliche Fortentwicklung gedacht werden kann.

 

Erklärung

Der Autor erklärt hiermit, keinen Interessenskonflikten zu unterliegen.

 

Literatur

Axelrod, Robert: The Evolution of Cooperation, dt. Übers. v. Werner Raub u. Thomas Voss: Die Evolution der Kooperation, München 2005 (Orig. 1984).

Dales, John H.: Pollution property and prices, Toronto 1974 (Orig. 1968).

Gauthier, David: Morals by Agreement, Oxford 1986.

Hobbes, Thomas: Leviathan, or The Matter, Forme, and Power of a Common-Wealth Eccles-iasticall and Civill, dt. Übers. v. Walter Euchner: Leviathan, oder Stoff, Form und Gewalt eines bürgerlichen und kirchlichen Staates, hg. v. Iring Fetscher, Berlin 1976 (Orig. 1651).

Homann, Karl/Blome-Drees, Franz: Wirtschafts- und Unternehmensethik, Göttingen 1992.

Homann, Karl/Lütge, Christoph: Einführung in die Wirtschaftsethik, Münster 2005.

Kant, Immanuel (GMS): Grundlegung zur Metaphysik der Sitten, in: Kants Werke, Akademie Textausgabe, Bd. IV. Berlin 1968 (Orig. 1785).

Luce, R. Duncan/Raiffa, Howard: Games and Decisions, New York 1957.

Riechmann, Thomas: Spieltheorie, München 2008.

Smith, Adam: An Inquiry into the Nature and Causes of the Wealth of Nations, dt. Übers. u. hg. v. Horst C. Recktenwald: Der Wohlstand der Nationen. Eine Untersuchung seiner Natur und seiner Ursachen, München 1978 (Orig. 1776).

Tucker, Albert W.: The Prisoner’s Dilemma, in: UMAP Journal 1 (1980), S. 101.

 

Anhang: Erläuterung zu den Auszahlungswerten in Abb. 1

Auf den ersten Blick könnte man meinen, die Annahmen in der Situationsbeschreibung des Fallbeispiels seien nicht konsistent, da Punkt 6 und 7 dem achten zu widersprechen scheinen: Aus dem Vergleich von Punkt 6 und 7 geht hervor, dass sich Vermeidung auch finanziell lohnt und somit die Entschädigungszahlungen größer als die Vermeidungskosten sind. Punkt 8 suggeriert hingegen die umgekehrte Relation zwischen den Kostenarten. Nichtsdestotrotz handelt es sich (wenn überhaupt) nur um einen scheinbaren Widerspruch, wie nachstehende Ausführungen zeigen sollen.

Nehmen wir zunächst folgende Variablen an:

R: Rohgewinn eines UNs in der Ausgangssituation (ex ante)

V: Vermeidungskosten für jedes UN (fix)

S: Strafzahlungen (abhängig von dem Grad der Verschmutzung des jeweiligen Luftraums), wobei S N: derjenigen Höhe der Strafzahlungen entspricht, bei welcher beide UN unvermindert emittieren

 

Da also die Strafzahlungen nicht fix, sondern variabel sind, liegt es eigentlich schon auf der Hand, dass V < S (Strafzahlung, gegeben der andere vermeidet nicht – siehe Punkt 6) nicht V > SH2/H1 (Punkt 8) ausschließen muss, weil die Differenz zwischen S und SH2/H1 hinreichend groß sein kann. Dies trifft zwar für unser Fallbeispiel nicht zu, gleichwohl verfehlt der obige Einwand sein Ziel; denn um den mutmaßlichen Widerspruch aufzulösen, genügt auch schon, dass S ≠ SH2/H1 gilt:

 

Setzt man für jedes UN

(1) R – S = x [beide vermeiden nicht]

(2) R – V = y [beide vermeiden]

 

dann kann für den Gewinn eines UNs, dass die Emissionen nicht vermeidet, wäh­rend das andere dies tut, immer noch gesetzt werden

(3) nR – pS – KP = z, mit einem plausiblen Wert für n: 1<n<2, mit 0<p<1 und p = (n-1)/2 + 0,5 + μ   (3) (= n/2 + μ[22]) und 0<KP<V

 

so dass z bei geeigneten R, V, S größer als y ist. Dabei wird nR (>R) durch die ausgeweitete Produktion bedingt und p drückt den Grad der Luftverschmutzung als den prozentualen Anteil an demjenigen Luftverunreinigungsniveau aus, bei dem beide UN nicht vermeiden. (Sonst kommen keine UN mit Luftschadstoffemissionen in dem Raum für UN A und B vor.) KP gibt schließlich die Kosten an, die im Zuge der Ausweitung der Produktion anfallen. Da ferner die Luftschadstoffemissionen bei H2/H2 höher sind als wenn nur ein UN unvermindert emittiert (also p<1), fallen auch die Entschädigungszahlungen bei H2/H1 geringer aus als bei H2/H2.

 

Dem Fallbeispiel liegen nun folgende Zahlenwerte zugrunde (in Mio. GE): R = 50, V = 15 und S = 32,5:

(1’) R – S = 17,5

(2’) R – V = 35 und

(3’) für n = 1,5 und p = 0,75 und KP = 12,5: 1,5R – 0,75S – KP = 38,125

 

Bei den gewählten Zahlen erzielt das benachteiligte UN (das die Emissionen ver­mei­det) ein deutlich unter dem Rohgewinn liegendes Betriebsergebnis, auf Grund von: (4) mR – V = w mit m = 2 – n, also

(4’) 0,5R – V = 25 – 15 = 10

 

Zwar gilt jetzt nicht, dass SH2/H1<V< S (weil 0,75S>15 und 15<S), dennoch gilt:

(5) S ≠ SH2/H1   und   (6) w<x<y<z

wobei (5) den Vorwurf einer Inkonsistenz ausräumt und (6) verbürgt, dass ein GD-Spiel vorliegt (siehe auch Abb. 2 und Fußnote 9 zur Bedingung I für GD-Spiele).

 

[1] Der Name Prisoner’s Dilemma soll von Albert Tucker geprägt worden sein. Tucker, der Doktorvater von John Nash, konzipierte das Gefangenendilemma 1950 als Prüfstein für das von Nash neu definierte Gleichgewicht in einer Notiz eher als Anekdote für einen Vortrag. Erstmals veröffentlicht worden ist diese Notiz in Tucker 1980.

[2] Die Kunst spieltheoretischer Modellierung besteht ja eben darin, von den vielen Aspekten einer (realen) Situation gerade die relevanten zu erfassen, von anderen zu abstrahieren.

[3] Reine öffentliche Güter zeichnen sich im Konsum durch die Eigenschaften der Nicht-Ausschließbarkeit und der Nicht-Rivalität aus (Bsp. Deiche). Unreine öffentl. Güter erfüllen dagegen nur das erste Kriterium (Bsp. Hochseefisch).

[4] Dem liegt die Annahme zugrunde, dass sich die Zahl der Schadstoffe in dem betroffenen Luftraum bei gleichbleibendem Emissionsniveau nicht erhöht bzw. dass sich der natürliche Schadstoffabbau hinreichend schnell vollzieht.

[5] In der Spieltheorie werden die einzelnen Spielergebnisse üblicherweise in Form von Auszahlungen an die Spieler notiert. In diesem Kontext ist damit kein Geld gemeint, sondern Einheiten ordinalen Nutzens.

[6] Im Jargon der Spieltheorie ausgedrückt: Die Strategienkombination aus H1 und H1 ist ein sogenanntes Nash-Gleichgewicht: Im Nash-Gleichgewicht hat keiner der Spieler einen Anreiz, als Einziger von der Gleichgewichtskombination abzuweichen; die Spieler spielen wechselweise beste Erwiderungen.

[7] Das theoretische Modell des Homo oeconomicus bezeichnet einen (fiktiven) Akteur, der (i) eigeninteressiert und rational handelt, (ii) seinen eigenen Nutzen maximiert, (iii) auf Restriktionen reagiert, (iv) feststehende Präferenzen hat und (v) über vollständige Informationen verfügt.

[8] Da A und B den Nutzen und darum auch die Güte von Handlungen an ihren Konsequenzen festmachen, hängen sie nicht deontologischen Moraltheorien an, weshalb diese hier übergangen werden können. Ebenso ist ein Ethischer Egoismus, der vielleicht das Spielen von H2 als Lösung postuliert, im Zusammenhang mit den kritischen moralischen Überlegungen der Vorstände belanglos, da ihm (in seiner starken Version) eine Widersprüchlichkeit inhärent ist (es kann nicht im Eigeninteresse liegen, andere Personen zum Maximieren des Eigeninteresses zu ermuntern) bzw. er zumindest unvereinbar mit der Funktionsbestimmung der Moral (als Sicherstellung eines harmonischen Zusammenlebens in einer Gesellschaft) ist.

[9] I) gewährleistet, dass tatsächlich ein GD-Spiel vorliegt. Die Bedingung II ist nicht unbedingt erforderlich, aber sinnvoll: Falls sie nicht erfüllt ist, besteht die eigentlich kooperative Lösung darin, dass einer der Spieler H1 spielt und der andere H2, um dann den gemeinsamen Gewinn in Höhe von s + t unter den beiden aufzuteilen (sofern sich die beiden Spieler gegenseitig ihre Gewinne übertragen können, sogenannte Seitenzahlungen).

[10] Das heißt nicht, dass A und B auf einmal doch reine Egoisten seien. Die Freude über altruistisches oder moralisches Handeln ist bereits in den Nutzenwerten aus Abb. 2 bedacht und – vereinfachend gesprochen – zu den Rohauszahlungen hinzugezählt worden. Derartige Nutzeninterdependenzen werden also bereits bei der Modellierung der Spielsituation  berücksichtigt, sodass es dann für die einzelnen Spieler nur noch angebracht ist, ihren eigenen Payoff zu maximieren.

[11] Eine Alternative A dominiert die Alternative B auf strenge Weise, wenn in jedem Umweltzustand (bei Spielen gegen die Natur) respektive bei jedem Verhalten der Gegenspieler (bei Spielen mit mindestens zwei Spielern) A besser ist als B.

[12] Technisch interessant an GD-Spielen ist die Tatsache, dass das Pareto-effiziente Resultat kein Nash-Gleichgewicht ist.

[13] Vgl. beispielsweise: Riechmann 2008.

[14] Wenn die Bedingung p < s nicht erfüllt ist, dann gibt es in unserem Umweltspiel zwei Nash-Gleichgewichte: (r/r) und (p/p). Wir befinden uns dann in einem sog. Win-Win-Game, in dem eines der beiden Gleichgewichte von beiden Spielern bevorzugt wird, nämlich (r/r); denn dieses Gleichgewicht ist auszahlungsdominant gegenüber jenem (auch Pareto-Dominanz genannt). In diesem Spiel liegt also kein wirklicher Interessenkonflikt zwischen den Spielern vor, aber aus spieltheoretischer Sicht ist die Lösung nicht trivial; denn erstens ist die Kombination H2 – H2 spieltheoretisch ein völlig gleichberechtigter Gleichgewichtspunkt, der nicht ohne weiteres ausgeschlossen werden darf, und zweitens ist es nötig, sich überhaupt erst einmal zu koordinieren (was je nach Rahmenbedingungen schwierig sein kann).

[15] Technische Anmerkung: Wenn t < r und p < s gilt sowie r < p geltend gemacht werden würde, dann befänden wir uns wieder in einem GD-Spiel, weil t < r < p < s (siehe Abb. 2 und Fußnote 9 zur Bedingung I für GD-Spiele).

[16] Für weiterführende Informationen vgl. Dales 1974.

[17] Aber es gibt dabei ein ernstes Problem. Ein selbstsüchtiger Spieler kann die Vorteile des altruistischen Verhaltens eines anderen genießen, ohne die Kosten an Wohlfahrtsverlusten zu zahlen, die aus eigener Großzügigkeit entstehen.

[18] Insofern ist die Implementierung einer der obigen Maßnahmen zur Beseitigung der Dilemmastruktur ausgeschlossen.

[19] Technische Innovationen, die (zukünftige) Filteranlagen und Katalysatoren mit einer längeren ND betreffen oder gar andere Wege aufzeigen, wie Emissionen ganz zu vermeiden sind, blenden wir der Einfachheit halber aus.

[20] Das Diskontieren bzw. Abzinsen trägt dem Grundsatz Rechnung, dass dasselbe Gut umso weniger wert ist, je später man darüber verfügen kann.

[21] Wo moralische Regeln nur darum befolgt werden, weil es sich bezahlt macht, hätte Kant von pflichtmäßigem Handeln gesprochen, bei dem eine lediglich äußere Übereinstimmung mit dem moralisch Gebotenen vorliegt (GMS, S. 397).

[22] μ stellt die Menge der Schadstoffabgabe des vermeidenden UNs in Abhängigkeit zur ursprünglichen Menge, bei von beiden UN nicht vermiedenen Emissionen, dar. μ kann aber vernachlässigt werden, da die Filter und Katalysatoren den Ausstoß schädlicher Stoffe derartig mindern, dass der Beitrag von μ unmerklich ist.

 

Der Autor

Dr. Christian Hugo Hoffmann

Dr. Christian Hugo Hoffmann ist Assistenzprofessor am Lehrstuhl für Finance der Universität Liechtenstein, wo er sich vor allem den Themen Fintech (API Economy, Future of Banking, Insurtech sowie Cryptocurrencies), Entrepreneurial Risks und Austrian Economics verschreibt. Seinen Postdoc hat er an der ETH Zürich, speziell am ETH Risk Center absolviert. Promotion erfolgte an der Universität St. Gallen (HSG) mit längerem Aufenthalt an der Yale University im Programm Financial Stability and Systemic Risks. Daneben ist Christian leidenschaftlicher Unternehmer mit zwei Fintech-Gründungen in Deutschland und der Schweiz, als Vizedirektor des Swiss Fintech Innovation Lab, als Direktor von Startup Grind Genf, als Startup-Coach/-Judge und -Mentor in verschiedenen Programmen (Mass Challenge, Vroom, Kickstart Accelerator), als früherer Head of Finance der erfolgreichen Robotikfirma Verity Studios sowie mit Beteiligungen in verschiedenen Startups.

 

Ähnliche Beiträge

Mit der “Transformative Teaching Toolbox” hat ein Projektteam der Bergischen Universität Wuppertal...

Bildungsforschende der Freien Universität Berlin veröffentlichen neue Studie zu Nachhaltigkeit in...

Gesellschaftlicher Wandel erfordert ein umfassendes Umdenken. Seit fünf Jahren beschäftigen sich...

Hinterlassen Sie eine Antwort