Η Θεωρία Παιγνίων

ΕΜΠΕΙΡΙΚΗ ΠΡΟΣΕΓΓΙΣΗ ΤΗΣ NASH ΙΣΟΡΡΟΠΙΑΣ

Περιεχόμενα

Η Θεωρία Παιγνίων
ΠΕΡΙΛΗΨΗ
Θεωρητική ανάλυση της θεωρίας παιγνίων
1.1 Τι είναι θεωρία παιγνίων
1.2 Ιστορική αναδρομή
1.3 Εφαρμογές στην καθημερινή ζωή
1.5 Κατηγορίες παιγνίων
1.4 Βασικές έννοιες της θεωρίας παιγνίων
2. Η ισορροπία Nash
2.1 Η ζωή του John Nash
2.2 Προσέγγιση της ισορροπίας Nash
2.3 Εξέταση διαφόρων παιγνίων
2.3.1 Το δίλημμα του φυλακισμένου “Prisoner’s dilemma”
2.3.2 Η μάχη των φύλων “Battle of the Sexes”
2.3.4 Το κλασσικό παιχνίδι κυριαρχίας κινδύνου “Risk Dominance”
2.3.3 Το παίγνιο “Chicken Game”

ΠΕΡΙΛΗΨΗ

Η παρούσα διπλωματική εργασία πραγματεύεται την ανάλυση της θεωρίας παιγνίων και πιο συγκεκριμένα την ισορροπία Nash. Ξεκινά με μια γενική αναφορά για τη θεωρία παιγνίων και συνεχίζει με την εξέλιξη της, από τις πρώτες ανακαλύψεις μέχρι και σήμερα. Παρουσιάζει διάφορες εφαρμογές σε πολλούς τομείς που υπάρχουν και αναλύονται κάποιοι σημαντικοί ορισμοί για την κατανόηση της.

Στη συνέχεια το ενδιαφέρον εστιάζεται στην ισορροπία Nash. Περιγράφεται η έννοια της ισορροπίας που πήρε το όνομα της από τον John Nash, η ζωή του οποίου αναφέρεται συνοπτικά. Επιπλέον παρουσιάζονται πέντε από τα πιο γνωστά παίγνια τα οποία χρησιμοποιήθηκαν στην έρευνα: το δίλημμα του φυλακισμένου, η μάχη των φύλων, το chicken game, το παίγνιο κυριαρχίας κινδύνου και το matching pennies.

Στην επόμενη ενότητα αναλύονται τα αποτελέσματα της έρευνας που πραγματοποιήθηκε με τη βοήθεια φοιτητών του Πανεπιστημίου Μακεδονίας για όλα τα παραπάνω παίγνια και γίνεται σύγκριση με προηγούμενες έρευνες. Στο τέλος παρουσιάζονται τα συμπεράσματα που προέκυψαν από την εκπόνησης της συγκεκριμένης εργασίας, και τι θα μπορούσε να γίνει ώστε να επεκταθεί μελλοντικά.

Θεωρητική ανάλυση της θεωρίας παιγνίων

1.1 Τι είναι θεωρία παιγνίων

Η θεωρία παιγνίων είναι μια μεθοδολογία ανάλυσης καταστάσεων μεταξύ μιας ομάδας λογικών ατόμων η οποία ανταγωνίζεται με σκοπό ο κάθε ένας να αποκτήσει το μεγαλύτερο όφελος. Σκοπός της είναι να μας βοηθήσει να καταλάβουμε διάφορες καταστάσεις στις οποίες αλληλεπιδρούν δύο ή περισσότερες οντότητες, κάθε μία από τις οποίες συμπεριφέρεται με στρατηγικό τρόπο και προσπαθεί να πάρει κάποιες αποφάσεις. Η μεμονωμένη οντότητα στην συγκεκριμένη περίπτωση ονομάζεται παίκτης, και είναι αυτός που παίρνει αποφάσεις. Σκοπός του κάθε παίκτη είναι να μεγιστοποιήσει το κέρδος του, το οποίο μετράται σε μια κλίμακα ωφέλειας.

Επομένως το παίγνιο που αναφέρεται στην θεωρία παιγνίων αντιπροσωπεύει την κατάσταση κατά την οποία δύο ή περισσότεροι παίκτες επιλέγουν τρόπους ενέργειας, που δημιουργούν καταστάσεις αλληλεξάρτησης.

1.2 Ιστορική αναδρομή

Η πρώτη γνωστή αναφορά στη Θεωρία Παιγνίων έγινε τον 18ο αιώνα (1838) από τον Γάλλο οικονομολόγο Augustin Cournot ο οποίος κατάφερε να αναλύσει ολιγοπωλιακές καταστάσεις με τρόπο παρόμοιο με τις σύγχρονες μεθόδους της θεωρίας παιγνίων.

Ωστόσο η ουσιαστική της ανάπτυξη αποδίδεται στον Ούγγρο φυσικό και μαθηματικό, John von Neumann, ο οποίος το 1928 απέδειξε ότι τα παιχνίδια μηδενικού αθροίσματος έχουν πάντα λύση και ότι η απώλεια ενός παίκτη είναι ίση με το κέρδος του δεύτερου. Καθοριστική στην μετέπειτα ανάπτυξη της θεωρίας παιγνίων ήταν η δημοσίευση του βιβλίου “Theory of Games & Economic Behavior”, το 1944, από τους John von Neumann και Oskar Morgenstern.

Στις αρχές της δεκαετίας του 1950 ο Αμερικανός μαθηματικός και οικονομολόγος John Nash εισήγαγε μια ισορροπία για παιχνίδια μη-μηδενικού αθροίσματος, γνωστή σαν ισορροπία Nash. Πρόκειται για μια κατάσταση, όπως θα δούμε και παρακάτω, από την οποία κανέναν παίκτη δεν τον συμφέρει να απομακρυνθεί, δεδομένων των επιλογών των αντιπάλων τους. Η ζωή του έγινε θέμα της ταινίας “Ένας υπέροχος άνθρωπος” με τον Russel Crow, όχι μόνο για όλα όσα προσέφερε στη θεωρία παιγνίων, αλλά και επειδή έπασχε από σύνδρομο καταδίωξης και σχιζοφρένειας από την ηλικία των 29 ετών.

Από εκείνο το σημείο και μετά η θεωρία παιγνίων είχε αλματώδη ανάπτυξη και άρχισε να εφαρμόζεται σε όλους τους τομείς και τις πολιτικές επιστήμες, ενώ πληθώρα ερευνητικών πειραμάτων ξεκίνησαν προσπαθώντας να βρουν λύση σε όλο και περισσότερα προβλήματα. Το 1965 ο Reinhard Selten μελέτησε τα δυναμικά παίγνια(αυτά που εξελίσσονται στο χρόνο) εισάγοντας την έννοια της ισορροπίας στα υποπαίγνια (subgame perfect equilibrium) και της ισορροπίας τρεμάμενου χεριού(trembling hand perfect equilibrium), ενώ το 1975 ο John Harsanyi γενίκευσε τις ιδέες του John Nash και μελέτησε παίγνια μη-πλήρους πληροφόρησης.

Για τις εργασίες τους, οι τρεις αυτοί άνθρωποι τιμήθηκαν αργότερα, το 1994, με το βραβείο Νόμπελ της Σουηδικής Ακαδημίας Επιστημών.

Τη δεκαετία του 1970 άρχισε να εφαρμόζεται και στον κλάδο της βιολογίας, σαν αποτέλεσμα της εργασίας του John Maynard Smith σχετικά με την έννοια της “εξελικτικά σταθερής στρατηγικής”(evolutionary stable strategy).

Στα τέλη της δεκαετίας του 1990 η θεωρία παιγνίων εφαρμόστηκε στον σχεδιασμό δημοπρασιών. Πάνω σε αυτό ασχολήθηκαν διάφοροι επιστήμονες για την κατανομή δικαιωμάτων χρήσης του ηλεκτρομαγνητικού φάσματος στη βιομηχανία των κινητών τηλεπικοινωνιών.[6]

Το 2005 ο Αμερικανός επιστήμονας Tomas Schelling και ο Γερμανός θεωρητικός παιγνίων Robert Aumann κέρδισαν το βραβείο Νόμπελ για τις Οικονομικές επιστήμες “επειδή εμπλούτισαν την αντίληψη μας σχετικά με τις έννοιες του ανταγωνισμού και της συνεργασίας μέσω της παιγνιοθεωρητικής ανάλυσης ”. Τους ακολούθησαν το 2007 οι Roger Myerson, Leonid Hurwicz και Eric Maskin “για τη θεμελίωση της θεωρίας σχεδιασμού μηχανισμών”.[7]

(Διπλωματική εργασία της Βλαχοπούλου Αθανασίας – Δημοσιεύουμε αποσπάσματα μόνο, όλα τα κεφάλαια, ερωτηματολόγιο και βιβλιογραφία μπορείτε να διαβάσετε στην πηγή)

1.3 Εφαρμογές στην καθημερινή ζωή

Όπως είδαμε μέχρι τώρα και θα δούμε και παρακάτω, η θεωρία παιγνίων έχει μεγάλη γκάμα εφαρμογών. Θα λέγαμε πως όλα έχουν κάποια σχέση με την θεωρία παιγνίων αφού έχει εφαρμογές στην οικονομία, στις επιχειρήσεις, στην πληροφορική, στις τηλεπικοινωνίες, στην πολιτική, στην κοινωνιολογία, στη βιολογία και φυσικά στην καθημερινότητα.[8] Μια σύγχρονη μαθηματική θεωρία μπορεί να αναλύσει κάθε είδος αναμέτρησης, από την ντάμα και το σκάκι μέχρι τον τζόγο ή έναν πυρηνικό πόλεμο, και να προβλέψει τον νικητή.

Οι οικονομολόγοι εδώ και πολύ καιρό χρησιμοποιούν τη θεωρία παιγνίων (έχοντας ως υλικά υποστήριξης τα πέντε βραβεία Νόμπελ στα οικονομικά) για να αναλύσουν διάφορους κλάδους όπως για παράδειγμα η βιομηχανική οργάνωση, ο σχεδιασμός μηχανισμών (mechanism design) με υποκλάδο τις δημοπρασίες, τις συμφωνίες, τα ολιγοπώλια, τα μονοπώλια, (ο Γάλλος μαθηματικός Κουρνό το 1838 έγραψε το πρώτο μοντέλο δυοπωλίου ) [10] τα συστήματα για να μπορεί κάποιος να ψηφίσει και πολλά άλλα. Οι έρευνες αυτές για να πραγματοποιηθούν εστιάζουν στην ισορροπία που υπάρχει στα παιχνίδια, την οποία θα σχολιάσουμε παρακάτω.

Επιπρόσθετα παίζει σημαντικό ρόλο στην παγκόσμια διπλωματία και στις πολεμικές στρατηγικές, επηρεάζοντας τη μοίρα των διαφόρων χωρών ακόμη και αν δεν είναι άμεσα ορατό.

Χρησιμοποιείται όμως και στην Πολιτική Οικονομία και ειδικά στη θεωρία της συλλογικής δράσης (Co11ective action), όπου εξηγεί ενδεχόμενα συνεργασίας μεταξύ των παικτών. Αυτό βρίσκεται σε άμεση συσχέτιση με τον ρόλο του κράτους και των θεσμών σε θέματα συνεργασίας. Χαρακτηριστικό παράδειγμα είναι η παροχή δημόσιων αγαθών και η φορολογία.

Στη βιολογία η θεωρία παιγνίων έχει χρησιμοποιηθεί για να κατανοήσουμε διάφορα φαινόμενα. Πρωτοχρησιμοποιήθηκε για να εξηγήσει την εξέλιξη (και την σταθερότητα) της αναλογίας 1 προς 1 στα φύλα. Ο Ronald Fisher (1930) πρότεινε ότι αυτή η αναλογία είναι αποτέλεσμα εξελικτικών δυνάμεων που δρουν μεμονωμένα, προσπαθώντας να μεγιστοποιήσουν τον αριθμό των εγγονιών! Συμπληρωματικά οι επιστήμονες προσπάθησαν να εξηγήσουν την εμφάνιση της επικοινωνίας στα ζώα, ενώ ανέλυσαν και την επιθετική συμπεριφορά τους.

Είναι ξεκάθαρο ότι μπορούμε να αναφέρουμε άπειρες εφαρμογές της θεωρίας παιγνίων σε διάφορους τομείς ακόμη και στην καθημερινότητα μας, από τα πιο πολύπλοκα έως τα πιο απλά όπως για παράδειγμα πιο αυτοκίνητο να αγοράσουμε, που θα πάμε το βράδυ ή τι θα φορέσουμε. [13]

1.5 Κατηγορίες παιγνίων

Τα παίγνια μπορούν να ταξινομηθούν σε διάφορες κατηγορίες με βάση διάφορα είδη κριτηρίων. Εδώ θα προσπαθήσουμε να τα χωρίσουμε σε κάποιες κατηγορίες. Έτσι λοιπόν έχουμε τους εξής διαχωρισμούς:

Σύμφωνα με τον αριθμό των παικτών που παίρνουν μέρος. Αν υπάρχουν δύο παίκτες τότε ονομάζονται “παίγνια δύο παικτών”, ενώ αν οι παίκτες είναι περισσότεροι(έστω n), τότε έχουμε “παίγνια n παικτών”, τα οποία βέβαια δεν έχουν μελετηθεί τόσο πολύ όσο τα πρώτα. Υπάρχει φυσικά και η περίπτωση που υπάρχει μόνο ένας παίκτης έχοντας σαν αντίπαλο του “τη φύση”, όπως για παράδειγμα ισχύει στην πασιέντζα. Τα παίγνια αυτά βέβαια θεωρούνται πως ανήκουν στην πρώτη κατηγορία των παιγνίων με δύο παίκτες. [25]

Σύμφωνα με τη δυνατότητα συνεργασίας. Οι παίκτες (δύο ή περισσότεροι) πριν παίξουν το παίγνιο έχουν τη δυνατότητα να συνεργαστούν και να κάνουν συμφωνίες μεταξύ τους για τις στρατηγικές που θα ακολουθήσουν. Αυτά ονομάζονται “συνεργατικά παίγνια”(cooperative games) σε αντίθεση με τα παίγνια όπου ο παίκτης παίρνει τις αποφάσεις χωρίς να συνεννοηθεί με τους άλλους, τα οποία ονομάζονται “μη συνεργατικά ” (non cooperative games). [26]

Σύμφωνα με τα χαρακτηριστικά των αποδοχών τους. Όταν το κέρδος ενός παίκτη είναι ίσο με την απώλεια του αντιπάλου του, το παίγνιο ονομάζεται “παίγνιο μηδενικού αθροίσματος”(zero-sum games). Σε αυτά τα παίγνια το άθροισμα των αμοιβών είναι ίσο με μηδέν με αποτέλεσμα η συνεργασία για τους παίκτες να είναι ανέφικτη. Αντίστοιχα υπάρχουν “παίγνια μη-μηδενικού αθροίσματος”(non zero-sum games) στα οποία το άθροισμα των αμοιβών είναι διάφορο του μηδενός. Το κέρδος κάποιου δεν σημαίνει απαραίτητα τη ζημιά κάποιου ανταγωνιστή, και οι δύο μπορεί να κερδίσουν ή και να χάσουν αντίστοιχα. [27]

Σύμφωνα με τη σειρά που παίρνονται οι αποφάσεις. Αν οι αντίπαλοι κινηθούν ταυτόχρονα επιλέγοντας μια στρατηγική στην αρχή του παιχνιδιού, χωρίς ο ένας να γνωρίζει τι θα πράξει ο άλλος, τότε μιλάμε για “στατικό παίγνιο” ή “στρατηγικό παίγνιο” ή “παίγνιο σε κανονική μορφή”. Στην αντίθεση περίπτωση έχουμε τα “δυναμικά παίγνια” ή “παίγνια σε εκτεταμένη μορφή” όπου οι παίκτες έχουν κάποια γνώση για τις προηγούμενες ενέργειες και έτσι η σειρά με την οποία λαμβάνονται οι αποφάσεις έχει σημασία. Στα παίγνια αυτά η αναπαράσταση γίνεται με τη βοήθεια δέντρου.[28]

Σύμφωνα με τον αριθμό των στρατηγικών. Τα παίγνια σε αυτήν την κατηγορία χωρίζονται σε “πεπερασμένα” και σε “μη πεπερασμένα”. Τα πεπερασμένα παίγνια τελειώνουν σε ένα μετρήσιμο αριθμό κινήσεων, σε αντίθεση με τα άλλα τα οποία διαρκούν για άπειρες κινήσεις και ο νικητής γίνεται γνωστός αφού όλες αυτές οι κινήσεις τελειώσουν.

Τέλος σύμφωνα με την πληροφόρηση που παρέχουν. Λέμε ότι έχουμε “παίγνια πλήρους πληροφόρησης” όταν οι παίκτες είναι πλήρως ενημερωμένοι για τις κινήσεις των αντιπάλων. Έτσι μόνο τα δυναμικά παίγνια μπορεί να είναι παίγνια πλήρους πληροφόρησης, μιας και στα στατικά οι παίκτες δεν είναι ενημερωμένοι. Όταν οι παίκτες είναι μερικώς ενημερωμένοι λέμε ότι έχουμε “παίγνια ατελούς πληροφόρησης”.[29]

Όταν το κέρδος ενός παίκτη είναι ίσο με την απώλεια του αντιπάλου του, το παίγνιο ονομάζεται “παίγνιο μηδενικού αθροίσματος”

Το κέρδος κάποιου δεν σημαίνει απαραίτητα τη ζημιά κάποιου ανταγωνιστή, και οι δύο μπορεί να κερδίσουν ή και να χάσουν αντίστοιχα.

Οι παίκτες (δύο ή περισσότεροι) πριν παίξουν το παίγνιο έχουν τη δυνατότητα να συνεργαστούν και να κάνουν συμφωνίες μεταξύ τους για τις στρατηγικές που θα ακολουθήσουν. Αυτά ονομάζονται “συνεργατικά παίγνια” σε αντίθεση με τα παίγνια όπου ο παίκτης παίρνει τις αποφάσεις χωρίς να συνεννοηθεί με τους άλλους, τα οποία ονομάζονται “μη συνεργατικά ”.

Επιπρόσθετα παίζει σημαντικό ρόλο στην παγκόσμια διπλωματία και στις πολεμικές στρατηγικές, επηρεάζοντας τη μοίρα των διαφόρων χωρών ακόμη και αν δεν είναι άμεσα ορατό.

Χρησιμοποιείται και στην Πολιτική Οικονομία και ειδικά στη θεωρία της συλλογικής δράσης, όπου εξηγεί ενδεχόμενα συνεργασίας μεταξύ των παικτών, σε άμεση συσχέτιση ρόλων κράτους – θεσμών σε θέματα συνεργασίας, όπως η παροχή δημόσιων αγαθών και η φορολογία

1.4 Βασικές έννοιες της θεωρίας παιγνίων

Θεμέλιο λίθο στην θεωρία παιγνίων αποτελούν τα βασικά χαρακτηριστικά του παιγνίου. Ως στοιχεία του παιγνίου θεωρούνται το σύνολο των παικτών, το σύνολο των πιθανών ενεργειών που θα πραγματοποιήσουν οι παίκτες(οι στρατηγικές τους), οι πληροφορίες που υπάρχουν κατά τη διάρκεια του παιχνιδιού, τα αποτελέσματα που μπορεί να αποκομίσει ο παίκτης για κάθε ενέργεια του, καθώς επίσης και οι προτιμήσεις των παικτών με βάσει τα αποτελέσματα.[14] Το αποτέλεσμα που μπορεί να αποκομίσει ο παίκτης(outcome), εξαρτάται από τις στρατηγικές που θα ακολουθήσει και από τις αποδόσεις που μπορεί να λάβει. Η απόδοση (payoff), είναι η αριθμητική αποτίμηση των στόχων του, η χρησιμότητα που θα αποκτήσει όταν το παιχνίδι θα τελειώσει. [15]

Με τον όρο στρατηγική ορίζουμε το σύνολο των κανόνων σχετικά με το ποια επιλογή πρέπει να ακολουθήσει ο παίκτης, ποιες είναι οι επιλογές του στο κάθε παίγνιο ξεχωριστά, έχοντας όμως υπόψη του και όλες τις κινήσεις του αντιπάλου.

Μια διάκριση που μπορεί να γίνει στις στρατηγικές είναι σε αμιγείς^Μ^’και σε μεικτές “mixed” στρατηγικές. Μια αμιγής(καθαρή) στρατηγική είναι εκείνη στην οποία κάθε μία από τις δυνατές επιλογές που έχει ο παίκτης επιλέγεται στο ακέραιο. Αντίθετα μεικτή είναι η στρατηγική η οποία περιλαμβάνει συνδυασμό επιλογών, από τις οποίες τουλάχιστον μία επιλέγεται με μη ακέραιες τιμές.[16] Οι μεικτές στρατηγικές δηλαδή καθορίζουν ότι η στρατηγική που θα διαλέξει ο παίκτης θα επιλεγεί τυχαία από το σύνολο των καθαρών στρατηγικών που έχει, με κάποια πιθανότητα. Επομένως μια μεικτή στρατηγική είναι μια κατανομή πιθανοτήτων πάνω στις καθαρές στρατηγικές που έχει ο παίκτης. [17]

Ένα παίγνιο στο οποίο οι παίκτες παίζουν ταυτόχρονα, μπορεί να απεικονιστεί ως “κανονική”(normal) ή “στρατηγική”(strategic) μορφή χρησιμοποιώντας έναν πίνακα ο οποίος συσχετίζει τις στρατηγικές των παικτών με τις αποδόσεις που θα έχουν. [18]

Ένα στρατηγικό παιχνίδι είναι ένα μοντέλο όπου έχουμε Ν παίκτες, καθένας από τους οποίους διαλέγει μόνο μία στρατηγική, η οποία δεν αλλάζει. Σε ένα στρατηγικό παιχνίδι υπάρχουν διάφορες συμπεριφορές παικτών:

Το παιχνίδι παίζεται μόνο μία φορά.
Κάθε παίκτης “ξέρει” το παιχνίδι (κάθε παίκτης γνωρίζει όλες τις κινήσεις και τις αποδόσεις του παιχνιδιού).
Οι παίκτες είναι ορθολογικοί. Ένας ορθολογικός παίκτης είναι ένας παίκτης που παίζει εγωιστικά, θέλοντας να μεγιστοποιήσει το κέρδος του στο παιχνίδι, ενώ ταυτόχρονα γνωρίζει πως και οι αντίπαλοι του είναι ορθολογιστές.
Όλοι οι παίκτες διαλέγουν τις κινήσεις τους ταυτόχρονα χωρίς όμως να γνωρίζουν τις επιλογές των άλλων παικτών. [19]

Για να κατανοήσουμε καλύτερα την κανονική μορφή των παιγνίων, παραθέτουμε το τέταρτο παίγνιο του ερωτηματολογίου το οποίο θα χρησιμοποιήσουμε σαν παράδειγμα για να εξηγήσουμε τα στρατηγικά παίγνια. […]

Το παιχνίδι ξεκινάει και οι παίκτες διαλέγουν ταυτόχρονα μία στρατηγική. […]

Οι παίκτες πριν πάρουν κάποια απόφαση και διαλέξουν ποια στρατηγική θα ακολουθήσουν, κοιτάνε ποια στρατηγική πραγματικά τους ωφελεί, με ποια θα έχουν το μεγαλύτερο δυνατό κέρδος ότι και να κάνει ο αντίπαλος τους. Σε αυτό το σημείο η επιλογή γίνεται με βάση την κυριαρχία των στρατηγικών.

Μια στρατηγική λέμε ότι είναι κυρίαρχη “dominant” εάν για όλους τους συνδυασμούς στρατηγικών των άλλων παικτών έχει το μεγαλύτερο όφελος σε σχέση με τις υπόλοιπες. Είναι πάντα καλύτερη ότι και να κάνει ο άλλος παίκτης αφού έχει το μεγαλύτερο κέρδος σε σχέση με τις άλλες εναλλακτικές επιλογές του. Αντιθέτως μια στρατηγική χαρακτηρίζεται ως κυριαρχούμενη “dominated” όταν υπάρχει κάποια άλλη στρατηγική που είναι πάντα καλύτερη ότι και να κάνει ο άλλος παίκτης. […]

Αν κάποιος παίκτης έχει κυρίαρχη στρατηγική την ακολουθεί και τότε το παιχνίδι έχει λύση κυρίαρχης στρατηγικής. Όπως είδαμε όμως είναι πολύ πιθανό να μην υπάρχουν πάντα κυρίαρχες στρατηγικές αλλά να υπάρχουν ασθενείς κυριαρχίες

[…] Ο συνδυασμός των στρατηγικών που επιλέχθηκαν από κάθε παίκτη μας δίνει την έννοια της ισορροπίας “equilibrium”. [..] Για να βρούμε αυτήν την ισορροπία εάν υπάρχει κυρίαρχη στρατηγική για κάποιον παίκτη τότε επιλέγεται, όπως αναφέραμε και παραπάνω. Σε περίπτωση όμως που δεν υπάρχει, ο περιορισμός των κυριαρχούμενων στρατηγικών “dominated” μπορεί να οδηγήσει στη δημιουργία νέων κυριαρχούμενων στρατηγικών, οι οποίες με τη σειρά τους θα απαλειφθούν κι αυτές. Ξεκινώντας το παιχνίδι διαγράφονται μία μια οι ασθενώς κυριαρχούμενες στρατηγικές από τις επιλογές του παίκτη και αυτό συνεχίζεται μέχρι να βρεθεί μόνο μία στρατηγική για κάθε παίκτη.

Η διαδικασία αυτή ονομάζεται απαλοιφή κυριαρχούμενων στρατηγικών “Iterated Elimination of Dominated Strategies, IEDS”. Η διαδικασία αυτή είναι απολύτως λογική αφού και οι παίκτες είναι λογικοί και γνωρίζουν πως και οι αντίπαλοι τους είναι λογικοί γεγονός που δείχνει ότι κανένας από αυτούς δεν θα επιλέξει μια στρατηγική η οποία είναι ασθενώς κυριαρχούμενη. Αν απαλείψουμε μόνο κυριαρχούμενες στρατηγικές, η σειρά της απαλοιφής δεν επηρεάζει το αποτέλεσμα. Ο κίνδυνος υπάρχει μόνο αν απαλείψουμε με λάθος σειρά ασθενώς κυριαρχούμενες στρατηγικές, οδηγώντας μας σε λάθος αποτέλεσμα. Σωστή σειρά θεωρείται η ταυτόχρονη απαλοιφή για όλους τους παίκτες σε κάθε γύρο.

Η σημαντικότερη έννοια ισορροπίας στη θεωρία παιγνίων είναι η ισορροπία Nash

(Δημοσιεύουμε αποσπάσματα μόνο, όλα τα κεφάλαια, ερωτηματολόγιο και βιβλιογραφία μπορείτε να διαβάσετε στην πηγή)

2. Η ισορροπία Nash

2.1 Η ζωή του John Nash

Στους βασικούς θεμελιωτές της θεωρίας παιγνίων ανήκει ο John Nash ο οποίος εισήγαγε στα παίγνια την ιδέα της ισορροπίας η οποία χρησιμοποιείται πλέον ευρέως σε όλους τους κλάδους της σύγχρονης επιστήμης.

Ο Nash γεννήθηκε στη Δυτική Βιρτζίνια το 1928. Αν και ενδιαφερόταν για τα μαθηματικά, αποφάσισε να γίνει ηλεκτρολόγος μηχανικός όπως και ο πατέρας του. Όταν το 1945 γράφτηκε στο “Carnegie Institute of Technology” στο Pittsburgh αποφάσισε να γίνει χημικός μηχανικός, κάτι που στην πορεία δεν του άρεσε και έτσι επέστρεψε στα μαθηματικά με τα οποία ασχολήθηκε.

Όταν πήγε το 1948 στο “Princeton” ήταν ήδη ένας από τους κορυφαίους στην θεωρία παιγνίων και είχε ήδη ασχοληθεί με “προβλήματα συμφωνιών”, δηλαδή προβλήματα στα οποία οι παίκτες μοιράζονται κάποια κοινά συμφέροντα. Με τη φράση “αυτός ο άντρας είναι ιδιοφυία” περιέγραψε τον John Nash στους υπόλοιπους καθηγητές του Princeton University, ο καθηγητής R. L. Duffin.

Η σημαντικότερη του εργασία όμως ήταν αυτή που ασχολήθηκε με την ισορροπία στη θεωρία παιγνίων και χάρη στην πολύτιμη συμβολή του πήρε το όνομα “Nash ισορροπία”. Ο Nash δημοσίευσε την ιδέα του για την ισορροπία αμέσως σε ηλικία 21 ετών! Μια δισέλιδη αναφορά έγινε το 1950 στο “Proceedings of the National Academy of Sciences”. Με τίτλο “Equilibrium Points in n-Person Games”, το άρθρο δημοσίευσε περιληπτικά την ύπαρξη λύσεων για παίγνια με ν παίκτες. Επέκτεινε την έρευνα του και μια μεγαλύτερη έκδοση δημοσιεύτηκε το 1951 στο “Annals of Mathematics” με τίτλο “Non-cooperative Games”.

Αν και δεν έτυχε ευρείας υποδοχής στην αρχή, η προσέγγιση του Nash για την θεωρία παιγνίων, τον οδήγησε στην απόκτηση του βραβείου Νόμπελ στα οικονομικά το 1994. Δεν υπάρχει όμως καμιά αμφιβολία ότι η ανάπτυξη της θεωρίας παιγνίων σε όλους τους τομείς έγινε εφικτή χάρη στην ανακάλυψη του Nash.

Ο Nash σκαρφίστηκε μια γενική “λύση” για όλα τα (πεπερασμένα) παίγνια και απέδειξε ότι κάθε τέτοιο παίγνιο διαθέτει τουλάχιστον μια τέτοια λύση. Έτσι κατάφερε ένα μεγάλο χτύπημα στην απροσδιοριστία.

2.2 Προσέγγιση της ισορροπίας Nash

Το θεώρημα που διατύπωσε ο Nash και έγινε γνωστό σε όλο τον κόσμο αναφέρει πως κάθε παίγνιο με πεπερασμένο πλήθος παικτών και ενεργειών έχει τουλάχιστον ένα σημείο ισορροπίας, σύμφωνα με το οποίο όλοι οι παίκτες επιλέγουν τις πιο συμφέρουσες για αυτούς ενέργειες, γνωρίζοντας και τις επιλογές των αντιπάλων τους. Οι παίκτες σκέφτονται τι μπορεί να διαλέξει ο αντίπαλος τους, προσπαθούν να καταλάβουν τη συμπεριφορά των άλλων και επιλέγουν την στρατηγική τους σύμφωνα με αυτό. Δηλαδή η στρατηγική ενός παίκτη αποτελεί την καλύτερη αντίδραση (απόκριση) στην στρατηγική του άλλου παίκτη. Αυτός ο συνδυασμός στρατηγικών αποτελεί ισορροπία Nash.

Ο παίκτης επιλέγει εκείνη από τις δικές του στρατηγικές, η οποία είναι η καλύτερη απάντηση στην στρατηγική που νομίζει ότι θα επιλέξει ο άλλος παίκτης

Επομένως κανένας παίκτης δεν έχει κίνητρο να φύγει μονομερώς από αυτήν την ισορροπία που έχει δημιουργηθεί. Οι παίκτες καταλαβαίνουν πως βρίσκονται σε ισορροπία αν μια αλλαγή στις στρατηγικές από οποιονδήποτε από αυτούς, οδηγήσει σε χαμηλότερο κέρδος από αυτό που θα είχαν αν παρέμεναν στη σωστή στρατηγική.

Δεδομένου των επιλογών των αντιπάλων, ο παίκτης δεν έχει να κερδίσει κάποιο μεγαλύτερο όφελος και για αυτό δεν αλλάζει στρατηγική

Όπως είναι φανερό η θεωρία για την ισορροπία Nash, έχει δύο συνιστώσες: πρώτα κάθε παίκτης κάνει την επιλογή του βασιζόμενος στην ορθολογική απόφαση που προέρχεται από τις πεποιθήσεις του για το τι θα πράξει ο αντίπαλος και δεύτερον κάθε πεποίθηση του παίκτη για την επιλογή του αντιπάλου του είναι σωστή

[…] Ο Nash κατάφερε επίσης να αποδείξει πως όλα τα πεπερασμένα παίγνια εμπεριέχουν τουλάχιστον ένα σύνολο μικτών στρατηγικών (μία ανά παίκτη) που συνιστά ισορροπία Nash σε μικτές στρατηγικές (ΙΝΜΣ) Όταν υπάρχουν πολλές ισορροπίες Nash (σε καθαρές στρατηγικές), τη λύση δίνει η ισορροπία Nash σε μικτές στρατηγικές.

Ακόμη και αν δεν υπάρχει ισορροπία σε καθαρές στρατηγικές, υπάρχει μία μοναδική ισορροπία σε μικτές στρατηγικές.

Η ισορροπία σε καθαρές στρατηγικές φαίνεται πιο ελκυστική πρόταση από την ισορροπία στις μικτές, αφού δεν χρειάζεται οι παίκτες να επιλέγουν στην τύχη. Όμως από τη στιγμή που δεν υπάρχει ισορροπία σε κάθε παιχνίδι, η ισορροπία σε μικτές στρατηγικές αποκτάει μεγαλύτερη αξία αφού πλέον για κάθε παιχνίδι υπάρχει σίγουρα μία ισορροπία.

2.3 Εξέταση διαφόρων παιγνίων

Ένα από τα παράδοξα της ισορροπίας Nash που μπορεί να θεωρηθεί και σαν αδυναμία της είναι ότι σε κάποια παίγνια οι παίκτες έχουν μεγαλύτερο όφελος αν δεν διαλέξουν την ισορροπία Nash και διαλέξουν άλλη στρατηγική. Ενώ η ισορροπία Nash δίνει την ελκυστικότερη λύση για όλους τους παίκτες, οδηγώντας στο σημείο ισορροπίας, εντούτοις υπάρχουν κάποια διάσημα παίγνια που είναι εξαίρεση στον κανόνα. Κάποια από αυτά τα παίγνια χρησιμοποιήθηκαν στην έρευνα και θα αναλυθούν στη συνέχεια.

2.3.1 Το δίλημμα του φυλακισμένου “Prisoner’s dilemma”

Το πιο γνωστό και σημαντικό παίγνιο στην ιστορία της θεωρίας παιγνίων είναι το παίγνιο του διλήμματος του φυλακισμένου (Prisoner’s dilemma).

Τον Ιανουάριο του 1950 οι Melvin Dresher και Merrill Flood επινόησαν το συγκεκριμένο παίγνιο και το χρησιμοποίησαν σαν παράδειγμα στο RAND Corporation. Αργότερα όταν παρουσιάστηκε αυτό το παράδειγμα σε ένα σεμινάριο στο Stanford University, ο Albert W. Tucker σκαρφίστηκε μία ιστορία πάνω στην οποία βάσισε όλη του την διάλεξη. Το παίγνιο αυτό έμεινε από τότε στην ιστορία κάνοντας την θεωρία παιγνίων γνωστή σε όλες τις κοινωνικές επιστήμες, ενώ και πάρα πολλοί μελετητές έχουν ασχοληθεί με αυτό γράφοντας διάφορα βιβλία .

Η ιστορία του Tucker έχει ως εξής:

∆υο ύποπτοι για ένα έγκλημα συλλαμβάνονται από την αστυνομία και κρατούνται σε διαφορετικά κελιά, ώστε να μην έχουν μεταξύ τους επικοινωνία. Οι αστυνομικοί είναι σίγουροι για την ενοχή τους αλλά ελλείψει αποδεικτικών στοιχείων τους προσφέρουν μια συμφωνία: αν και οι δύο ομολογήσουν ότι διέπραξαν το έγκλημα θα καταδικαστούν μόνο σε τρία χρόνια φυλάκισης. Αν μόνο ο ένας ομολογήσει θα αφεθεί ελεύθερος ενώ ο άλλος που θα αρνηθεί θα φυλακιστεί για πέντε χρόνια. Τέλος, αν κανένας δεν ομολογήσει, και οι δύο θα περάσουνε έναν χρόνο στη φυλακή.

Το παραπάνω πρόβλημα μπορεί να παρουσιαστεί στον επόμενο πίνακα

Το δίλημμα εμφανίζεται όταν κάποιος υποθέτει ότι και οι δύο φυλακισμένοι νοιάζονται μόνο για να ελαχιστοποιήσουν την ποινή τους.

Κάθε παίκτης έχει δύο στρατηγικές επιλογές : είτε να ομολογήσει και να συνεργαστεί με την αστυνομία (confess), είτε να παραμείνει σιωπηλός (not confess). Για παράδειγμα το καλύτερο αποτέλεσμα για τον παίκτη Α είναι να ομολογήσει και ο παίκτης Β να μείνει σιωπηλός. Το επόμενο καλύτερο αποτέλεσμα για τον Α είναι να μη μιλήσει κανένας από τους δύο, ενώ το χειρότερο σενάριο είναι να μιλήσει ο Β ενώ ο Α θα παραμείνει σιωπηλός. Το αντίστοιχο ισχύει και για τον παίκτη Β. Είναι λοιπόν φανερό πως οτιδήποτε και να σκοπεύει να κάνει ο Β, ο παίκτης Α θα πρέπει να επιλέξει την πρώτη στρατηγική(να ομολογήσει δηλαδή), αφού έτσι θα έχει καλύτερα αποτελέσματα. Ομοίως ισχύει και για τον Β παίκτη ο οποίος θα προτιμήσει και αυτός να μη μιλήσει. Σε αυτό το σημείο υπάρχει το δίλημμα αφού από τον πίνακα φαίνεται πως οι παίκτες θα αποκομίσουν μεγαλύτερο όφελος αν και οι δύο επιλέξουν να μη μιλήσουν από το να τα ομολογήσουν όλα. . Έτσι η καλύτερη στρατηγική για τον καθένα ξεχωριστά, παράγει ένα αποτέλεσμα που δεν είναι καλό για την ομάδα, κάνοντας τα ατομικά κίνητρα να υπονομεύουν το κοινό συμφέρον.

Πρόκειται για ένα παιχνίδι όπου τα κέρδη προέρχονται από τη συνεργασία.

Το καλύτερο αποτέλεσμα και για τους δύο παίκτες είναι να μη μιλήσουν στους αστυνομικούς . Παρόλα αυτά, κάθε παίκτης έχει ένα μεγάλο κίνητρο να γίνει προδότης. Οτιδήποτε και να κάνει ο ένας παίκτης, ο αντίπαλος προτιμάει να ομολογήσει. Σε κάθε παίγνιο η λύση παρουσιάζεται και με τη βοήθεια του προγράμματος Gambit, το οποίο είναι χρήσιμο εργαλείο στη θεωρία παιγνίων αφού έχει πολλές εφαρμογές και βρίσκει τις ισορροπίες Nash και σε καθαρές και σε μεικτές στρατηγικές.

Το κοινό στοιχείο σε όλα αυτά τα παραδείγματα είναι ότι αν ο καθένας δράσει συνεργατικά θα υπάρξει το καλύτερο αποτέλεσμα. Δυστυχώς σχεδόν όλοι σκέφτονται μόνο το προσωπικό συμφέρον, με αποτέλεσμα να οδηγηθούν σε μη επιθυμητά αποτελέσματα

2.3.2 Η μάχη των φύλων “Battle of the Sexes”

Το παίγνιο “battle of the sexes” (η μάχη των φύλων) αποτελεί ένα από τα κλασσικά παιχνίδια στη θεωρία παιγνίων. Στην παραδοσιακή ανάλυση του παιχνιδιού, το οποίο χρονολογείται από τη δεκαετία του `50, ένας άντρα και μια γυναίκα προσπαθούν να αποφασίσουν πως θα περάσουν το απόγευμα τους. Ο άντρας προτιμά να μείνουν σπίτι και να δούνε τον αγώνα που έχει στην τηλεόραση, ενώ η γυναίκα προτιμά να πάνε στην όπερα. Και οι δύο όμως θέλουν να κάνουν κάτι μαζί και όχι να μείνουν χώρια.

Η μάχη των φύλων παρουσιάζει μια κατάσταση κατά την οποία το ζευγάρι πρέπει να συνεργαστεί, αν και έχουν διαφορετικές προτιμήσεις, αφού σε καμία περίπτωση δεν θέλουν να μείνουν χώρια. Πρόκειται για συνεργατικό και όχι ανταγωνιστικό παίγνιο. Εδώ μας ενδιαφέρει ο αντίπαλος να μάθει τη στρατηγική που πρόκειται να εφαρμόσουμε, γιατί μπορεί να τη χρησιμοποιήσει για κοινό μας όφελος.

Αν και το παιχνίδι ανήκει στην κατηγορία των παιχνιδιών που παίζονται ταυτόχρονα, δεν είναι αναγκαίο για τους παίκτες να δράσουν έτσι. Το μόνο που απαιτείται είναι ο καθένας να δράσει χωρίς γνώση για το πώς θα πράξει ο άλλος. Αυτό επιτυγχάνεται αν οι παίκτες πάρουν την απόφαση τους χωρίς προηγουμένως να έχουν μιλήσει. Είναι μη ρεαλιστικό να υποθέσουμε πως το ζευγάρι δεν θα το συζητήσει και δεν θα παιχτεί το ίδιο «έργο» πολλές φορές . Αν κάθε μέρα έχουν να πάρουν μια τέτοια απόφαση (επαναλαμβανόμενο παίγνιο) τότε σίγουρα ο ένας θα μπορεί να μαντέψει τις κινήσεις του άλλου.

Σημαντικό ρόλο σε αυτό το παιχνίδι έχει το ποιος θα παίξει πρώτος και θα ανακοινώσει την απόφαση του στο ταίρι του. Αν για παράδειγμα η γυναίκα έχει αγοράσει από πριν τα εισιτήρια για την όπερα, είναι πολύ πιθανό ο άντρας να πεισθεί και να επιλέξει από την αρχή να πάνε στην όπερα παρόλο που θα προτιμούσε τον αγώνα. Σε πάρα πολλά παιχνίδια (όχι σε όλα) αυτός που κινείται πρώτος έχει και το μεγαλύτερο πλεονέκτημα. […]

2.3.4 Το κλασσικό παιχνίδι κυριαρχίας κινδύνου “Risk Dominance”

Το παίγνιο που χρησιμοποιήθηκε προηγουμένως στην εργασία για να γίνει καλύτερη η κατανόηση διαφόρων ορισμών της θεωρίας παιγνίων, αποτελεί ένα κλασσικό παιχνίδι κυριαρχίας κινδύνου (risk dominance). Αν και φαίνεται καθαρά πως η λύση αποτελεί σημείο ισορροπίας, εντούτοις η ύπαρξη αρνητικής ωφέλειας στο κελί προκαλεί φόβο στον εκάστοτε παίκτη Α ο οποίος προτιμάει να διαλέξει την αντίθετη στρατηγική ώστε να μην υπάρχει καμιά περίπτωση να πέσει πάνω σε αρνητικό κέρδος. Ούτε όμως για τον παίκτη Β συμφέρει να επιλέξει την β2 στρατηγική αφού το κέρδος του είναι μικρότερο όποια στρατηγική και να επιλέξει ο Α παίκτης.

Το παίγνιο αυτό χρησιμοποιήθηκε για να παρατηρηθεί αν οι παίκτες θα σκεφτούν να ρισκάρουν διαλέγοντας τη σωστή στρατηγική, ή θα φοβηθούν και θα συμβιβαστούν με τα “λίγα”

2.3.3 Το παίγνιο “Chicken Game”

Ένα από τα πιο γνωστά παίγνια είναι το Chicken Game. Το παιγνίδι αυτό είναι γνωστό σε όλους τους νεαρούς ,από τη δεκαετία του `50 και μετά στην Αμερική και έχει μείνει στην ιστορία από την ταινία «Επαναστάτης χωρίς αιτία»(Rebel without a cause,1955) με τον James Dean. Σε αυτό το παιχνίδι δύο οδηγοί κατευθύνονται με μεγάλη ταχύτητα προς έναν γκρεμό. Αυτός που θα αλλάξει πρώτος την πορεία του αυτοκινήτου του για να μην πέσει από τον γκρεμό είναι το «κοτόπουλο» (chicken) και χάνει. Αν κανένας παίκτης δεν αλλάξει πορεία, τότε και τα δύο αυτοκίνητα θα πέσουν από τον γκρεμό και οι δύο οδηγοί θα πεθάνουν.

Κάθε παίκτης έχει δύο στρατηγικές επιλογές: είτε να αποκλίνει από την πορεία του(δεύτερη στρατηγική), είτε να συνεχίσει να οδηγεί(πρώτη στρατηγική). Αν και οι δύο αποκλίνουν παραμένουν στη ζωή. Το πώς θα παίξουν εξαρτάται από το τι πιστεύει ο ένας πως θα πράξει ο άλλος. Αν ο παίκτης Α πιστεύει πως ο παίκτης Β είναι πιο γενναίος από αυτόν, τότε θα προτιμήσει να αλλάξει πορεία. Αντίθετα αν νομίζει πως ο ίδιος είναι πιο γενναίος, τότε θα συνεχίσει να οδηγεί. Σε περίπτωση όμως που κάποιος από τους δύο κρίνει λάθος τον αντίπαλο του θα πεθάνουν και οι δύο.

Αυτό το μοντέλο υποθέτει πως ο κάθε παίκτης διαλέγει από πριν την στρατηγική που θα ακολουθήσει και δεν την αλλάζει (πρόκειται για μη ρεαλιστικό σενάριο, αφού αν κάποιος παίκτης δει τον άλλον να στρίβει ότι και να είχε σχεδιάσει, θα συνεχίσει για να κερδίσει). Επίσης το μοντέλο υποθέτει πως αν και οι δύο οδηγοί στρίψουν, δεν θα είναι προς την ίδια κατεύθυνση.

Αυτό το μοντέλο δεν έχει κυρίαρχη στρατηγική για κανέναν παίκτη. Υπάρχουν δύο ισορροπίες Nash σε αμιγείς στρατηγικές. Άρα το καλύτερο που έχει να κάνει ο κάθε παίκτης είναι το αντίθετο του αντιπάλου του. Αν ο Α πεισθεί πως ο Β θα συνεχίσει να οδηγεί, η καλύτερη λύση είναι να αλλάξει πορεία και το ανάποδο. Φυσικά αν και οι δύο δεν αλλάξουν πορεία και συνεχίσουν θα πεθάνουν. […]

2.3.5 Το παίγνιο “Matching Pennies”

Το τελευταίο παίγνιο ονομάζεται matching pennies και μελετήθηκε για πρώτη φορά από τον von Neumann(1928). Υπάρχουν δύο παίκτες με ένα κέρμα ο καθένας. Πρέπει ταυτόχρονα και οι δύο να διαλέξουν κορώνα (head) ή γράμμα (tail) γνωρίζοντας ότι αν τα δύο νομίσματα ταιριάζουν (δείχνουν δηλαδή και τα δύο ή κορώνα ή γράμμα), ο παίκτης Α κερδίζει ένα ευρώ από τον παίκτη Β. Αν τα νομίσματα δεν ταιριάζουν, τότε ο Β παίκτης κερδίζει και παίρνει από τον Α ένα ευρώ. ∆ηλαδή το νόμισμα που κερδίζει ο ένας παίκτης, το χάνει ο άλλος.

(Διαβάστε όλα τα κεφάλαια, ερωτηματολόγιο και βιβλιογραφία στην πηγή)