Η Θεωρία Παιγνίων
ΕΜΠΕΙΡΙΚΗ ΠΡΟΣΕΓΓΙΣΗ ΤΗΣ NASH ΙΣΟΡΡΟΠΙΑΣ
Περιεχόμενα
- Η Θεωρία Παιγνίων
- ΠΕΡΙΛΗΨΗ
- Θεωρητική ανάλυση της θεωρίας παιγνίων
- 1.1 Τι είναι θεωρία παιγνίων
- 1.2 Ιστορική αναδρομή
- 1.3 Εφαρμογές στην καθημερινή ζωή
- 1.5 Κατηγορίες παιγνίων
- 1.4 Βασικές έννοιες της θεωρίας παιγνίων
- 2. Η ισορροπία Nash
- 2.1 Η ζωή του John Nash
- 2.2 Προσέγγιση της ισορροπίας Nash
- 2.3 Εξέταση διαφόρων παιγνίων
- 2.3.1 Το δίλημμα του φυλακισμένου “Prisoner’s dilemma”
- 2.3.2 Η μάχη των φύλων “Battle of the Sexes”
- 2.3.4 Το κλασσικό παιχνίδι κυριαρχίας κινδύνου “Risk Dominance”
- 2.3.3 Το παίγνιο “Chicken Game”
ΠΕΡΙΛΗΨΗ
Στη συνέχεια το ενδιαφέρον εστιάζεται στην ισορροπία Nash. Περιγράφεται η έννοια της ισορροπίας που πήρε το όνομα της από τον John Nash, η ζωή του οποίου αναφέρεται συνοπτικά. Επιπλέον παρουσιάζονται πέντε από τα πιο γνωστά παίγνια τα οποία χρησιμοποιήθηκαν στην έρευνα: το δίλημμα του φυλακισμένου, η μάχη των φύλων, το chicken game, το παίγνιο κυριαρχίας κινδύνου και το matching pennies.
Στην επόμενη ενότητα αναλύονται τα αποτελέσματα της έρευνας που πραγματοποιήθηκε με τη βοήθεια φοιτητών του Πανεπιστημίου Μακεδονίας για όλα τα παραπάνω παίγνια και γίνεται σύγκριση με προηγούμενες έρευνες. Στο τέλος παρουσιάζονται τα συμπεράσματα που προέκυψαν από την εκπόνησης της συγκεκριμένης εργασίας, και τι θα μπορούσε να γίνει ώστε να επεκταθεί μελλοντικά.
Θεωρητική ανάλυση της θεωρίας παιγνίων
1.1 Τι είναι θεωρία παιγνίων
Η θεωρία παιγνίων είναι μια μεθοδολογία ανάλυσης καταστάσεων μεταξύ μιας ομάδας λογικών ατόμων η οποία ανταγωνίζεται με σκοπό ο κάθε ένας να αποκτήσει το μεγαλύτερο όφελος. Σκοπός της είναι να μας βοηθήσει να καταλάβουμε διάφορες καταστάσεις στις οποίες αλληλεπιδρούν δύο ή περισσότερες οντότητες, κάθε μία από τις οποίες συμπεριφέρεται με στρατηγικό τρόπο και προσπαθεί να πάρει κάποιες αποφάσεις. Η μεμονωμένη οντότητα στην συγκεκριμένη περίπτωση ονομάζεται παίκτης, και είναι αυτός που παίρνει αποφάσεις. Σκοπός του κάθε παίκτη είναι να μεγιστοποιήσει το κέρδος του, το οποίο μετράται σε μια κλίμακα ωφέλειας.
Επομένως το παίγνιο που αναφέρεται στην θεωρία παιγνίων αντιπροσωπεύει την κατάσταση κατά την οποία δύο ή περισσότεροι παίκτες επιλέγουν τρόπους ενέργειας, που δημιουργούν καταστάσεις αλληλεξάρτησης.
1.2 Ιστορική αναδρομή
Η πρώτη γνωστή αναφορά στη Θεωρία Παιγνίων έγινε τον 18ο αιώνα (1838) από τον Γάλλο οικονομολόγο Augustin Cournot ο οποίος κατάφερε να αναλύσει ολιγοπωλιακές καταστάσεις με τρόπο παρόμοιο με τις σύγχρονες μεθόδους της θεωρίας παιγνίων.
Ωστόσο η ουσιαστική της ανάπτυξη αποδίδεται στον Ούγγρο φυσικό και μαθηματικό, John von Neumann, ο οποίος το 1928 απέδειξε ότι τα παιχνίδια μηδενικού αθροίσματος έχουν πάντα λύση και ότι η απώλεια ενός παίκτη είναι ίση με το κέρδος του δεύτερου. Καθοριστική στην μετέπειτα ανάπτυξη της θεωρίας παιγνίων ήταν η δημοσίευση του βιβλίου “Theory of Games & Economic Behavior”, το 1944, από τους John von Neumann και Oskar Morgenstern.
Στις αρχές της δεκαετίας του 1950 ο Αμερικανός μαθηματικός και οικονομολόγος John Nash εισήγαγε μια ισορροπία για παιχνίδια μη-μηδενικού αθροίσματος, γνωστή σαν ισορροπία Nash. Πρόκειται για μια κατάσταση, όπως θα δούμε και παρακάτω, από την οποία κανέναν παίκτη δεν τον συμφέρει να απομακρυνθεί, δεδομένων των επιλογών των αντιπάλων τους. Η ζωή του έγινε θέμα της ταινίας “Ένας υπέροχος άνθρωπος” με τον Russel Crow, όχι μόνο για όλα όσα προσέφερε στη θεωρία παιγνίων, αλλά και επειδή έπασχε από σύνδρομο καταδίωξης και σχιζοφρένειας από την ηλικία των 29 ετών.
Από εκείνο το σημείο και μετά η θεωρία παιγνίων είχε αλματώδη ανάπτυξη και άρχισε να εφαρμόζεται σε όλους τους τομείς και τις πολιτικές επιστήμες, ενώ πληθώρα ερευνητικών πειραμάτων ξεκίνησαν προσπαθώντας να βρουν λύση σε όλο και περισσότερα προβλήματα. Το 1965 ο Reinhard Selten μελέτησε τα δυναμικά παίγνια(αυτά που εξελίσσονται στο χρόνο) εισάγοντας την έννοια της ισορροπίας στα υποπαίγνια (subgame perfect equilibrium) και της ισορροπίας τρεμάμενου χεριού(trembling hand perfect equilibrium), ενώ το 1975 ο John Harsanyi γενίκευσε τις ιδέες του John Nash και μελέτησε παίγνια μη-πλήρους πληροφόρησης.
Για τις εργασίες τους, οι τρεις αυτοί άνθρωποι τιμήθηκαν αργότερα, το 1994, με το βραβείο Νόμπελ της Σουηδικής Ακαδημίας Επιστημών.
Τη δεκαετία του 1970 άρχισε να εφαρμόζεται και στον κλάδο της βιολογίας, σαν αποτέλεσμα της εργασίας του John Maynard Smith σχετικά με την έννοια της “εξελικτικά σταθερής στρατηγικής”(evolutionary stable strategy).
Στα τέλη της δεκαετίας του 1990 η θεωρία παιγνίων εφαρμόστηκε στον σχεδιασμό δημοπρασιών. Πάνω σε αυτό ασχολήθηκαν διάφοροι επιστήμονες για την κατανομή δικαιωμάτων χρήσης του ηλεκτρομαγνητικού φάσματος στη βιομηχανία των κινητών τηλεπικοινωνιών.[6]
Το 2005 ο Αμερικανός επιστήμονας Tomas Schelling και ο Γερμανός θεωρητικός παιγνίων Robert Aumann κέρδισαν το βραβείο Νόμπελ για τις Οικονομικές επιστήμες “επειδή εμπλούτισαν την αντίληψη μας σχετικά με τις έννοιες του ανταγωνισμού και της συνεργασίας μέσω της παιγνιοθεωρητικής ανάλυσης ”. Τους ακολούθησαν το 2007 οι Roger Myerson, Leonid Hurwicz και Eric Maskin “για τη θεμελίωση της θεωρίας σχεδιασμού μηχανισμών”.[7]
(Διπλωματική εργασία της Βλαχοπούλου Αθανασίας – Δημοσιεύουμε αποσπάσματα μόνο, όλα τα κεφάλαια, ερωτηματολόγιο και βιβλιογραφία μπορείτε να διαβάσετε στην πηγή)
1.3 Εφαρμογές στην καθημερινή ζωή
Όπως είδαμε μέχρι τώρα και θα δούμε και παρακάτω, η θεωρία παιγνίων έχει μεγάλη γκάμα εφαρμογών. Θα λέγαμε πως όλα έχουν κάποια σχέση με την θεωρία παιγνίων αφού έχει εφαρμογές στην οικονομία, στις επιχειρήσεις, στην πληροφορική, στις τηλεπικοινωνίες, στην πολιτική, στην κοινωνιολογία, στη βιολογία και φυσικά στην καθημερινότητα.[8] Μια σύγχρονη μαθηματική θεωρία μπορεί να αναλύσει κάθε είδος αναμέτρησης, από την ντάμα και το σκάκι μέχρι τον τζόγο ή έναν πυρηνικό πόλεμο, και να προβλέψει τον νικητή.
Οι οικονομολόγοι εδώ και πολύ καιρό χρησιμοποιούν τη θεωρία παιγνίων (έχοντας ως υλικά υποστήριξης τα πέντε βραβεία Νόμπελ στα οικονομικά) για να αναλύσουν διάφορους κλάδους όπως για παράδειγμα η βιομηχανική οργάνωση, ο σχεδιασμός μηχανισμών (mechanism design) με υποκλάδο τις δημοπρασίες, τις συμφωνίες, τα ολιγοπώλια, τα μονοπώλια, (ο Γάλλος μαθηματικός Κουρνό το 1838 έγραψε το πρώτο μοντέλο δυοπωλίου ) [10] τα συστήματα για να μπορεί κάποιος να ψηφίσει και πολλά άλλα. Οι έρευνες αυτές για να πραγματοποιηθούν εστιάζουν στην ισορροπία που υπάρχει στα παιχνίδια, την οποία θα σχολιάσουμε παρακάτω.
Επιπρόσθετα παίζει σημαντικό ρόλο στην παγκόσμια διπλωματία και στις πολεμικές στρατηγικές, επηρεάζοντας τη μοίρα των διαφόρων χωρών ακόμη και αν δεν είναι άμεσα ορατό.
Χρησιμοποιείται όμως και στην Πολιτική Οικονομία και ειδικά στη θεωρία της συλλογικής δράσης (Co11ective action), όπου εξηγεί ενδεχόμενα συνεργασίας μεταξύ των παικτών. Αυτό βρίσκεται σε άμεση συσχέτιση με τον ρόλο του κράτους και των θεσμών σε θέματα συνεργασίας. Χαρακτηριστικό παράδειγμα είναι η παροχή δημόσιων αγαθών και η φορολογία.
Στη βιολογία η θεωρία παιγνίων έχει χρησιμοποιηθεί για να κατανοήσουμε διάφορα φαινόμενα. Πρωτοχρησιμοποιήθηκε για να εξηγήσει την εξέλιξη (και την σταθερότητα) της αναλογίας 1 προς 1 στα φύλα. Ο Ronald Fisher (1930) πρότεινε ότι αυτή η αναλογία είναι αποτέλεσμα εξελικτικών δυνάμεων που δρουν μεμονωμένα, προσπαθώντας να μεγιστοποιήσουν τον αριθμό των εγγονιών! Συμπληρωματικά οι επιστήμονες προσπάθησαν να εξηγήσουν την εμφάνιση της επικοινωνίας στα ζώα, ενώ ανέλυσαν και την επιθετική συμπεριφορά τους.
Είναι ξεκάθαρο ότι μπορούμε να αναφέρουμε άπειρες εφαρμογές της θεωρίας παιγνίων σε διάφορους τομείς ακόμη και στην καθημερινότητα μας, από τα πιο πολύπλοκα έως τα πιο απλά όπως για παράδειγμα πιο αυτοκίνητο να αγοράσουμε, που θα πάμε το βράδυ ή τι θα φορέσουμε. [13]
1.5 Κατηγορίες παιγνίων
Τα παίγνια μπορούν να ταξινομηθούν σε διάφορες κατηγορίες με βάση διάφορα είδη κριτηρίων. Εδώ θα προσπαθήσουμε να τα χωρίσουμε σε κάποιες κατηγορίες. Έτσι λοιπόν έχουμε τους εξής διαχωρισμούς:
Σύμφωνα με τον αριθμό των παικτών που παίρνουν μέρος. Αν υπάρχουν δύο παίκτες τότε ονομάζονται “παίγνια δύο παικτών”, ενώ αν οι παίκτες είναι περισσότεροι(έστω n), τότε έχουμε “παίγνια n παικτών”, τα οποία βέβαια δεν έχουν μελετηθεί τόσο πολύ όσο τα πρώτα. Υπάρχει φυσικά και η περίπτωση που υπάρχει μόνο ένας παίκτης έχοντας σαν αντίπαλο του “τη φύση”, όπως για παράδειγμα ισχύει στην πασιέντζα. Τα παίγνια αυτά βέβαια θεωρούνται πως ανήκουν στην πρώτη κατηγορία των παιγνίων με δύο παίκτες. [25]
Σύμφωνα με τη δυνατότητα συνεργασίας. Οι παίκτες (δύο ή περισσότεροι) πριν παίξουν το παίγνιο έχουν τη δυνατότητα να συνεργαστούν και να κάνουν συμφωνίες μεταξύ τους για τις στρατηγικές που θα ακολουθήσουν. Αυτά ονομάζονται “συνεργατικά παίγνια”(cooperative games) σε αντίθεση με τα παίγνια όπου ο παίκτης παίρνει τις αποφάσεις χωρίς να συνεννοηθεί με τους άλλους, τα οποία ονομάζονται “μη συνεργατικά ” (non cooperative games). [26]
Σύμφωνα με τα χαρακτηριστικά των αποδοχών τους. Όταν το κέρδος ενός παίκτη είναι ίσο με την απώλεια του αντιπάλου του, το παίγνιο ονομάζεται “παίγνιο μηδενικού αθροίσματος”(zero-sum games). Σε αυτά τα παίγνια το άθροισμα των αμοιβών είναι ίσο με μηδέν με αποτέλεσμα η συνεργασία για τους παίκτες να είναι ανέφικτη. Αντίστοιχα υπάρχουν “παίγνια μη-μηδενικού αθροίσματος”(non zero-sum games) στα οποία το άθροισμα των αμοιβών είναι διάφορο του μηδενός. Το κέρδος κάποιου δεν σημαίνει απαραίτητα τη ζημιά κάποιου ανταγωνιστή, και οι δύο μπορεί να κερδίσουν ή και να χάσουν αντίστοιχα. [27]
Σύμφωνα με τη σειρά που παίρνονται οι αποφάσεις. Αν οι αντίπαλοι κινηθούν ταυτόχρονα επιλέγοντας μια στρατηγική στην αρχή του παιχνιδιού, χωρίς ο ένας να γνωρίζει τι θα πράξει ο άλλος, τότε μιλάμε για “στατικό παίγνιο” ή “στρατηγικό παίγνιο” ή “παίγνιο σε κανονική μορφή”. Στην αντίθεση περίπτωση έχουμε τα “δυναμικά παίγνια” ή “παίγνια σε εκτεταμένη μορφή” όπου οι παίκτες έχουν κάποια γνώση για τις προηγούμενες ενέργειες και έτσι η σειρά με την οποία λαμβάνονται οι αποφάσεις έχει σημασία. Στα παίγνια αυτά η αναπαράσταση γίνεται με τη βοήθεια δέντρου.[28]
Σύμφωνα με τον αριθμό των στρατηγικών. Τα παίγνια σε αυτήν την κατηγορία χωρίζονται σε “πεπερασμένα” και σε “μη πεπερασμένα”. Τα πεπερασμένα παίγνια τελειώνουν σε ένα μετρήσιμο αριθμό κινήσεων, σε αντίθεση με τα άλλα τα οποία διαρκούν για άπειρες κινήσεις και ο νικητής γίνεται γνωστός αφού όλες αυτές οι κινήσεις τελειώσουν.
Τέλος σύμφωνα με την πληροφόρηση που παρέχουν. Λέμε ότι έχουμε “παίγνια πλήρους πληροφόρησης” όταν οι παίκτες είναι πλήρως ενημερωμένοι για τις κινήσεις των αντιπάλων. Έτσι μόνο τα δυναμικά παίγνια μπορεί να είναι παίγνια πλήρους πληροφόρησης, μιας και στα στατικά οι παίκτες δεν είναι ενημερωμένοι. Όταν οι παίκτες είναι μερικώς ενημερωμένοι λέμε ότι έχουμε “παίγνια ατελούς πληροφόρησης”.[29]
Όταν το κέρδος ενός παίκτη είναι ίσο με την απώλεια του αντιπάλου του, το παίγνιο ονομάζεται “παίγνιο μηδενικού αθροίσματος”
Το κέρδος κάποιου δεν σημαίνει απαραίτητα τη ζημιά κάποιου ανταγωνιστή, και οι δύο μπορεί να κερδίσουν ή και να χάσουν αντίστοιχα.
Οι παίκτες (δύο ή περισσότεροι) πριν παίξουν το παίγνιο έχουν τη δυνατότητα να συνεργαστούν και να κάνουν συμφωνίες μεταξύ τους για τις στρατηγικές που θα ακολουθήσουν. Αυτά ονομάζονται “συνεργατικά παίγνια” σε αντίθεση με τα παίγνια όπου ο παίκτης παίρνει τις αποφάσεις χωρίς να συνεννοηθεί με τους άλλους, τα οποία ονομάζονται “μη συνεργατικά ”.
Επιπρόσθετα παίζει σημαντικό ρόλο στην παγκόσμια διπλωματία και στις πολεμικές στρατηγικές, επηρεάζοντας τη μοίρα των διαφόρων χωρών ακόμη και αν δεν είναι άμεσα ορατό.
Χρησιμοποιείται και στην Πολιτική Οικονομία και ειδικά στη θεωρία της συλλογικής δράσης, όπου εξηγεί ενδεχόμενα συνεργασίας μεταξύ των παικτών, σε άμεση συσχέτιση ρόλων κράτους – θεσμών σε θέματα συνεργασίας, όπως η παροχή δημόσιων αγαθών και η φορολογία
1.4 Βασικές έννοιες της θεωρίας παιγνίων
Θεμέλιο λίθο στην θεωρία παιγνίων αποτελούν τα βασικά χαρακτηριστικά του παιγνίου. Ως στοιχεία του παιγνίου θεωρούνται το σύνολο των παικτών, το σύνολο των πιθανών ενεργειών που θα πραγματοποιήσουν οι παίκτες(οι στρατηγικές τους), οι πληροφορίες που υπάρχουν κατά τη διάρκεια του παιχνιδιού, τα αποτελέσματα που μπορεί να αποκομίσει ο παίκτης για κάθε ενέργεια του, καθώς επίσης και οι προτιμήσεις των παικτών με βάσει τα αποτελέσματα.[14] Το αποτέλεσμα που μπορεί να αποκομίσει ο παίκτης(outcome), εξαρτάται από τις στρατηγικές που θα ακολουθήσει και από τις αποδόσεις που μπορεί να λάβει. Η απόδοση (payoff), είναι η αριθμητική αποτίμηση των στόχων του, η χρησιμότητα που θα αποκτήσει όταν το παιχνίδι θα τελειώσει. [15]
Με τον όρο στρατηγική ορίζουμε το σύνολο των κανόνων σχετικά με το ποια επιλογή πρέπει να ακολουθήσει ο παίκτης, ποιες είναι οι επιλογές του στο κάθε παίγνιο ξεχωριστά, έχοντας όμως υπόψη του και όλες τις κινήσεις του αντιπάλου.
Μια διάκριση που μπορεί να γίνει στις στρατηγικές είναι σε αμιγείς^Μ^’και σε μεικτές “mixed” στρατηγικές. Μια αμιγής(καθαρή) στρατηγική είναι εκείνη στην οποία κάθε μία από τις δυνατές επιλογές που έχει ο παίκτης επιλέγεται στο ακέραιο. Αντίθετα μεικτή είναι η στρατηγική η οποία περιλαμβάνει συνδυασμό επιλογών, από τις οποίες τουλάχιστον μία επιλέγεται με μη ακέραιες τιμές.[16] Οι μεικτές στρατηγικές δηλαδή καθορίζουν ότι η στρατηγική που θα διαλέξει ο παίκτης θα επιλεγεί τυχαία από το σύνολο των καθαρών στρατηγικών που έχει, με κάποια πιθανότητα. Επομένως μια μεικτή στρατηγική είναι μια κατανομή πιθανοτήτων πάνω στις καθαρές στρατηγικές που έχει ο παίκτης. [17]
Ένα παίγνιο στο οποίο οι παίκτες παίζουν ταυτόχρονα, μπορεί να απεικονιστεί ως “κανονική”(normal) ή “στρατηγική”(strategic) μορφή χρησιμοποιώντας έναν πίνακα ο οποίος συσχετίζει τις στρατηγικές των παικτών με τις αποδόσεις που θα έχουν. [18]
Ένα στρατηγικό παιχνίδι είναι ένα μοντέλο όπου έχουμε Ν παίκτες, καθένας από τους οποίους διαλέγει μόνο μία στρατηγική, η οποία δεν αλλάζει. Σε ένα στρατηγικό παιχνίδι υπάρχουν διάφορες συμπεριφορές παικτών:
- Το παιχνίδι παίζεται μόνο μία φορά.
- Κάθε παίκτης “ξέρει” το παιχνίδι (κάθε παίκτης γνωρίζει όλες τις κινήσεις και τις αποδόσεις του παιχνιδιού).
- Οι παίκτες είναι ορθολογικοί. Ένας ορθολογικός παίκτης είναι ένας παίκτης που παίζει εγωιστικά, θέλοντας να μεγιστοποιήσει το κέρδος του στο παιχνίδι, ενώ ταυτόχρονα γνωρίζει πως και οι αντίπαλοι του είναι ορθολογιστές.
- Όλοι οι παίκτες διαλέγουν τις κινήσεις τους ταυτόχρονα χωρίς όμως να γνωρίζουν τις επιλογές των άλλων παικτών. [19]
Για να κατανοήσουμε καλύτερα την κανονική μορφή των παιγνίων, παραθέτουμε το τέταρτο παίγνιο του ερωτηματολογίου το οποίο θα χρησιμοποιήσουμε σαν παράδειγμα για να εξηγήσουμε τα στρατηγικά παίγνια. […]
Το παιχνίδι ξεκινάει και οι παίκτες διαλέγουν ταυτόχρονα μία στρατηγική. […]
Οι παίκτες πριν πάρουν κάποια απόφαση και διαλέξουν ποια στρατηγική θα ακολουθήσουν, κοιτάνε ποια στρατηγική πραγματικά τους ωφελεί, με ποια θα έχουν το μεγαλύτερο δυνατό κέρδος ότι και να κάνει ο αντίπαλος τους. Σε αυτό το σημείο η επιλογή γίνεται με βάση την κυριαρχία των στρατηγικών.
Μια στρατηγική λέμε ότι είναι κυρίαρχη “dominant” εάν για όλους τους συνδυασμούς στρατηγικών των άλλων παικτών έχει το μεγαλύτερο όφελος σε σχέση με τις υπόλοιπες. Είναι πάντα καλύτερη ότι και να κάνει ο άλλος παίκτης αφού έχει το μεγαλύτερο κέρδος σε σχέση με τις άλλες εναλλακτικές επιλογές του. Αντιθέτως μια στρατηγική χαρακτηρίζεται ως κυριαρχούμενη “dominated” όταν υπάρχει κάποια άλλη στρατηγική που είναι πάντα καλύτερη ότι και να κάνει ο άλλος παίκτης. […]
Αν κάποιος παίκτης έχει κυρίαρχη στρατηγική την ακολουθεί και τότε το παιχνίδι έχει λύση κυρίαρχης στρατηγικής. Όπως είδαμε όμως είναι πολύ πιθανό να μην υπάρχουν πάντα κυρίαρχες στρατηγικές αλλά να υπάρχουν ασθενείς κυριαρχίες
[…] Ο συνδυασμός των στρατηγικών που επιλέχθηκαν από κάθε παίκτη μας δίνει την έννοια της ισορροπίας “equilibrium”. [..] Για να βρούμε αυτήν την ισορροπία εάν υπάρχει κυρίαρχη στρατηγική για κάποιον παίκτη τότε επιλέγεται, όπως αναφέραμε και παραπάνω. Σε περίπτωση όμως που δεν υπάρχει, ο περιορισμός των κυριαρχούμενων στρατηγικών “dominated” μπορεί να οδηγήσει στη δημιουργία νέων κυριαρχούμενων στρατηγικών, οι οποίες με τη σειρά τους θα απαλειφθούν κι αυτές. Ξεκινώντας το παιχνίδι διαγράφονται μία μια οι ασθενώς κυριαρχούμενες στρατηγικές από τις επιλογές του παίκτη και αυτό συνεχίζεται μέχρι να βρεθεί μόνο μία στρατηγική για κάθε παίκτη.
Η διαδικασία αυτή ονομάζεται απαλοιφή κυριαρχούμενων στρατηγικών “Iterated Elimination of Dominated Strategies, IEDS”. Η διαδικασία αυτή είναι απολύτως λογική αφού και οι παίκτες είναι λογικοί και γνωρίζουν πως και οι αντίπαλοι τους είναι λογικοί γεγονός που δείχνει ότι κανένας από αυτούς δεν θα επιλέξει μια στρατηγική η οποία είναι ασθενώς κυριαρχούμενη. Αν απαλείψουμε μόνο κυριαρχούμενες στρατηγικές, η σειρά της απαλοιφής δεν επηρεάζει το αποτέλεσμα. Ο κίνδυνος υπάρχει μόνο αν απαλείψουμε με λάθος σειρά ασθενώς κυριαρχούμενες στρατηγικές, οδηγώντας μας σε λάθος αποτέλεσμα. Σωστή σειρά θεωρείται η ταυτόχρονη απαλοιφή για όλους τους παίκτες σε κάθε γύρο.
Η σημαντικότερη έννοια ισορροπίας στη θεωρία παιγνίων είναι η ισορροπία Nash
(Δημοσιεύουμε αποσπάσματα μόνο, όλα τα κεφάλαια, ερωτηματολόγιο και βιβλιογραφία μπορείτε να διαβάσετε στην πηγή)
2. Η ισορροπία Nash
2.1 Η ζωή του John Nash
Στους βασικούς θεμελιωτές της θεωρίας παιγνίων ανήκει ο John Nash ο οποίος εισήγαγε στα παίγνια την ιδέα της ισορροπίας η οποία χρησιμοποιείται πλέον ευρέως σε όλους τους κλάδους της σύγχρονης επιστήμης.
Ο Nash γεννήθηκε στη Δυτική Βιρτζίνια το 1928. Αν και ενδιαφερόταν για τα μαθηματικά, αποφάσισε να γίνει ηλεκτρολόγος μηχανικός όπως και ο πατέρας του. Όταν το 1945 γράφτηκε στο “Carnegie Institute of Technology” στο Pittsburgh αποφάσισε να γίνει χημικός μηχανικός, κάτι που στην πορεία δεν του άρεσε και έτσι επέστρεψε στα μαθηματικά με τα οποία ασχολήθηκε.
Όταν πήγε το 1948 στο “Princeton” ήταν ήδη ένας από τους κορυφαίους στην θεωρία παιγνίων και είχε ήδη ασχοληθεί με “προβλήματα συμφωνιών”, δηλαδή προβλήματα στα οποία οι παίκτες μοιράζονται κάποια κοινά συμφέροντα. Με τη φράση “αυτός ο άντρας είναι ιδιοφυία” περιέγραψε τον John Nash στους υπόλοιπους καθηγητές του Princeton University, ο καθηγητής R. L. Duffin.
Η σημαντικότερη του εργασία όμως ήταν αυτή που ασχολήθηκε με την ισορροπία στη θεωρία παιγνίων και χάρη στην πολύτιμη συμβολή του πήρε το όνομα “Nash ισορροπία”. Ο Nash δημοσίευσε την ιδέα του για την ισορροπία αμέσως σε ηλικία 21 ετών! Μια δισέλιδη αναφορά έγινε το 1950 στο “Proceedings of the National Academy of Sciences”. Με τίτλο “Equilibrium Points in n-Person Games”, το άρθρο δημοσίευσε περιληπτικά την ύπαρξη λύσεων για παίγνια με ν παίκτες. Επέκτεινε την έρευνα του και μια μεγαλύτερη έκδοση δημοσιεύτηκε το 1951 στο “Annals of Mathematics” με τίτλο “Non-cooperative Games”.
Αν και δεν έτυχε ευρείας υποδοχής στην αρχή, η προσέγγιση του Nash για την θεωρία παιγνίων, τον οδήγησε στην απόκτηση του βραβείου Νόμπελ στα οικονομικά το 1994. Δεν υπάρχει όμως καμιά αμφιβολία ότι η ανάπτυξη της θεωρίας παιγνίων σε όλους τους τομείς έγινε εφικτή χάρη στην ανακάλυψη του Nash.
Ο Nash σκαρφίστηκε μια γενική “λύση” για όλα τα (πεπερασμένα) παίγνια και απέδειξε ότι κάθε τέτοιο παίγνιο διαθέτει τουλάχιστον μια τέτοια λύση. Έτσι κατάφερε ένα μεγάλο χτύπημα στην απροσδιοριστία.
2.2 Προσέγγιση της ισορροπίας Nash
Το θεώρημα που διατύπωσε ο Nash και έγινε γνωστό σε όλο τον κόσμο αναφέρει πως κάθε παίγνιο με πεπερασμένο πλήθος παικτών και ενεργειών έχει τουλάχιστον ένα σημείο ισορροπίας, σύμφωνα με το οποίο όλοι οι παίκτες επιλέγουν τις πιο συμφέρουσες για αυτούς ενέργειες, γνωρίζοντας και τις επιλογές των αντιπάλων τους. Οι παίκτες σκέφτονται τι μπορεί να διαλέξει ο αντίπαλος τους, προσπαθούν να καταλάβουν τη συμπεριφορά των άλλων και επιλέγουν την στρατηγική τους σύμφωνα με αυτό. Δηλαδή η στρατηγική ενός παίκτη αποτελεί την καλύτερη αντίδραση (απόκριση) στην στρατηγική του άλλου παίκτη. Αυτός ο συνδυασμός στρατηγικών αποτελεί ισορροπία Nash.
Ο παίκτης επιλέγει εκείνη από τις δικές του στρατηγικές, η οποία είναι η καλύτερη απάντηση στην στρατηγική που νομίζει ότι θα επιλέξει ο άλλος παίκτης
Επομένως κανένας παίκτης δεν έχει κίνητρο να φύγει μονομερώς από αυτήν την ισορροπία που έχει δημιουργηθεί. Οι παίκτες καταλαβαίνουν πως βρίσκονται σε ισορροπία αν μια αλλαγή στις στρατηγικές από οποιονδήποτε από αυτούς, οδηγήσει σε χαμηλότερο κέρδος από αυτό που θα είχαν αν παρέμεναν στη σωστή στρατηγική.
Δεδομένου των επιλογών των αντιπάλων, ο παίκτης δεν έχει να κερδίσει κάποιο μεγαλύτερο όφελος και για αυτό δεν αλλάζει στρατηγική
Όπως είναι φανερό η θεωρία για την ισορροπία Nash, έχει δύο συνιστώσες: πρώτα κάθε παίκτης κάνει την επιλογή του βασιζόμενος στην ορθολογική απόφαση που προέρχεται από τις πεποιθήσεις του για το τι θα πράξει ο αντίπαλος και δεύτερον κάθε πεποίθηση του παίκτη για την επιλογή του αντιπάλου του είναι σωστή
[…] Ο Nash κατάφερε επίσης να αποδείξει πως όλα τα πεπερασμένα παίγνια εμπεριέχουν τουλάχιστον ένα σύνολο μικτών στρατηγικών (μία ανά παίκτη) που συνιστά ισορροπία Nash σε μικτές στρατηγικές (ΙΝΜΣ) Όταν υπάρχουν πολλές ισορροπίες Nash (σε καθαρές στρατηγικές), τη λύση δίνει η ισορροπία Nash σε μικτές στρατηγικές.
Ακόμη και αν δεν υπάρχει ισορροπία σε καθαρές στρατηγικές, υπάρχει μία μοναδική ισορροπία σε μικτές στρατηγικές.
Η ισορροπία σε καθαρές στρατηγικές φαίνεται πιο ελκυστική πρόταση από την ισορροπία στις μικτές, αφού δεν χρειάζεται οι παίκτες να επιλέγουν στην τύχη. Όμως από τη στιγμή που δεν υπάρχει ισορροπία σε κάθε παιχνίδι, η ισορροπία σε μικτές στρατηγικές αποκτάει μεγαλύτερη αξία αφού πλέον για κάθε παιχνίδι υπάρχει σίγουρα μία ισορροπία.
2.3 Εξέταση διαφόρων παιγνίων
Ένα από τα παράδοξα της ισορροπίας Nash που μπορεί να θεωρηθεί και σαν αδυναμία της είναι ότι σε κάποια παίγνια οι παίκτες έχουν μεγαλύτερο όφελος αν δεν διαλέξουν την ισορροπία Nash και διαλέξουν άλλη στρατηγική. Ενώ η ισορροπία Nash δίνει την ελκυστικότερη λύση για όλους τους παίκτες, οδηγώντας στο σημείο ισορροπίας, εντούτοις υπάρχουν κάποια διάσημα παίγνια που είναι εξαίρεση στον κανόνα. Κάποια από αυτά τα παίγνια χρησιμοποιήθηκαν στην έρευνα και θα αναλυθούν στη συνέχεια.
2.3.1 Το δίλημμα του φυλακισμένου “Prisoner’s dilemma”
Το πιο γνωστό και σημαντικό παίγνιο στην ιστορία της θεωρίας παιγνίων είναι το παίγνιο του διλήμματος του φυλακισμένου (Prisoner’s dilemma).
Τον Ιανουάριο του 1950 οι Melvin Dresher και Merrill Flood επινόησαν το συγκεκριμένο παίγνιο και το χρησιμοποίησαν σαν παράδειγμα στο RAND Corporation. Αργότερα όταν παρουσιάστηκε αυτό το παράδειγμα σε ένα σεμινάριο στο Stanford University, ο Albert W. Tucker σκαρφίστηκε μία ιστορία πάνω στην οποία βάσισε όλη του την διάλεξη. Το παίγνιο αυτό έμεινε από τότε στην ιστορία κάνοντας την θεωρία παιγνίων γνωστή σε όλες τις κοινωνικές επιστήμες, ενώ και πάρα πολλοί μελετητές έχουν ασχοληθεί με αυτό γράφοντας διάφορα βιβλία .
Η ιστορία του Tucker έχει ως εξής:
∆υο ύποπτοι για ένα έγκλημα συλλαμβάνονται από την αστυνομία και κρατούνται σε διαφορετικά κελιά, ώστε να μην έχουν μεταξύ τους επικοινωνία. Οι αστυνομικοί είναι σίγουροι για την ενοχή τους αλλά ελλείψει αποδεικτικών στοιχείων τους προσφέρουν μια συμφωνία: αν και οι δύο ομολογήσουν ότι διέπραξαν το έγκλημα θα καταδικαστούν μόνο σε τρία χρόνια φυλάκισης. Αν μόνο ο ένας ομολογήσει θα αφεθεί ελεύθερος ενώ ο άλλος που θα αρνηθεί θα φυλακιστεί για πέντε χρόνια. Τέλος, αν κανένας δεν ομολογήσει, και οι δύο θα περάσουνε έναν χρόνο στη φυλακή.
Το κοινό στοιχείο σε όλα αυτά τα παραδείγματα είναι ότι αν ο καθένας δράσει συνεργατικά θα υπάρξει το καλύτερο αποτέλεσμα. Δυστυχώς σχεδόν όλοι σκέφτονται μόνο το προσωπικό συμφέρον, με αποτέλεσμα να οδηγηθούν σε μη επιθυμητά αποτελέσματα
2.3.2 Η μάχη των φύλων “Battle of the Sexes”
Το παίγνιο “battle of the sexes” (η μάχη των φύλων) αποτελεί ένα από τα κλασσικά παιχνίδια στη θεωρία παιγνίων. Στην παραδοσιακή ανάλυση του παιχνιδιού, το οποίο χρονολογείται από τη δεκαετία του `50, ένας άντρα και μια γυναίκα προσπαθούν να αποφασίσουν πως θα περάσουν το απόγευμα τους. Ο άντρας προτιμά να μείνουν σπίτι και να δούνε τον αγώνα που έχει στην τηλεόραση, ενώ η γυναίκα προτιμά να πάνε στην όπερα. Και οι δύο όμως θέλουν να κάνουν κάτι μαζί και όχι να μείνουν χώρια.
Η μάχη των φύλων παρουσιάζει μια κατάσταση κατά την οποία το ζευγάρι πρέπει να συνεργαστεί, αν και έχουν διαφορετικές προτιμήσεις, αφού σε καμία περίπτωση δεν θέλουν να μείνουν χώρια. Πρόκειται για συνεργατικό και όχι ανταγωνιστικό παίγνιο. Εδώ μας ενδιαφέρει ο αντίπαλος να μάθει τη στρατηγική που πρόκειται να εφαρμόσουμε, γιατί μπορεί να τη χρησιμοποιήσει για κοινό μας όφελος.
Αν και το παιχνίδι ανήκει στην κατηγορία των παιχνιδιών που παίζονται ταυτόχρονα, δεν είναι αναγκαίο για τους παίκτες να δράσουν έτσι. Το μόνο που απαιτείται είναι ο καθένας να δράσει χωρίς γνώση για το πώς θα πράξει ο άλλος. Αυτό επιτυγχάνεται αν οι παίκτες πάρουν την απόφαση τους χωρίς προηγουμένως να έχουν μιλήσει. Είναι μη ρεαλιστικό να υποθέσουμε πως το ζευγάρι δεν θα το συζητήσει και δεν θα παιχτεί το ίδιο «έργο» πολλές φορές . Αν κάθε μέρα έχουν να πάρουν μια τέτοια απόφαση (επαναλαμβανόμενο παίγνιο) τότε σίγουρα ο ένας θα μπορεί να μαντέψει τις κινήσεις του άλλου.
Σημαντικό ρόλο σε αυτό το παιχνίδι έχει το ποιος θα παίξει πρώτος και θα ανακοινώσει την απόφαση του στο ταίρι του. Αν για παράδειγμα η γυναίκα έχει αγοράσει από πριν τα εισιτήρια για την όπερα, είναι πολύ πιθανό ο άντρας να πεισθεί και να επιλέξει από την αρχή να πάνε στην όπερα παρόλο που θα προτιμούσε τον αγώνα. Σε πάρα πολλά παιχνίδια (όχι σε όλα) αυτός που κινείται πρώτος έχει και το μεγαλύτερο πλεονέκτημα. […]
2.3.4 Το κλασσικό παιχνίδι κυριαρχίας κινδύνου “Risk Dominance”
Το παίγνιο που χρησιμοποιήθηκε προηγουμένως στην εργασία για να γίνει καλύτερη η κατανόηση διαφόρων ορισμών της θεωρίας παιγνίων, αποτελεί ένα κλασσικό παιχνίδι κυριαρχίας κινδύνου (risk dominance). Αν και φαίνεται καθαρά πως η λύση αποτελεί σημείο ισορροπίας, εντούτοις η ύπαρξη αρνητικής ωφέλειας στο κελί προκαλεί φόβο στον εκάστοτε παίκτη Α ο οποίος προτιμάει να διαλέξει την αντίθετη στρατηγική ώστε να μην υπάρχει καμιά περίπτωση να πέσει πάνω σε αρνητικό κέρδος. Ούτε όμως για τον παίκτη Β συμφέρει να επιλέξει την β2 στρατηγική αφού το κέρδος του είναι μικρότερο όποια στρατηγική και να επιλέξει ο Α παίκτης.
Το παίγνιο αυτό χρησιμοποιήθηκε για να παρατηρηθεί αν οι παίκτες θα σκεφτούν να ρισκάρουν διαλέγοντας τη σωστή στρατηγική, ή θα φοβηθούν και θα συμβιβαστούν με τα “λίγα”
2.3.3 Το παίγνιο “Chicken Game”
Ένα από τα πιο γνωστά παίγνια είναι το Chicken Game. Το παιγνίδι αυτό είναι γνωστό σε όλους τους νεαρούς ,από τη δεκαετία του `50 και μετά στην Αμερική και έχει μείνει στην ιστορία από την ταινία «Επαναστάτης χωρίς αιτία»(Rebel without a cause,1955) με τον James Dean. Σε αυτό το παιχνίδι δύο οδηγοί κατευθύνονται με μεγάλη ταχύτητα προς έναν γκρεμό. Αυτός που θα αλλάξει πρώτος την πορεία του αυτοκινήτου του για να μην πέσει από τον γκρεμό είναι το «κοτόπουλο» (chicken) και χάνει. Αν κανένας παίκτης δεν αλλάξει πορεία, τότε και τα δύο αυτοκίνητα θα πέσουν από τον γκρεμό και οι δύο οδηγοί θα πεθάνουν.
Κάθε παίκτης έχει δύο στρατηγικές επιλογές: είτε να αποκλίνει από την πορεία του(δεύτερη στρατηγική), είτε να συνεχίσει να οδηγεί(πρώτη στρατηγική). Αν και οι δύο αποκλίνουν παραμένουν στη ζωή. Το πώς θα παίξουν εξαρτάται από το τι πιστεύει ο ένας πως θα πράξει ο άλλος. Αν ο παίκτης Α πιστεύει πως ο παίκτης Β είναι πιο γενναίος από αυτόν, τότε θα προτιμήσει να αλλάξει πορεία. Αντίθετα αν νομίζει πως ο ίδιος είναι πιο γενναίος, τότε θα συνεχίσει να οδηγεί. Σε περίπτωση όμως που κάποιος από τους δύο κρίνει λάθος τον αντίπαλο του θα πεθάνουν και οι δύο.
Αυτό το μοντέλο υποθέτει πως ο κάθε παίκτης διαλέγει από πριν την στρατηγική που θα ακολουθήσει και δεν την αλλάζει (πρόκειται για μη ρεαλιστικό σενάριο, αφού αν κάποιος παίκτης δει τον άλλον να στρίβει ότι και να είχε σχεδιάσει, θα συνεχίσει για να κερδίσει). Επίσης το μοντέλο υποθέτει πως αν και οι δύο οδηγοί στρίψουν, δεν θα είναι προς την ίδια κατεύθυνση.
Αυτό το μοντέλο δεν έχει κυρίαρχη στρατηγική για κανέναν παίκτη. Υπάρχουν δύο ισορροπίες Nash σε αμιγείς στρατηγικές. Άρα το καλύτερο που έχει να κάνει ο κάθε παίκτης είναι το αντίθετο του αντιπάλου του. Αν ο Α πεισθεί πως ο Β θα συνεχίσει να οδηγεί, η καλύτερη λύση είναι να αλλάξει πορεία και το ανάποδο. Φυσικά αν και οι δύο δεν αλλάξουν πορεία και συνεχίσουν θα πεθάνουν. […]
Το τελευταίο παίγνιο ονομάζεται matching pennies και μελετήθηκε για πρώτη φορά από τον von Neumann(1928). Υπάρχουν δύο παίκτες με ένα κέρμα ο καθένας. Πρέπει ταυτόχρονα και οι δύο να διαλέξουν κορώνα (head) ή γράμμα (tail) γνωρίζοντας ότι αν τα δύο νομίσματα ταιριάζουν (δείχνουν δηλαδή και τα δύο ή κορώνα ή γράμμα), ο παίκτης Α κερδίζει ένα ευρώ από τον παίκτη Β. Αν τα νομίσματα δεν ταιριάζουν, τότε ο Β παίκτης κερδίζει και παίρνει από τον Α ένα ευρώ. ∆ηλαδή το νόμισμα που κερδίζει ο ένας παίκτης, το χάνει ο άλλος.
(Διαβάστε όλα τα κεφάλαια, ερωτηματολόγιο και βιβλιογραφία στην πηγή)