I giochi ripetuti

I giochi ripetuti sono giochi che si ripetono più volte con gli stessi giocatori e le stesse azioni/strategie tra cui scegliere. Sono studiati nella teoria dei giochi.

La differenza tra giochi ripetuti e one shot. Nei giochi one-shot i giocatori si incontrano una sola volta mentre nei giochi ripetuti più volte.

Le scelte strategiche in un gioco ripetuto sono nettamente diverse rispetto a un gioco one-shot, perché ogni giocatore agisce considerando le azioni passate e future degli altri giocatori.

Generalmente, nei giochi ripetuti si utilizza una funzione di utilità additiva.

Cos'è una funzione di utilità additiva? L'utilità complessiva di un agente è determinata dalla somma algebrica delle utilità (payoff) ottenute nei singoli round.

Un esempio pratico

Uno degli esempi classici è il dilemma del prigioniero.

  • In uno scenario one-shot il dilemma del prigioniero si risolve in un equilibrio di Nash non pareto-efficiente, i due giocatori si tradiscono a vicenda subendo entrambi la condanna.
    il dilemma del prigioniero in un singolo turno ( one-shot )
  • In un gioco ripetuto, invece, se un giocatore tradisce, l'altro potrebbe punirlo nel round successivo. Nel gioco ripetuto entra in gioco la reputazione dei giocatori, basata sulle decisioni da loro prese in passato, e la punizione/reazione dell'avversario nel turno successivo.
    un esempio di dilemma del prigioniero come gioco ripetuto

Qual è l'esito finale del dilemma del prigioniero in un gioco ripetuto?

L'esito dipende dal numero dei turni nel gioco.

  • Se il gioco ha un numero fisso predefinito di turni, il gioco si conclude esattamente come in uno one shot, in un equilibrio non-pareto efficiente, perché gli agenti sono spinti comunque a tradire

    Dimostrazione. Se un gioco ha 5 turni di gioco, allora i due giocatori sono spinti a tradire al quinto turno. Sapendo che tradiranno al quinto turno, sono incentivati a tradire anche al quarto, al terzo, e così via. In conclusione, i due giocatori non cooperano e tradiscono l'avversario in ogni turno di gioco, dal primo all'ultimo.
    un esempio di dilemma del prigioniero ripetuto un numero predefinito di volte

  • Se il gioco ha un numero indefinito di turni, i giocatori sono spinti a cooperare tra loro perché non sanno qual è l'ultimo turno. Quindi, l'esito del gioco è migliore per tutti.
  • Dimostrazione. Se i giocatori non conoscono l'ultimo turno di gioco, sono disincentivati a tradire perché temono la reazione dell'avversario nel turno successivo. Quindi, cooperano tra loro in ogni turno e l'equilibrio di gioco è pareto-efficiente.
    un esempio di esito del dilemma del prigioniero se non esiste un numero predefinito di turni
    Il numero dei turni è un'incognita. Gli agenti non sono in grado di conoscere i passi rimanenti alla fine del gioco. Anche se uno dei due giocatori conoscesse il numero restante dei turni, sarebbe spinto comunque a cooperare fino all'ultimo turno, se fosse sicuro che l'avversario non lo conosca. In questo caso l'ignoranza di almeno un giocatore diventa un vantaggio per entrambi i giocatori. Una strategia vincente potrebbe consistere nel far credere all'altro di essere ignorante.

La strategia tit for tat

La strategia tit for tat ( "dente per dente" ) è una strategia vincente del dilemma del prigioniero come gioco ripetuto in un numero indefinito di volte.

Nota. In alcuni testi è anche detta "colpo su colpo". La strategia venne trovata in un esperimento condotto da Robert Axelrod negli anni '80. Per quanto sia molto semplice, questa strategia si è rivelata essere la migliore possibile.

In cosa consiste?

Nella strategia "colpo su colpo" un giocatore ripete la mossa precedente dell'avversario.

Quindi, se un giocatore tradisce, anche il suo avversario tradisce nel turno successivo. Idem, se rispetta i patti.

un esempio di strategia dente per dente

In questo modo, ogni giocatore è consapevole che il tradimento causa una situazione non pareto-efficiente nel turno successivo, ossia con payoff più basso.

Una volta compresa la strategia di reazione "leale" dell'avversario, al giocatore conviene cooperare.

Cosa significa reazione leale? Vuol dire che un eventuale tradimento viene punito una sola volta nel turno successivo. Se il giocatore torna a giocare correttamente, anche il suo avversario lo farà.

In conclusione, al giocatore conviene tradire il primo turno per capire qual è la reazione dell'altro. Poi adeguare la propria strategia nelle mosse successive.

All'avversario conviene reagire punendo il tradimento una sola volta ( reazione leale ).

Così facendo influenza il comportamento dell'altro e lo spinge a cooperare.

Nota. Se l'avversario non reagisse, il giocatore tornerebbe a tradire altre volte. Lo stesso esito si verificherebbe se l'avversario reagisse troppo ( per più turni ).

La minaccia di punizione perpetua

Un'altra strategia valida ma più rischiosa per spingere alla cooperazione è la minaccia di una punizione perpetua.

Un giocatore minaccia di attuare la punizione perpetua se l'altro tradisce.

Cosa significa punizione perpetua? Vuol dire che dopo un tradimento, nei turni successivi l'avversario tradirà sempre, non solo una volta.
un esempio pratico di punizione perpetua

In questo modo il giocatore sarà disincentivato a tradire, perché la punizione sarebbe molto alta.

In particolar modo con le funzioni di utilità additive.

Pro e contro della punizione perpetua

Questa soluzione è efficace se la minaccia è credibile ma è anche molto rischiosa, perché un giocatore potrebbe tradire involtariamente a causa di errori o imprevisti.

Inoltre, i danni complessivi della punizione perpetua sono enormi per entrambi i giocatori.

Con una funzione additiva, questa strategia potrebbe portare alla distruzione reciproca.

Esempio. In uno scenario di guerra, l'abbattimento di un aereo per errore potrebbe innescare una guerra nucleare se l'avversario adottasse la strategia della punizione perpetua. Ad esempio, nel 2015 la Turchia ha abbattuto un aereo russo al confine con la Siria in circostanze poco chiare. Se la Russia avesse adottato una strategia di punizione perpetua, sarebbe avvenuta un'escalation bellica su scala mondiale e probabilmente ora non saresti qui a leggere questa pagina web.

 


 

Segnalami un errore, un refuso o un suggerimento per migliorare gli appunti

FacebookTwitterLinkedinLinkedin
knowledge base

La teoria dei giochi

  1. Cos'è la teoria dei giochi
  2. Cos'è un gioco
  3. La matrice di payoff
  4. La strategia dominante
  5. Le strategie non dominanti
  6. Le strategie pure e miste
  7. L'equilibrio di Nash
  8. Il metodo minimax