next up previous
Next: O projeto de estratégias Up: brafman96 Previous: A imposição de convenções

Modelo dinâmico orientado à Teoria dos Jogos.

O modelo estudado é frequentemente utilizado para a representação de comportamento emergente, i.e., um comportamento que evolui com base em repetidas interações locais entre agentes, onde cada agente pode mudar a sua estratégia com base na realimentação provida pelas iterações precedentes.

Definição 1:
Um jogo g de k participantes é definido por uma matriz M com k dimensões, de tamanho \( n_{1}\times ...\times n_{k} \) , onde \( n_{m} \) é o número de estratégias disponíveis ao emésimo ator. As células de M contém vetores de payoffs (números reais) com comprimento k. Uma estratégia coletiva (i.e. o conjunto de estratégias adotadas simultaneamente por todos os participantes em uma dada instância do jogo) em M é uma tupla ( \( i_{1},...,i_{k} \)) na qual para cada 1 < j < k vale a relação 1 \( \leq i_{j} \) \( \leq n_{j} \).
Definição 2:
Um jogo iterativo n-k-g consiste no conjunto de n agentes e um dado jogo g de k participantes. O jogo g é jogado repetidamente um número não previamente limitado de vezes. A cada iteração, uma k-tupla é selecionada entre os n agentes, com base em uma distribuição uniforme, para participar daquela instância do jogo.
Definição 3:
Uma estratégia coletiva de um jogo g é eficiente se a soma dos payoffs associados for máxima.
Definição 4:
Seja s uma certa estratégia coletiva de um certo jogo g, anotando-se o payoff do jogador i por \( p_{i}(s) \). Conside-se uma instância de g na qual a estratégia global \( s^{,} \) foi jogada: (i) se \( p_{i}(s)\geq p_{i}(s^{,}) \), define-seque a punição de i com relação a s é dada por \( p_{i}(s)-p_{i}(s^{,}) \); (ii) do contrário, que o benefício de i com relação a s é dado por \( p_{i}(s^{,})-p_{i}(s) \).
Para o que se segue, define-se payoff malicioso mínimo como o menor payoff garantidamente imposto pelos agentes punitivos aos agentes maliciosos. A punição existe se o p.m.m. for menor do que o payoff esperado pelo agente malicioso quando jogando em acordo com as convenções sociais. Uma estratégia que garante aos agentes maliciosos um payoff menor do que o obtido quando jogando em acordo com as convenções é uma estratégia de punição. Assume-se que o ganho esperado dos agentes maliciosos quando jogando entre si é menor do que o obtido quando se joga a estratégia coletiva eficiente.

Exemplo 1: Considere-se n-2-g, onde g é o dilema do prisioneiro com a matriz de payoff:


  1 (C) 2 (D)
1 (C) (2,2) (-10,10)
2 (D) (10,-10) (-5,-5)



A solução eficiente ocorre quando ambos jogadores jogam a estratégia 1. Assuma-se que esta é a convenção aplicada pelo projetista original, sendo seguida por todos agentes sob seu controle. Conhecendo a regra de comportamento, um segundo projetista poderia programar seus agentes para que aplicassem, maliciosamente, a estratégia 2, maximizando o seu ganho em detrimento dos agentes ajustados.


next up previous
Next: O projeto de estratégias Up: brafman96 Previous: A imposição de convenções
Carlos Mitidieri
2000-10-28