Modelo dinâmico orientado à Teoria dos Jogos.

Next: O projeto de estratégias Up: brafman96 Previous: A imposição de convenções

Modelo dinâmico orientado à Teoria dos Jogos.

O modelo estudado é frequentemente utilizado para a representação de comportamento emergente, i.e., um comportamento que evolui com base em repetidas interações locais entre agentes, onde cada agente pode mudar a sua estratégia com base na realimentação provida pelas iterações precedentes.

Definição 1:: Um jogo g de k participantes é definido por uma matriz M com k dimensões, de tamanho $n_{1}\times ...\times n_{k}$ , onde $n_{m}$ é o número de estratégias disponíveis ao emésimo ator. As células de M contém vetores de payoffs (números reais) com comprimento k. Uma estratégia coletiva (i.e. o conjunto de estratégias adotadas simultaneamente por todos os participantes em uma dada instância do jogo) em M é uma tupla ( $i_{1},...,i_{k}$ ) na qual para cada 1 < j < k vale a relação 1 $\leq i_{j}$ $\leq n_{j}$ .
Definição 2:: Um jogo iterativo n-k-g consiste no conjunto de n agentes e um dado jogo g de k participantes. O jogo g é jogado repetidamente um número não previamente limitado de vezes. A cada iteração, uma k-tupla é selecionada entre os n agentes, com base em uma distribuição uniforme, para participar daquela instância do jogo.
Definição 3:: Uma estratégia coletiva de um jogo g é eficiente se a soma dos payoffs associados for máxima.
Definição 4:: Seja s uma certa estratégia coletiva de um certo jogo g, anotando-se o payoff do jogador i por $p_{i}(s)$ . Conside-se uma instância de g na qual a estratégia global $s^{,}$ foi jogada: (i) se $p_{i}(s)\geq p_{i}(s^{,})$ , define-seque a punição de i com relação a s é dada por $p_{i}(s)-p_{i}(s^{,})$ ; (ii) do contrário, que o benefício de i com relação a s é dado por $p_{i}(s^{,})-p_{i}(s)$ .

Para o que se segue, define-se payoff malicioso mínimo como o menor payoff garantidamente imposto pelos agentes punitivos aos agentes maliciosos. A punição existe se o p.m.m. for menor do que o payoff esperado pelo agente malicioso quando jogando em acordo com as convenções sociais. Uma estratégia que garante aos agentes maliciosos um payoff menor do que o obtido quando jogando em acordo com as convenções é uma estratégia de punição. Assume-se que o ganho esperado dos agentes maliciosos quando jogando entre si é menor do que o obtido quando se joga a estratégia coletiva eficiente.

Exemplo 1: Considere-se n-2-g, onde g é o dilema do prisioneiro com a matriz de payoff:

	1 (C)	2 (D)
1 (C)	(2,2)	(-10,10)
2 (D)	(10,-10)	(-5,-5)

A solução eficiente ocorre quando ambos jogadores jogam a estratégia 1. Assuma-se que esta é a convenção aplicada pelo projetista original, sendo seguida por todos agentes sob seu controle. Conhecendo a regra de comportamento, um segundo projetista poderia programar seus agentes para que aplicassem, maliciosamente, a estratégia 2, maximizando o seu ganho em detrimento dos agentes ajustados.

Next: O projeto de estratégias Up: brafman96 Previous: A imposição de convenções

Carlos Mitidieri
2000-10-28