Next: O projeto de estratégias
Up: brafman96
Previous: A imposição de convenções
O modelo estudado é frequentemente utilizado para a representação de comportamento
emergente, i.e., um comportamento que evolui com base em repetidas interações
locais entre agentes, onde cada agente pode mudar a sua estratégia com base
na realimentação provida pelas iterações precedentes.
- Definição 1:
- Um jogo g de k participantes é definido por uma
matriz M com k dimensões, de tamanho
, onde
é o número de estratégias disponíveis ao emésimo
ator. As células de M contém vetores de payoffs (números reais)
com comprimento k. Uma estratégia coletiva (i.e. o conjunto de estratégias
adotadas simultaneamente por todos os participantes em uma dada instância do
jogo) em M é uma tupla (
) na qual para cada
1 < j < k vale a relação 1
.
- Definição 2:
- Um jogo iterativo n-k-g consiste no conjunto de n
agentes e um dado jogo g de k participantes. O jogo g é
jogado repetidamente um número não previamente limitado de vezes. A cada iteração,
uma k-tupla é selecionada entre os n agentes, com base em uma
distribuição uniforme, para participar daquela instância do jogo.
- Definição 3:
- Uma estratégia coletiva de um jogo g é eficiente
se a soma dos payoffs associados for máxima.
- Definição 4:
- Seja s uma certa estratégia coletiva de um certo jogo g,
anotando-se o payoff do jogador i por
.
Conside-se uma instância de g na qual a estratégia global
foi jogada: (i) se
, define-seque a punição de i com relação a s é dada por
;
(ii) do contrário, que o benefício de i com relação a s
é dado por
.
Para o que se segue, define-se payoff malicioso mínimo como o
menor payoff garantidamente imposto pelos agentes punitivos aos
agentes maliciosos. A punição existe se o p.m.m. for menor
do que o payoff esperado pelo agente malicioso quando jogando
em acordo com as convenções sociais. Uma estratégia que garante aos agentes
maliciosos um payoff menor do que o obtido quando jogando em acordo
com as convenções é uma estratégia de punição. Assume-se
que o ganho esperado dos agentes maliciosos quando jogando entre si é
menor do que o obtido quando se joga a estratégia coletiva eficiente.
Exemplo 1: Considere-se n-2-g, onde g é o dilema
do prisioneiro com a matriz de payoff:
|
1 (C) |
2 (D) |
1 (C) |
(2,2) |
(-10,10) |
2 (D) |
(10,-10) |
(-5,-5) |
A solução eficiente ocorre quando ambos jogadores jogam a estratégia
1. Assuma-se que esta é a convenção aplicada pelo projetista original, sendo
seguida por todos agentes sob seu controle. Conhecendo a regra de comportamento,
um segundo projetista poderia programar seus agentes para que aplicassem, maliciosamente,
a estratégia 2, maximizando o seu ganho em detrimento dos agentes ajustados.
Next: O projeto de estratégias
Up: brafman96
Previous: A imposição de convenções
Carlos Mitidieri
2000-10-28