O Reforço
Até
agora vimos que o comportamento pode ser explicado por dois tipos de paradigma:
o respondente e o operante. O comportamento respondente caracteriza-se por uma
relação organismo-ambiente (contingência) em que um estímulo elicia uma
resposta. Esta contingência é explicada apenas com dois termos S →
R e esclarece como acontecem as respostas emocionais, por exemplo (Skinner,
1953). Para ilustrar, tomemos Joana como personagem. Joana ao falar em público
responde com rubor na face, ou seja, pessoas numa plateia (S) eliciam (→)
rubor na face (R) de Joana. Apenas o estímulo antecedente é suficiente para
eliciar uma resposta corporal em Joana. Porém, o comportamento respondente será
explicado melhor em postagens futuras.
O comportamento operante classifica-se
como aquele que produz consequências (modificações no ambiente) e é afetado por
elas. Esse tipo de comportamento recebe esse nome, pois evidencia o fato de o
indivíduo operar sobre o meio em que vive e produzir efeitos ambientais
(Skinner, 1953). Comportamentos como, por exemplo, andar de bicicleta, ler um
livro, conversar, assistir um filme, comer, jogar baralho e etc., são
explicados pelo paradigma operante, pois todos foram aprendidos e modelados
pelas consequências ao longo da história do indivíduo que se comporta. Mas como
isso acontece?
A aprendizagem nesse tipo de
comportamento se dá pela seleção por consequências e é chamado de
condicionamento operante (Moreira e Medeiros, 2007). A contingência nesse caso
é explicada com três termos ou mais, Sd – R →
S+, sendo o primeiro termo chamado de estímulo discriminativo (Sd) que fornece
ocasião para ( – ) a ocorrência de uma resposta (R), que produz (→)
uma consequência reforçadora(S+). Por exemplo, diante de uma plateia lotada
(Sd), Joana apresenta uma palestra (R) e tem aplausos como consequência (S+), o
que reforça o seu comportamento de palestrar mais vezes futuramente.
O termo reforço refere-se a toda
consequência que age sobre o comportamento aumentando a sua probabilidade
futura. Por exemplo, Marcos, sempre que cozinha para namorada recebe beijos e
elogios como agradecimento, o que aumenta a probabilidade desse comportamento
de cozinhar voltar a ocorrer. Pedrinho, sempre que faz birra ganha atenção dos
pais, o que mantém o seu padrão mal-educado e assim por diante. As
consequências reforçadoras são aquelas que reforçam um comportamento, ou seja,
fazem com que este apareça mais vezes no ambiente. Assim, tal como na teoria da evolução de Darwin, uma resposta é selecionada naturalmente pelo ambiente, como
adaptativa para a sobrevivência de um indivíduo.
O processo do reforçamento é dividido em
positivo e negativo. O termo positivo refere-se ao conceito matemático de
adição, ou seja, algo é adicionado ao ambiente. O termo negativo refere-se à
subtração, isto é, algo é subtraído do ambiente (Skinner, 1953). Portanto, o reforço positivo é aquela
consequência que é adicionada no ambiente aumentando a probabilidade futura de
um comportamento. Por exemplo, sempre que vou a um restaurante, faço um pedido
ao garçom e sou atendida com o que solicitei, assim, a minha resposta de pedir foi
reforçada com algo que se acrescentou ao meu ambiente (Moreira e Medeiros,
2007). Diante desse histórico, é mais provável que sempre que eu esteja diante
de um garçom eu levante a mão e faça um pedido. Todo sábado à noite (Sd) Joana
liga (R) para o namorado, ele atende dizendo “alô?” (S+), o que aumenta a
probabilidade dela ligar mais vezes.
A seguir será apresentado um esquema explicativo da contingência de reforçamento positivo:
Note que a apresentação da consequência reforçadora (S+) após a resposta, retroage sobre a mesma, aumentando sua probabilidade (↑).
O reforço negativo é a consequência que
aumenta a probabilidade de uma resposta com a retirada (subtração) de um estímulo aversivo
do ambiente. Por exemplo, sempre que tomo um remédio evito uma dor de cabeça,
ou seja, a minha resposta de tomar um remédio aumenta de probabilidade sempre
que a dor é subtraída do meu ambiente. Toda vez que um cobrador (Sd) liga para
Joana, ela aperta o botão “end” do
celular (R), o que evita uma cobrança inoportuna (S–).
Note que a retirada da consequência aversiva (S–) após a resposta, retroage sobre a mesma, aumentando sua probabilidade (↑).
Assim, o organismo desde seu nascimento
vai interagindo com o ambiente e suas respostas vão sendo selecionadas,
modelando os seus comportamentos ao longo da vida. As respostas que não são
produtivas ou não são aceitas em um grupo social tendem a diminuir de
probabilidade sempre que são punidas, ou colocadas em extinção. Na próxima
postagem veremos como funciona a punição.
Por: Maíra Matos Costa
Referências Bibliográficas:
Por: Maíra Matos Costa
Referências Bibliográficas:
Moreira,
M. B. & Medeiros, C. A. (2007), Princípios
Básicos de Análise do Comportamento. Porto Alegre. Ed: Artmend.
Skinner,
B. F. (1953). Ciência e Comportamento
Humano. São Paulo: Martins Fontes.
Gostei muito da explicação
ResponderExcluirGostei muito da explicação
ResponderExcluirExcelente a explicação
ResponderExcluirÓtimo texto.
ResponderExcluir