Passar para o conteúdo principal

Experiments on temporal learning : from intra and interdimensional gradients to a generalization-based account of complex behavior

Experiments on temporal learning : from intra and interdimensional gradients to a generalization-based account of complex behavior

Castro, Ana Catarina Gonçalves Vieira de

| 2013 | URI

Tese

Tese de doutoramento em Psicologia
(área de especialização em Psicologia Experimental e
Ciências Cognitivas)
In a temporal double bisection task pigeons learn two temporal discriminations.
They learn to choose Red over Green after 1-s samples and Green over Red after 4-s
samples (Type 1 discrimination) and to choose Blue over Yellow after 4-s samples and
Yellow over Blue after 16-s samples (Type 2 discrimination). Subsequently, pigeons
choose between Green and Blue after samples ranging from 1 to 16 s and, even though
the two choices were previously associated with the same duration of 4 s, the
probability of choosing Green increases with sample duration – the context effect. This
complex result seems to suggest relational learning because Green was associated with
the longer sample in the Type 1 discrimination and Blue was associated with the shorter
sample in the Type 2 discrimination.
The first goal of this thesis was to investigate whether the context effect could be
explained from the combination of the temporal generalization gradients for Green and
Blue induced by the discriminative training in a double bisection task, following a
strategy used in other stimulus dimensions. The timing model Learning-to-Time (LeT)
instantiates this generalization-based account of the context effect. The second goal of
this thesis was to investigate whether both the temporal generalization gradients and the
context effect were consistent with LeT.
In contrast to more familiar stimulus dimensions, such as light wavelength or
tone frequency, little research has been directed to the study of generalization gradients
in the temporal domain. Little is known about their features and the variables that affect
them. The third goal of this thesis was to explore the effects of different training
protocols, namely the intradimensional and interdimensional protocols, on the temporal
generalization gradient.
The thesis comprises three studies. Study 1 and Study 2 addressed the first two
goals and also investigated the shape of intradimensional temporal generalization
gradients. Study 3 explored the effects of interdimensional training on the temporal
generalization gradient. In Study 1, pigeons learned a simplified version of the double bisection task,
whereby only the two responses critical to the context effect, Green and Blue, were
trained. Namely, pigeons learned to peck Green after 4 s but not to peck it after 1 s and
to peck Blue after 4 s but not to peck it after 16 s. Next, temporal generalization
gradients for Green and Blue were obtained by varying the sample duration from 1 to
16 s. Finally, pigeons were given a choice between Green and Blue after samples
ranging from 1 to 16 s.
Study 2 extended Study 1 to a standard double bisection task and, additionally, it
involved testing with durations outside the training range. First, pigeons learned to
choose Red over Green after 2 s and Green over Red after 6 s and to choose Blue over
Yellow after 6 s and Yellow over Blue after 18 s. Second, sample duration was varied
from 0.7 to 51.4 s and temporal generalization gradients for Green (over Red) and for
Blue (over Yellow) were obtained. And third, pigeons were given a choice between
Green and Blue after samples ranging from 0.7 to 51.4 s.
The results of the two studies showed that a) the generalization gradients for
Green and Blue were either ramp-like or bitonic; b) the preference for Green over Blue
increased with sample duration – the context effect; c) the two generalization gradients
predicted the observed context effect well; and d) the LeT model accounted for the
major trends in the data.
In Study 3 pigeons were trained to discriminate the presence and the absence of
a t-s sample: they learned to choose Green after the illumination of a houselight for t s
and to choose Red after a period in the darkness. Subsequently, the houselight duration
was varied and the preference for Green was assessed to obtain temporal generalization
gradients. The results showed negative-exponential-like temporal generalization
gradients, with proportion Green increasing with houselight duration from the shortest
test duration to t s and remaining high for longer durations. Additionally, these gradients
were shown from the beginning of testing, suggesting that temporal control can be
established without explicit discrimination training along the temporal continuum.
Together the three studies showed that phenomena observed in more familiar
stimulus dimensions also occur in the temporal domain.
Numa tarefa de dupla bissecção temporal, pombos aprendem duas
discriminações temporais. Na discriminação Tipo 1, dada uma escolha entre Vermelho e
Verde, aprendem a escolher Vermelho após amostras de 1 s e Verde após amostras de
4 s. Na discriminação Tipo 2, dada uma escolha entre Azul e Amarelo, aprendem a
escolher Azul após amostras de 4 s e Amarelo após amostras de 16 s. Numa fase
posterior, os animais têm de escolher entre Verde e Azul após amostras de 1 a 16 s e,
apesar de as duas escolhas terem sido previamente associadas com a mesma duração de
4 s, a probabilidade de escolher Verde aumenta com a duração da amostra – o efeito de
contexto. Este resultado complexo parece sugerir aprendizagem relacional, porque
Verde foi associado com a amostra mais longa na discriminação Tipo 1 e Azul com a
amostra mais curta na discriminação Tipo 2.
O primeiro objectivo desta tese foi investigar se o efeito de contexto poderia ser
explicado a partir da combinação dos gradientes de generalização temporal para o Verde
e para o Azul induzidos pelo treino discriminativo numa tarefa de dupla bissecção,
seguindo uma estratégia utilizada noutras dimensões do estímulo. O modelo de timing
Learning-to-Time (LeT) instancia esta explicação do efeito de contexto baseada em
gradientes. O segundo objectivo desta tese foi investigar se tanto os gradientes de
generalização temporal como o efeito de contexto seriam consistentes com o LeT.
Ao contrário do que acontece com dimensões do estímulo mais familiares, como
o comprimento de onda da luz ou a frequência do som, a investigação sobre os
gradientes de generalização no domínio temporal é escassa. Pouco se sabe sobre as suas
características e as variáveis que os afectam. Neste quadro, o terceiro objectivo desta
tese foi explorar os efeitos de diferentes protocolos de treino, nomeadamente os
protocolos intradimensional e interdimensional, no gradiente de generalização temporal.
A tese comporta 3 estudos. O Estudo 1 e o Estudo 2 foram conduzidos para
alcançar os dois primeiros objectivos e também para investigar a forma dos gradientes de generalização temporal intradimensionais. O Estudo 3 foi conduzido para explorar os
efeitos do treino interdimensional no gradiente de generalização temporal.
No Estudo 1, pombos aprenderam uma versão simplificada da dupla bissecção,
na qual apenas as duas respostas críticas para o efeito de contexto, Verde e Azul, foram
treinadas. Nomeadamente, pombos aprenderam a bicar Verde após 4 s mas a não bicar
Verde após 1 s e a bicar Azul após 4 s mas a não bicar Azul após 16 s. De seguida
foram obtidos gradientes de generalização temporal para o Verde e para o Azul,
variando a duração da amostra de 1 a 16 s. Por fim, os pombos tiveram de escolher entre
Verde e Azul após amostras que variaram entre 1 e 16 s.
O Estudo 2 alargou o Estudo 1 a uma tarefa de dupla bissecção padrão e,
adicionalmente, usou durações de teste para além das durações de treino. Em primeiro
lugar, os pombos aprenderam, dada uma escolha entre Vermelho e Verde, a escolher
Vermelho após 2 s e Verde após 6 s e, dada uma escolha entre Azul e Amarelo, a
escolher Azul após 6 s e Amarelo após 18 s. De seguida, variou-se a duração da amostra
entre 0.7 e 51.4 s e foram obtidos gradientes de generalização temporal para o Verde
(em relação ao Vermelho) e para o Azul (em relação ao Amarelo). Por fim, os animais
tiveram de escolher entre Verde e Azul após amostras que variaram de 0.7 a 51.4 s.
Os resultados dos dois estudos mostraram que a) os gradientes de generalização
para o Verde e para o Azul demonstraram uma forma de função em rampa ou bitónica;
b) a preferência pelo Verde sobre o Azul aumentou com a duração da amostra – efeito
de contexto; c) os dois gradientes de generalização previram bem o efeito de contexto
observado; e d) o modelo LeT explicou as principais tendências dos dados.
No Estudo 3, pombos foram treinados a discriminar entre a presença e a
ausência de uma amostra de t s: aprenderam a escolher Verde após uma luz se acender
por t s e a escolher Vermelho após um período de tempo no escuro. De seguida, para
obter gradientes de generalização temporal, variou-se a duração da luz e mediu-se a
preferência pelo Verde. Os resultados mostraram gradientes de generalização temporal
em forma de função exponencial negativa, com a proporção de escolhas do Verde a
aumentar com a duração da amostra desde a duração de teste mais curta até t s e a
manter-se elevada para durações mais longas. Adicionalmente os pombos mostraram
estes gradientes desde o início do teste, sugerindo que controlo temporal pode ser
estabelecido sem treino discriminativo explícito no contínuo temporal.
Em conjunto, os três estudos mostraram que fenómenos observados em
dimensões mais familiares do estímulo também ocorrem no domínio temporal.

Publicação

Ano de Publicação: 2013

Identificadores

ISBN: 101388764