Bridging statistical and prosodic cues: neural correlates of speech segmentation
Rodrigues, Ana Cláudia Macedo
Diversos
Tanto as probabilidades transacionais (PT - probabilidade de uma silaba se seguir a outra numa língua) quanto as pistas prosódicas (i.e., pitch, ritmo) são relevantes para a segmentação do discurso, no entanto, a sua interação permanece pouco compreendida. Este estudo visou explorar a combinação destes fatores na segmentação do discurso, mais próxima da linguagem natural por meio do aumento de entropia (diminuição da previsibilidade) e explorar também os neurocorrelatos desta interação.
Foi utilizada uma tarefa de aprendizagem estatística - exposição auditiva dos participantes a uma linguagem artificial com PT s implícitas, que evidenciam palavras na sua estrutura - com modulação adicional de pitch (fixo e variável). A aprendizagem das palavras presentes foi avaliada através de uma tarefa de decisão lexical, analisada através da Teoria da Deteção de Sinal, permitindo medir a exatidão, sensibilidade (d') e o viés de resposta (c). Adicionalmente, foram recolhidos dados neurofisiológicos (EEG) durante a audição como medida online de aprendizagem. Foram analisados os componentes de onda N100 e P200.
Os resultados, tanto comportamentais quanto neurais, evidenciaram um favorecimento da segmentação do discurso na presença de pistas prosódicas, quando coincidem com a língua nativa. O destaque da condição de pitch variável, aponta para um efeito facilitador da entropia.
Both transitional probabilities (TP – the probability of one syllable following another in a language) and prosodic cues (i.e., pitch, rhythm) are relevant for speech segmentation; however, their interaction remains poorly understood. This study aimed to explore the combination of these factors in speech segmentation, in a context closer to natural language, by increasing entropy (i.e., decreasing predictability), and to further investigate the neural correlates of this interaction.
A statistical learning task was used — participants were exposed to an artificial language with implicit TPs that indicated word boundaries — with an additional pitch modulation {fixed vs. variable). Word learning was assessed through a lexical decision task, analyzed using Signal Detection Theory, allowing for the measurement of accuracy, sensitivity (d’), and response bias (c). Additionally, neurophysiological data (EEG) were collected during the auditory exposure as an online measure of learning. The N100 and P200 event-related potential components were analyzed.
The results, both behavioral and neural, showed an enhancement in speech segmentation in the presence of prosodic cues, particularly when they aligned with the native language. The prominence of the variable pitch condition suggests a facilitating effect of entropy.