1. Introdução
O papel da arbitrariedade e da iconicidade no sistema linguístico das línguas é palco de debates controversos na linguística. Desde a Grécia antiga, discute-se a relação entre nome, objeto e mundo. No Crátilo, de Platão (século V a.C), Hermógenes, Sócrates e Crátilo compõem a tríade primária de líderes argumentadores da arbitrariedade e da iconicidade, sendo o primeiro responsável por acreditar no aspecto estritamente arbitrário da língua; Crátilo, na outra ponta da discussão, representante do icônico e, mediando, Sócrates. Nos séculos XIX e XX, Ferdinand Saussure traz à tona sua perspectiva sobre o signo linguístico, apresentando-o como um resultado da relação arbitrária entre conceito e imagem acústica dentro do próprio sistema linguístico.
Assim, muitos dos estudos da linguística, a partir dos postulados de Saussure, adotam a arbitrariedade como um de seus pilares. Faz-se relevante destacar, entretanto, que algumas correntes teóricas estudam a iconicidade, porém a partir dos níveis morfológico, sintático e discursivo (Furtado da Cunha, 2008). A partir de tais estudos desenvolvidos sobre a iconicidade, nos últimos anos vêm surgindo algumas pesquisas relacionando o conceito de iconicidade sonora ao Simbolismo Sonoro (SS).
O SS é um fenômeno que permite observar a relação que falantes fazem entre determinados fonemas e certas categorias perceptuais, como cor, tamanho, formas, gosto, luminosidade, etc (Hinton et al., 2006; Lockwood e Dingemanse, 2015). Um exemplo desse fenômeno é o apresentado por Hirata et al. (2011 apudLockwood e Dingemanse, 2015: 4), que identificou uma relação entre luminosidade e sensibilidade sonora: consoantes desvozeadas eram identificadas mais facilmente quando apresentadas com um estímulo visual claro, e consoantes vozeadas com um estímulo visual escuro. Godoy et al. (2018: 90) resumem outras associações simbólicas identificadas por estudos prévios:
De modo geral, os achados atuais resumidos pelos autores indicam que (i) consoantes sonoras e vogais posteriores (redondas) são relacionadas à escuridão (Hirata et al., 2011), a formas curvas (Köhler, 1929) e a movimentos lentos (Cuskley, 2013), enquanto consoantes não-sonoras e vogais frontais altas foram relacionadas à luminosidade, a formas pontudas e a movimentos rápidos; (ii) vogais baixas e posteriores são associadas a objetos grandes, enquanto vogais altas e frontais são associadas a objetos pequenos (Thompson e Estes, 2011; Ohtake e Haryu, 2013); (iii) vogais altas estão associadas à vermelhidão, enquanto vogais baixas estão associadas a tons de amarelo (Moos et al., 2014); (iv) vogais mais altas e posteriores são associadas à percepção de um gosto doce, enquanto vogais baixas e mais posteriores são associadas a gostos amargos (Simner, Cuskley e Kirby, 2010) (Godoy et al. 2018: 90).
O estudo desse fenômeno é importante porque representa a possibilidade de investigar o papel da iconicidade no sistema linguístico e sua relação com a cognição humana. Além disso, Imai e Kita (2014) trazem à tona o argumento de que o SS está na base da aquisição da linguagem e, reforçando esse posicionamento, Kawahara e Breiss (2021) consideram que o SS apresenta um papel não negligenciável no aprendizado de línguas, tanto no que diz respeito à língua materna (L1) quanto à língua estrangeira (L2).
A partir de todos os resultados encontrados e da importância do entendimento maior desse fenômeno, é possível notar as diversas instâncias em que o SS ocorre e a necessidade de investigar seus diversos aspectos no que diz respeito ao Português Brasileiro (PB).
Este estudo, então, focaliza um fenômeno específico do SS, conhecido como efeito bouba-kiki, retomado e descrito na seção subsequente. Em seguida, apresentamos o experimento realizado e os resultados alcançados a partir de análise estatística.
2. O efeito bouba-kiki
Para dar início a essa discussão, temos de apresentar um dos experimentos mais clássicos na área do SS: Takete-Maluma, criado por Köhler (1929), adaptado, em seguida, com os nomes bouba-kiki por Ramachadran e Hubbard (2001). Esse experimento consiste em apresentar duas imagens lado a lado – uma com forma geométrica pontuda e outra arredondada – e os participantes devem escolher qual nome deve ser associado a elas entre bouba ou kiki (Figura 1). A metodologia geralmente utilizada, portanto, é chamada de escolha forçada, por apresentar duas formas e dois nomes os quais os participantes devem necessariamente relacionar entre si.
No que diz respeito às pesquisas realizadas sobre o efeito bouba-kiki, há diversas em diferentes línguas do mundo. Retomemos, então, algumas delas para, em seguida, enfatizar aquelas realizadas com falantes do PB.
Ramachadran e Hubbard (2001) discorrem sobre a origem da linguagem a partir da sinestesia. Os autores afirmam que o efeito bouba-kiki fornece a primeira pista para entender o surgimento das primeiras formas de linguagem humana com uma gramática própria (Ramachadran e Hubbard, 2001, p. 19). Com base nesse efeito, estudos posteriores replicaram o experimento em diferentes línguas, como inglês (Maurer et al., 2006; Nielsen e Rendall, 2011, 2013; Fort et al., 2015), japonês (Sakamoto e Watanabe, 2018) e francês (Fort et al., 2013), entre outras.
Os estudos realizados até então, além de aplicarem a escolha forçada, nem sempre analisam o mesmo grupo de segmentos, apesar de convergirem em alguns deles. Maurer et al. (2006) e Nielsen e Rendall (2011), por exemplo, criaram pseudopalavras com diversos segmentos e, entre elas, identificaram que, quando são constituídas por /t, k, i/, são mais associadas a formas pontudas, e com /g, m, b, o, u/, a formas redondas. Peiffer-Smadja (2010) destaca, além dos citados anteriormente, pseudopalavras com /p, e/ para formas pontudas. Occelli et al. (2013), por sua vez, identificam palavras com /t, z, r, k/ para formas pontudas e com /m, l, n/ para formas redondas. Fort et al. (2015), detectam pseudopalavras com /t, k/ para pontudas e com /m, l/ para redondas, além de analisarem a presença todas as vogais nas palavras criadas – sendo elas não tão significantes quanto as consoantes citadas. Drijvers et al. (2015) observam pseudopalavras com a presença /v, z, g, b/ mais associados a pontudas e aquelas com /m, l, n, r/ a redondas. Percebe-se, portanto, que a constituição dos estímulos linguísticos para essas pesquisas, cujos fonemas formadores foram anteriormente expostos, pode contrastar imensamente quando comparamos os trabalhos entre si.
Movendo o holofote para os estudos realizados sobre o SS no PB, Godoy et al. (2018) encontram indícios de que os falantes nativos do PB fazem a mesma associação do que falantes de outras línguas.
Este experimento, realizado também a partir da metodologia de escolha forçada, revela a associação de pseudopalavras constituídas pelos fonemas /t/, /k/, /p/, /e/ e /i/ a formas pontudas e pelos /m/, /l/, /b/, /o/ e /u/ a formas arredondadas. Contabilizando, então, 75% de conformidade entre as formas e os sons apresentados, além de observar também a associação de consoantes ser mais determinante para nomeação do que as vogais.
Até o momento, a metodologia de escolha forçada para esse tipo de experimento é a mais difundida (Lockwood e Dingemanse, 2015). Entretanto, é preciso ter em mente que a escolha forçada pode superestimar os resultados das pesquisas em SS, uma vez que a associação entre forma e nome é previamente designada por fonemas previamente escolhidos de acordo com a hipótese dos pesquisadores (Aveyard, 2012; Godoy et al. 2020). Além disso, Aveyard (2012) reporta que as taxas de resposta em conformidade às hipóteses de SS decaem quando há um conjunto maior de pseudopalavras apresentadas aos participantes. Assim, uma crítica comum associada a esse tipo de metodologia é que os efeitos do SS, nesse caso, podem estar diretamente associados à escolha forçada por duas formas contrastantes e duas únicas possibilidades de resposta, sem considerar, por exemplo, outras possibilidades de pseudopalavras.
Neste artigo, propomo-nos a investigar a questão por meio de outra metodologia que fuja a essas limitações. Escolhemos, então, utilizar uma tarefa experimental de nomeação livre, em que os participantes são convidados a criar pseudopalavras que soem como palavras da língua, respeitando sua fonotaxe. Assim, o participante fica livre para escolher quais fonemas associar entre os segmentos presentes no arcabouço fonológico de sua língua nativa. Kawahara et al. (2020) e Godoy et al. (2021) já utilizam a nomeação livre em um dos experimentos, mas com foco na relação entre determinados fonemas e percepção de características físicas ou psicológicas de criaturas do universo Pokémon. Nos dois estudos, o experimento de nomeação livre identificou relações que também foram atestadas em experimentos de escolha forçada, indicando a complementariedade entre essas duas metodologias.
A nossa escolha por um experimento de nomeação livre, portanto, dá-se porque pretendemos replicar o clássico efeito bouba-kiki a partir de uma metodologia ainda pouco utilizada. Os resultados de pesquisas já existentes, como em Godoy et al. (2018), indicam que falantes nativos brasileiros apresentam o efeito bouba-kiki em experimentos de escolha forçada. Agora, nosso principal questionamento é se há um padrão de utilização de determinados fonemas também quando há necessidade de criar novas palavras que soem como do PB. Diante disso, é importante explicitar que nosso estudo configura o primeiro, que saibamos, a testar o efeito bouba-kiki a partir da metodologia da nomeação livre.
A justificativa deste trabalho, então, é expandir o leque de conhecimentos e experimentos sobre o SS não apenas no que diz respeito ao PB, mas ao SS como um todo. Assim, objetivamos apresentar uma contribuição metodológica quanto à utilização da nomeação livre, uma vez que a escolha dos fonemas é inconsistente – e até arbitrária – em grande parte dos trabalhos realizados até então sobre o efeito bouba-kiki.
Além disso, ainda a partir da escolha dessa metodologia, uma segunda contribuição do trabalho é uma análise dos parâmetros sonoros possivelmente usados para assinalar relações simbólicas entre forma e som.
3. Experimento
O objetivo deste experimento é investigar se o efeito bouba-kiki aparece no comportamento de falantes nativos do PB durante uma tarefa de nomeação livre de pares de figuras. Para isso, realizamos uma pesquisa experimental, detalhada nas subseções a seguir.
Caso, na nomeação livre, os falantes também aplicarem as relações de SS, observadas em experimentos de escolha forçada para o efeito bouba-kiki, devemos encontrar o seguinte quadro para a primeira análise:
I. As consoantes oclusivas /p/, /t/, /k/ e as vogais anteriores /e/ e /i/ tendem a aparecer na nomeação de formas geométricas pontudas.
II. As consoantes bilabiais /m/, /b/, lateral /l/ e as vogais posteriores arredondadas /o/ e /u/ tendem a aparecer na nomeação de formas geométricas arredondadas.
A escolha dos fonemas apresentados foi baseada no fato de serem os mais comuns entre os estudos de escolha forçada (Lockwood e Dingemanse, 2015; Styles e Gawne, 2017). Essas hipóteses são testadas em uma primeira análise estatística descrita na seção 4.1.
Em seguida, buscamos identificar se, a partir dos parâmetros sonoros (Tabela 3) dos segmentos, é possível observar traço(s) articulatório(s) mais específico(s) para a associação entre som-imagem no PB. Os parâmetros sonoros apresentados foram baseados em Erber Johansson et al. (2021), que buscam mostrar como palavras podem ser moldadas por meio da evolução linguístico-cultural. Para tanto, os autores aplicaram um experimento semelhante ao jogo telefone sem fio, em que o primeiro participante de cada um dos cinco grupos escuta uma pseudopalavra e a repete para o próximo participante, padrão que se repete até o último participante do grupo. Quando informados que a palavra significa “pontudo”, há o aumento na produção de consoantes agudas. Logo, os resultados demonstram o potencial surgimento da iconicidade sonora a partir da evolução da língua.
Classe | Parâmetro sonoro | Grupo sonoro | Segmentos |
---|---|---|---|
Consonante | Vozeamento | Desvozeado | p, t, k, f, s, ʃ, h |
Vozeado | b, d, g, v, z, 3, m, n, ji, 1, ʎ, r, w, j | ||
Modo de articulação | Soante | m, n, ɲ, l, ʎ, r, j, w | |
Obstruinte | p, t, k, b, d, g, f, s, ʃ, v, z, ʒ, h | ||
Ponto de articulação | Agudo | n, t, d, s, z, ʃ, ʒ, l, ʎ, r, j | |
Grave | m, ɲ, p, k, b, g, f, v, w, h |
No que se refere às categorias binárias destacadas pelos autores, há três para vogais - altura (alta ou baixa), direção (anterior ou posterior) e arredondamento dos lábios (arredondada ou não arredondada) - e três para consoantes - vozeamento (vozeada ou desvozeada), modo de articulação (soante ou obstruinte) e ponto de articulação1 (grave ou aguda). Todavia, apesar de os autores analisarem tanto parâmetros de vogais quanto de consoantes, nosso foco se restringiu a analisar os parâmetros consonantais, pois a criação de categorias para as vogais acabaria gerando um número maior de comparações do que simplesmente analisar as ocorrências de cada uma das cinco vogais separadamente. Essa análise é feita na seção 4.2.
3.1. Materiais
Para que esta pesquisa fosse possível, elaboramos dois formulários com seis pares de imagens (Tabela 1). A única diferença entre os dois formulários foi a ordem de apresentação dos pares.
Todo par apresenta uma forma geométrica pontuda e outra arredondada para que o contraste seja evidente e manifeste associação a determinados sons da língua.
Os pares de imagens utilizados foram baseados em Köhler (1929) e Maurer et al. (2006) em seus experimentos (Nielsen e Rendall, 2011). As formas foram reproduzidas digitalmente, com exceção do par F, produzido diretamente no PowerPoint pelas pesquisadoras. Assim como nos pares da tabela acima, no formulário, cada par vem acompanhado de dois espaços de resposta com os números 1 e 2 para que sejam preenchidos de acordo com a imagem mostrada.
3.2. Método e participantes
Devido à situação de pandemia da COVID-19, a coleta de dados foi feita remotamente a partir de formulários elaborados na plataforma Google Forms.
Antes de iniciar a coleta oficial, realizamos uma testagem-piloto com quatro participantes, que foram orientados a seguir as instruções apresentadas em forma de texto. Os quatro informaram que não houve dificuldade em entender ou em responder a tarefa e que o tempo levado foi de 10 a 15 minutos. Como não houve mudanças após o retorno dos participantes da testagem-piloto, tais dados também foram utilizados na análise. Após o feedback dos envolvidos, divulgamos, em redes sociais e listas de e-mails, um link que levava ao experimento. Quem se interessava em participar, clicava e respondia de seu próprio dispositivo (celular, tablet, computador, etc). Ao total, foram coletados dados de 75 participantes a partir dos dois formulários, que permaneceram abertos por 24 horas.
No primeiro momento, os participantes eram apresentados ao Termo de Consentimento Livre e Esclarecido (TCLE). Em seguida, receberam as instruções do experimento, em que eram informados que 1. em cada seção há um par de imagens; 2. eles têm de nomear cada uma das imagens. Foi informado que os participantes não podiam usar ou mesclar palavras da língua portuguesa ou de outras línguas existentes. Como exemplo, apresentamos a Figura 1 e indicamos que o ideal seria evitar nomes como “Estrela”, “Starform”, “Estrelinha”, “Stelar”, etc, mas criar palavras completamente novas que soem como palavras do PB, isto é, que respeitem a fonotaxe da língua, como “Tululu”, “Sultoni”, “Goga”, “Prito” etc. Não chamamos atenção para a forma das imagens ou para diferenças específicas de cada par em nenhum momento.
Ao final, apresentamos um questionário com perguntas básicas sobre o participante, incluindo gênero, idade, se era nativo do PB e se já havia realizado alguma pesquisa sobre simbolismo sonoro ou criação de nomes. Dos 75 participantes, 29 identificaram-se como do sexo feminino, 45 do sexo masculino e 1 como ‘outro’. Todos indicaram ser falantes nativos do PB, cujas idades variaram entre 18 e 34 anos (média = 22,6; desvio-padrão = 3,5).
Após o fechamento dos formulários, as duas listas foram analisadas para a retirada de dados incoerentes com as instruções. Excluímos os dados de 6 participantes porque já haviam participado de uma pesquisa sobre simbolismo sonoro ou criação de nomes e de 5 participantes que repetiram os mesmos nomes para mais de uma figura. Os dados dos 64 participantes que restaram foram analisados seguindo os critérios descritos a seguir.
4. Anotação dos resultados
Com o intuito de analisar as formas fonológicas das palavras criadas pelos participantes, utilizamos o aplicativo silac (Oushiro, 2018) para fazer a silabificação, acentuação e transcrição fonológica.
Considerando que as transcrições fonológicas dependem da forma transcrita pelos participantes e não da forma efetivamente produzida (fonética), existem algumas regras de transcrição que seguem convenções do IPA (International Phonetic Alphabet) e algumas normas específicas. A saber: o silac (i) não diferencia vogais médias-baixas e médias-altas - [ε] e [e], por exemplo; (ii) não diferencia fenômenos variáveis do PB, como vogais que participam do processo de alçamento vocálico e variantes livres entre si – [t] e [ʧ], por exemplo. As transcrições feitas são representadas no seguinte padrão: tuR-'bu-la; ti-be-'ta-ti-ko e da-'le-do, sendo a aspa simples antes de uma das sílabas a marcação de tonicidade.
Durante a análise dos dados, foram descartados aqueles que não seguiam as instruções dadas aos participantes. Para determinar esse descarte, estabelecemos quatro categorias de eliminação: (i) ortografia; (ii) onomatopeia; (iii) palavra do PB e (iv) outro. A primeira categoria corresponde a itens que não seguem uma representação gráfica que respeita as regras de organização de segmentos de PB ou que não há como ter certeza dos fonemas referentes às letras escolhidas. A segunda, como o próprio nome indica, faz referência a itens que o participante quis aplicar uma onomatopeia à figura. A terceira engloba os dados em que aparecem palavras já existentes no PB (e.g. peixinho e miojo) e/ou a junção de palavras (e.g. corângulo = coração + triângulo. A palavra “corângulo”, por exemplo, foi utilizada para denominar uma forma pontuda que poderia lembrar um coração formado por pequenos triângulos e, por esse motivo, o participante optou por mesclar duas palavras já conhecidas do PB. A quarta e última categoria compõe-se de itens que apresentam palavras estrangeiras, como blush, e que não seguem o padrão da fonotaxe do PB, como slapos. A Tabela 2 mostra exemplos de itens excluídos considerando essas categorias.
Critério | Exemplos de dados excluídos |
---|---|
Ortografia | Zull; tayumi; uhali |
Onomatopéia | Aaarrrhg; buarrr; ihhhh |
Palavra do PB | Peixinho; miojo; corângulo (coração + triângulo); ilusondas (ilusão + ondss) |
Outro | Blush; tutzsso; zanq; slapos |
Após essa análise, excluímos por completo os dados dos participantes que descumpriram as instruções e cujas respostas caíram em um dos quatro critérios de exclusão acima em mais de 50% das vezes. No total, descartamos 17,5% dos dados brutos, e realizamos as análises descritas a seguir em 633 nomes criados por 60 participantes (314 nomes de figuras pontudas, 319 nomes de figuras redondas).
4.1. Análise de dados: fonemas usados em estudos anteriores
Ajustamos uma série de regressões logísticas para testar se um determinado grafema teve probabilidade maior de ser usado para nomear formas pontudas ou redondas. Nossa variável resposta era sempre a ocorrência ou não do grafema em um nome, e a preditora era o tipo de forma nomeada (pontuda ou redonda).
Além disso, todos os modelos continham interceptos aleatórios por participantes e, quando permitido pelo conjunto de dados, interceptos aleatórios por item experimental. Os p-valores foram ajustados para múltiplas comparações usando o método de Tukey.
Formas pontudas tiveram maior probabilidade que formas redondas de receberem nomes que continham /p/ (b = - 0.52, SE = 0.2, p = 0.043), /t/ (b = - 0.74, SE = 0.19, p = 0.001) e /i/ (b = -0.85, SE = 0.16, p < 0.0001). Por outro lado, formas redondas tiveram maior probabilidade de receberem nomes que continham /l/ (b = 0.49, SE = 0.17, p = 0.02), /o/ (b = 0.77, SE = 0.16, p < 0.0001) e /u/ (b = 0.77, SE = 0.16, p < 0.0001).
Os fonemas /k/ (b = - 0.10, SE = 0.17, p = 0.76), /m/ (b = 0.52, SE = 0.24, p = 0.09) e /b/ (b = 0.19, SE = 0.22, p = 0.76) tiveram a mesma probabilidade de ocorrência para figuras redondas e pontudas.
4.2. Análise de dados: parâ metros sonoros associados a formas pontudas e redondas
Dando um passo além dos estudos anteriores, a análise por parâmetros sonoros é adaptada de categorias binárias utilizadas por Erben Johansson et al. (2021), em que uma consoante pode ser caracterizada como: vozeada ou desvozeada, soante ou obstruinte e aguda ou grave. Róticos em coda silábica (representados por ‘R’ no silac) não foram incluídos na análise, pois, no PB, a letra ‘r’ em posição de coda pode apresentar diferentes fones com parâmetros sonoros distintos a depender do dialeto do falante - isto é, pode ser pronunciado como um segmento velar vozeado/desvozeado ou glotal vozeado/desvozeado, por exemplo (Seara et al., 2015).
Um script contou automaticamente, para cada nome criado, quantas vogais ou consoantes se encaixavam em cada parâmetro sonoro. Por exemplo, o nome ‘daledo’ possui 3 consoantes vozeadas e 0 desvozeadas, 1 soante, 2 obstruintes, 0 graves e 3 agudas. No que se refere às vogais, possui 1 /a/, 1 /e/, 0 /i/, 1 /o/ e 0 /u/.
Inicialmente, verificamos se havia alguma diferença de comprimento entre os nomes criados para figuras pontudas e arredondadas. Dois modelos lineares mistos generalizados foram ajustados com ‘forma’ como a variável preditora, e participantes e itens como variáveis aleatórias. As variáveis-resposta foram o número de sílabas e o número de segmentos, modelados com uma distribuição zero trincada de Poisson. Os resultados mostraram que não houve diferença de comprimento em relação ao número de sílabas (b = 0,02, SE = 0,05, p = 0,58) ou segmentos (b = -0,009, SE = 0,03, p = 0,76). Portanto, optamos por prosseguir nossa análise investigando se o número total de traços específicos de segmentos (desvozeado, agudo, soante etc.) em um nome diferiria para as figuras pontudas e arredondadas.
Uma série de modelos mistos lineares generalizados foram ajustados, com o número de segmentos de interesse como variável resposta (modelado com uma distribuição de Poisson) e forma da figura como a variável preditora (nível de referência: pontudo). Os modelos também incluíam interceptações aleatórias por participantes (devido a problemas de convergência, não conseguimos incluir interceptações aleatórias por itens). Todos os p-valores foram ajustados pelo método de Tukey.
No que diz respeito às vogais, a alta anterior /i/ foi preferencialmente usada para nomear imagens pontudas (b = -0.48, SE = 0.1, p < 0.0001). Por outro lado, as vogais posteriores arredondas /o/ e /u foram significativamente mais usadas na nomeação de formas arredondadas (b = 0.43, SE = 0.09, p < 0.0001; b = 0.04, SE = 0.15, p = 0.01, respectivamente). As vogais /a/ (b = 0.007, SE = 0.09, p = 0.93) e /e/ (b = -0.15, SE = 0.11, p = 0.47) foram usadas igualmente na nomeação de ambos formatos. O gráfico 1, a seguir, exibe médias estimadas e intervalos de confiança de 95% para cada modelo.
Quanto às consoantes, no que diz respeito ao modo de articulação, as obstruintes foram mais comuns nos nomes de figuras pontudas (b = -0.31, SE = 0.06, p = 0.001), enquanto as soantes demonstraram o padrão inverso, e foram mais comuns no nome de formas redondas (b = 0.23, SE = 0.07, p = 0.01). Consoantes desvozeadas foram mais comuns nos nomes dados às figuras pontudas (b = -0.31, SE = 0.06, p < 0.0001), mas as vozeadas não foram associadas a nenhuma forma específica (b = 0.14, SE = 0.05, p = 0.07). Também não houve diferença entre os nomes das figuras pontudas e redondas quanto à distinção entre os traços grave/agudo (respectivamente, b = 0.09, SE = 0.06, p = 0.47; b = -0.14, SE = 0.05, p = 0.07). O gráfico 2 exibe as médias estimadas e os intervalos de confiança de 95% para cada modelo.
Como as consoantes desvozeadas compreendiam quase metade do conjunto das obstruintes, realizamos uma análise post-hoc para verificar se tanto as obstruintes sonoras quanto as desvozeadas eram preferencialmente usadas para nomear formas pontudas. Para esta análise, utilizamos um conjunto de dados menor (n = 602) com nomes que apresentavam pelo menos uma obstruinte. Seguindo as análises anteriores, ajustamos dois modelos lineares mistos generalizados com o número de obstruintes vozeadas e desvozeadas como variável resposta (modelado com uma distribuição de Poisson). Ambos os modelos incluíram forma como variável preditora (nível de referência: pontudo) e interceptos aleatórios para participantes. Os resultados mostraram que as formas pontudas receberam nomes com mais obstruintes desvozeadas quando comparados aos nomes de figuras redondas (b = -0,24, SE = 0,06, p = 0,0004), enquanto as obstruintes sonoras foram usadas em taxas semelhantes para figuras de ambos os tipos (b = 0,05, SE = 0,09, p = 0,58).
5. Discussão de resultados
Os resultados da análise estatística demonstram que simbolismos sonoros associados à percepção de formas em estudos anteriores também podem ser encontrados em experimentos de nomeação livre. Os fonemas /p/, /t/ e /i/ tiveram maior chance de serem usados para formas pontudas, enquanto a chance de ocorrência de /l/, /o/ e /u/ foi maior para formas redondas. Aqui, é possível ver que tanto vogais quanto consoantes estiveram associadas ao simbolismo sonoro de formas.
Contudo, alguns achados de outros trabalhos não foram corroborados por nossos resultados. Consoantes relacionadas à percepção de formas em estudos anteriores não apresentaram correlação com nenhuma das formas: é o caso dos fonemas /k/, /m/ e /b/. Esse achado merece maior discussão especialmente se pensarmos que o nome do efeito aqui testado - bouba-kiki -emprega justamente duas das consoantes cuja realização ocorreu em taxas semelhantes para formas pontudas e redondas.
Uma primeira explicação para nossos resultados seria a de que esses fonemas não estariam associados à percepção de forma. Discordamos dessa explanação não apenas porque estudos anteriores já encontraram o efeito em experimentos conduzidos com falantes de inúmeras línguas (Ćwiek et al., 2021), mas também porque o mesmo efeito já foi reportado para o português (Godoy et al., 2018; Silva e Bellini-Leite, 2020). A principal inovação do presente trabalho foi usar uma tarefa de nomeação livre, o que gera ao menos duas diferenças principais em relação aos trabalhos anteriores. Em primeiro lugar, o participante não está restrito a operar com os grafemas ou fonemas escolhidos pelo pesquisador. Com isso, tem uma gama muito mais ampla para expressar qualquer relação de simbolismo sonoro entre características perceptuais do objeto e o nome criado para ele. Portanto, é possível que o emprego de outros fonemas tenha prevalência sobre o uso de /k/, /b/ e /m/ nessa situação. Além disso, há pouca literatura sobre simbolismo sonoro em tarefas de produção. A maioria dos estudos investiga os padrões de SS com experimentos de compreensão, por meio de tarefas como escolha forçada. Essas tarefas tendem a amplificar o efeito bouba-kiki, uma vez que as escolhas feitas pelos participantes são limitadas a duas únicas possibilidades de resposta já determinadas pelo pesquisador (Aveyard, 2012), desconsiderando outros fonemas existentes na língua e presentes no arcabouço fonológico dos falantes do PB.
Em relação ao papel das consoantes nas associações multimodais entre forma e som, nossos resultados não mostram preferência no uso dos parâmetros agudo, grave ou vozeado para sinalizar diferenças de forma. Por outro lado, nossos dados confirmaram uma correlação entre consoantes soantes e formas curvas, e entre obstruintes e imagens pontiagudas. Essas correlações já foram atestadas em experimentos de escolha forçada anteriores (Nielsen e Rendall, 2011), mas aqui identificamos que os participantes empregam a distinção soante/obstruinte para sinalizar uma diferença de forma mesmo quando têm liberdade para escolher outros parâmetros sonoros. No entanto, a correlação entre obstruinte e figuras pontudas merece uma inspeção mais detalhada, principalmente se considerarmos o papel do vozeamento no estabelecimento das associações multimodais aqui estudadas.
Afinal, consoantes desvozeadas, segundo nossos dados, também foram preferencialmente usadas para nomear figuras pontudas.
Há pelo menos duas explicações possíveis para este resultado. Primeiramente, devemos considerar que o conjunto de consoantes desvozeadas é composto, em nossa análise, por um subconjunto das obstruintes. Em outras palavras, todas as consoantes desvozeadas também são obstruintes. Assim, pode-se imaginar que a associação pontudo/desvozeado seja apenas um subproduto da correlação entre obstruintes e formas pontudas da seguinte maneira: obstruintes correlacionam-se com formas pontudas, e todas as consoantes desvozeadas são obstruintes, portanto, consoantes desvozeadas correlacionam-se com figuras pontudas apenas porque são um subconjunto das obstruintes. De acordo com essa explicação, o vozeamento por si só não apresentaria correlação com a forma.
No entanto, como Ćwiek et al. (2021) apontam, pode haver uma correspondência multimodal entre a percepção de algo angular no domínio visual e as mudanças abruptas que se fazem sentir na passagem da oclusão para as altas frequências espectrais causadas por obstruintes desvozeadas. Segundo os autores, esse padrão contrasta com uma frequência fundamental mais contínua em palavras com consoantes vozeadas ou soantes, como em bouba ou maluma, cujas modulações das amplitudes acústicas são menos abruptas. Reforçando esse contraste entre obstruintes desvozeadas e soantes, Nielsen e Rendall (2011) trazem uma discussão interessante sobre a utilização delas em sistemas de comunicação de animais. Considerando situações afetivo-semânticas de primatas das mais diversas espécies, observou-se a associação de sons ásperos, turbulentos e pontuais a situações de alta excitação e muitas vezes também hostilidade e agressão, como gritos e guinchados, que tendem a apresentar inícios sonoros abruptos, assim como as consonantes obstruintes desvozeadas. Em contraste, sons mais suaves e harmônicos estão associados a situações de maior calma e de contato positivo, com inícios mais graduais e espectro de frequência tonais mais amenos, da mesma forma que a produção humana das consoantes soantes (Nielsen e Rendall, 2011). Os autores também indicam que a diferença da estrutura espectral entre obstruintes e soantes podem ser descritas em termos de aspereza/fratura (no caso das obstruintes) ou fluidez e continuidade (no caso das soantes), um fator que poderia explicar a associação som/sentido detectada para esses segmentos. Nesse sentido, a literatura indica que talvez características acústicas desses sons estejam relacionadas ao simbolismo sonoro reportado.
Isso vai ao encontro de nossa análise post-hoc, que mostrou que as obstruintes desvozeadas são preferencialmente usadas para nomear imagens pontudas, enquanto o uso de vozeadas ocorre em taxas semelhantes nos nomes de formas arredondadas ou pontudas. Portanto, nossos dados nos permitem especular que a percepção de figuras pontudas está relacionada ao pequeno subconjunto de obstruintes desvozeadas, e não obstruintes em geral.
Essa distinção entre obstruintes vozeadas e desvozeadas em nossos resultados é relevante porque pode informar pesquisas futuras sobre iconicidade.
Estudos anteriores sobre SS já usaram o contraste soante vs obstruintes vozeadas em estímulos criados, respectivamente, para formas arredondadas e pontudas (Drijvers et al., 2015). Ao mesmo tempo, essas mesmas obstruintes vozeadas foram utilizadas como estímulos para figuras arredondadas em outros trabalhos (Nielsen e Rendall, 2011; Maurer et al., 2006). Outras variáveis não controladas pelos pesquisadores podem ter desempenhado um papel nos resultados finais desses e de outros estudos, mas nossas análises mostram que o uso de obstruintes desvozeadas e soantes pode ser a melhor maneira de criar pseudopalavras com maior chance de serem associadas a formas pontudas e a formas redondas.
No que diz respeito às vogais, podemos nos fundamentar especificamente no quesito articulatório, uma vez que a associação foi perceptível: /i/, como vogal anterior não arredondada, apresentou maior chance de aparecer em pseudopalavras referentes a formas pontudas, e /o/ e /u/, vogais posteriores arredondadas, com maior chance de aparecerem naquelas que denominavam formas redondas, assim como em pesquisas anteriores (Nielsen e Rendall, 2013). O arredondamento dos lábios, nesse caso, parece ter sido o maior indicador de associação entre som-forma.
Por fim, é preciso mencionar algumas das limitações do presente trabalho. Em primeiro lugar, a tarefa experimental envolvia produção escrita, e não falada. Não há estudos contrastando a produção oral e escrita em tarefas de produção livre para identificar se haveria alguma diferença entre essas tarefas. Devido a essa limitação, nosso estudo não é capaz de lançar luz sobre efeitos da ortografia em comparação a efeitos de produção oral nesse tipo de experimento (contudo, conferir Ćwiek et al., 2021 para um estudo conduzido em 25 línguas de nove famílias diferentes e que não encontra grandes efeitos de ortografia em tarefas de escolha forçada).
Além disso, as figuras do experimento foram apresentadas em pares. A percepção de forma não é relativa como a de tamanho, mas certamente a apresentação por pares insere um elemento contrastivo que não estaria presente caso as figuras fossem apresentadas em isolamento. Se uma figura fosse apresentada sozinha, sem um par, talvez sua propriedade de ser redonda ou ser mais pontuda não se destacaria tanto, e o nome dado à forma talvez não carregasse alguns dos simbolismos sonoros detectados em nossa análise. Esta não é um grande problema para esta pesquisa, uma vez que nosso objetivo era mapear associações multimodais quando as diferenças de forma eram evidentes.
Entretanto, em estudos futuros seria interessante investigar se o uso de sons pontudos/redondos também aumenta quando essas imagens são apresentadas sem um par contrastante.
6. Conclusões
De modo geral, nosso trabalho identificou o efeito do Simbolismo Sonoro a partir da nomeação livre, uma tarefa de produção. O resultado mais específico demonstrou a associação de obstruintes desvozeadas a formas pontudas, e soantes a formas arredondadas.
Ao considerar então, a análise por meio de parâmetros sonoros (D'onofrio, 2014; Erben Johansson et al., 2021), permitimos uma análise mais específica e voltada para a associação de traços sonoros dos segmentos, e não fonemas específicos. Nesse sentido, esta pesquisa configura um resultado inédito no que diz respeito aos estudos sobre SS e o efeito bouba-kiki, além de contribuir com futuros estudos sobre o papel do SS na estruturação das línguas naturais.