En este trabajo se investigan las características prosódicas del tonema en actos de habla asertivos (Searle, 1969) cuando expresan emociones adyacentes como la alegría, tristeza y enojo. Se consideran las variaciones acústicas en la frecuencia (F0) y la duración en las sílabas prenuclear, nuclear y postnuclear de cada enunciado. Se utiliza una prueba semicontrolada en la que se proporciona el contexto a los participantes y se induce la producción de aserciones expresadas con una determinada emoción. Los resultados indican que, si bien hay variaciones en la F0 y la duración del tonema en la expresión de las emociones elicitadas, estos parámetros resultan más efectivos en la caracterización de ciertas emociones. En este caso, la alegría en relación con el enojo y la tristeza, dado que los valores de estas últimas emociones no exceden los umbrales de percepción.

Palabras clave: Prosodia, actos de habla, aserciones, expresividad, emociones, F0, duración.

Research on the prosodic characteristics of the tone in assertive speech acts (Searle, 1969) is done in this project, when they are expressing adjacent emotions of joy, sadness, and anger. The acoustic variations in the fundamental frequency (F0) and the duration in the prenuclear, nuclear and postnuclear syllables of each statement are considered for the analysis. A semi-controlled test is used in which the context is provided to the participants and the production of assertions expressed with a certain emotion is induced. The results indicate that although there are variations in the frequency and duration of the tone in the expression of elicited emotions, these prosodic features are more effective to determine the characterization of certain emotions, as in the case of joy in relation to anger and sadness, since the values of these latter emotions do not exceed the thresholds of perception.

Keywords: Prosody, speech acts, assertions, expressiveness, emotions, F0, duration.

La prosodia puede considerarse como uno de los principales indicadores de la fuerza ilocutiva en los enunciados, es decir, de las intenciones que se expresan a través de los enunciados. De modo que los aspectos prosódicos de una emisión lingüística tienen una estrecha relación con los actos de habla, en la medida en que, en todo acto, confluyen un acto locutivo, ilocutivo y perlocutivo (Searle, 1969, 2010). La descripción prosódica de los actos de habla contribuye al reconocimiento de una posible asociación sistemática entre determinados actos y los aspectos acústicos asociados a su producción, es decir, con una posible tipología de los actos de habla a partir de la realización prosódica. En este sentido, resulta relevante identificar qué características prosódicas se asocian con actos de habla específicos para determinar de qué manera se dispone de los recursos prosódicos de una lengua al manifestar una intención comunicativa^[5] y, al mismo tiempo, cómo se distribuyen estos recursos cuando coinciden aspectos expresivos en la emisión del enunciado^[6].

El objetivo particular de este trabajo es describir las características prosódicas de los actos de habla asertivos^[7] cuando expresan emociones adyacentes asociadas con alegría, tristeza o enojo^[8] en el habla joven de Medellín, sobre la base de la observación de las diferencias asociadas con la frecuencia (F0) y con la duración en el tonema para explorar en qué medida se modifican estos parámetros acústicos en función de la expresividad.

Si bien el estudio de las características prosódicas de los actos de habla debe, idealmente, estar basado en el habla en uso (Martín Butragueño & Velásquez-Upegui, 2014), resulta necesario reconocer los parámetros prosódicos básicos de su producción en condiciones semicontroladas que sirvan de indicador para comprender su realización en situaciones comunicativas de mayor espontaneidad, en las que confluyen multiplicidad de factores sociales, contextuales y culturales que pueden hacer más complejo su análisis.

Por lo anterior, este trabajo permite evaluar aspectos metodológicos para el estudio de la prosodia en condiciones semicontroladas y validar las ventajas descriptivas que ofrece analizar diferencias prosódicas en la expresión de emociones a partir de la descripción del tonema. Se inicia con una breve revisión teórica y se expone la metodología para la recolección, selección y análisis de los datos. A continuación, se indican los resultados y, por último, se presentan la discusión y las conclusiones del estudio.

Un acto de habla puede definirse como la producción de un enunciado más el conjunto de condiciones necesarias y suficientes para llevar a cabo una intención comunicativa. Se entiende, entonces, como una acción en la que los hablantes participan y establecen relaciones con el mundo, con la sociedad y consigo mismos, y que se formaliza a través de un enunciado (Searle, 2010). Un acto de habla conlleva la realización de un acto locutivo o contenido proposicional; un acto ilocutivo o información comunicativa; y un acto perlocutivo, que se relaciona con la comprensión por parte del oyente de las intenciones del interlocutor.

De acuerdo con Searle (2010), un acto de habla asertivo se emplea para decir cómo son las cosas; por ejemplo, afirmaciones o aseveraciones, por ello tienen la dirección de ajuste palabra-a-mundo o descendente↓. Desde la perspectiva de Yule (1996) corresponden a los actos representativos con los que el hablante representa el mundo como cree que es^[9]. Este tipo de actos de habla se asocia prosódicamente con una entonación no marcada o neutra; por esta razón, resultan ideales a la hora de establecer comparaciones con otros actos de habla o, como en este caso, con modificaciones en la expresividad.

Con relación a la expresividad en los actos de habla, Martín Butragueño (2015), plantea la hipótesis de que

… actos de habla diferentes propician una construcción prosódica diferente, de modo que, como acto principal, las expresiones parecen poder reagruparse prosódicamente, mientras que, como acto adyacente, modifican aspectos del principal, al tiempo que subsisten propiedades intrínsecas de la expresividad. (p. 70)

En este sentido, la expresividad no estaría ligada de manera exclusiva a un determinado tipo de acto de habla, incluso a una modalidad enunciativa o tipo de oración, sino que obedece a la evaluación que hace el hablante de una situación específica que podría ser expresada con alegría, tristeza o enojo (Rodríguez Bravo, 2002)^[10].

Mello y Raso (2011) explican que un hablante puede realizar la misma ilocución con diferente actitud, de modo que la ilocutividad y la actitud pertenecen a planos diferentes. De acuerdo con los autores, a nivel prosódico existe una relación jerárquica entre la ilocución, la actitud y la modalidad, que posiciona la actitud como superior a la ilocución y, a su vez, la ilocución como superior a la modalidad. Además, estos autores proponen que la ilocución se marque prosódicamente en el núcleo sin afectar el resto de la unidad tonal; por el contrario, la actitud se marca en toda la unidad sin cambiar la forma de la ilocución específica.

Una de las dificultades en el estudio de la relación entre la expresividad y la prosodia es la diferenciación entre actitud y emoción (Lindblad & Allwood, 2012). La actitud ha sido considerada como un concepto general que abarca las emociones (Mello & Raso, 2011). Sin embargo, también ha sido entendida como un concepto independiente que debe diferenciarse de la emoción, esta última correspondería a un estado interno del ser humano mientras que la actitud estaría asociada con un tipo de comportamiento (Moraes, 2011; Wichman, 2000). En este sentido, Lindblad & Allwood (2012) proponen un término inclusivo «estado afectivo epistémico» (AES), para referirse a cualquier estado mental interno que pueda manifestarse tanto en una experiencia como en un comportamiento. En línea con una perspectiva más general y abarcadora, Beller (2009) habla del concepto de expresividad que define como:

Expressivity is a level of information in communication. This level groups together the external demonstrations, controlled or not, which can be attributed to uncontrolled internal states. These internal states include the emotions, feelings, attitudes, moods, and psychological states which make up the actor’s performance style. [La expresividad es un nivel de información en la comunicación. Este nivel agrupa las demostraciones externas, controladas o no, que pueden atribuirse a estados internos no controlados. Estos estados internos incluyen las emociones, sentimientos, actitudes, estados de ánimo y estados psicológicos que conforman el estilo de producción del actor]. (p. 261)

Con relación a las características prosódicas de las emociones en el español en general, Navarro Tomás (1948) ubica la entonación emocional dentro de la forma volitiva, enunciativa e interrogativa, es decir, sin grupos típicos propios de la entonación emocional que ofrezcan una estructura particular, sino más bien que utilizan los mismos esquemas, sin alterar las líneas esenciales de los enunciados, en la medida en que expresan la intensidad de la emoción mediante la adición de elementos complementarios. Por su parte, Quilis (1980-1981) resume algunas características y señala que la expresión de la tristeza estaría integrada por un registro grave + contorno plano + duración considerable + tempo lento; la de la cólera por un registro alto + contorno ascendente-descendente inestable + intensidad fuerte + tempo rápido. A propósito, Cantero (2002) menciona que a mayor expresividad, encontraremos una mayor inflexión en el contorno, como en la expresión de alegría, ansiedad o miedo, y a menor expresividad, se presentará una menor inflexión en el contorno para las emociones más neutras como la tristeza. Sosa (1999) explica que un mayor movimiento en la curva entonativa representa una mayor percepción en la expresión, entre más pequeño es el movimiento, menor el grado de expresividad emocional, aunque la configuración en sí no cambie.

Martínez & Rojas (2011) estudiaron la rabia, la alegría y la tristeza en un corpus grabado por actores venezolanos. Para la rabia y la alegría, encontraron un incremento de la F0 y la intensidad, además de un descenso de estos mismos factores. En la tristeza, se encontró un patrón muy cercano a los enunciados neutros a diferencia de la rabia y de la alegría que se alejan de este patrón. La duración silábica presentó diferencias en las tres emociones, con menor duración en la rabia, seguido por la tristeza y la alegría. En cuanto a la velocidad del habla, el número de sílabas por segundo fue menor en la rabia, seguido por la tristeza y, por último, la alegría. Estos resultados coinciden con Rodero (2011) para el español peninsular. La autora encontró un contraste entre las emociones y los niveles del tono: tonos altos para alegría, ansiedad y miedo y tonos bajos para tristeza, calma y seguridad.

Los métodos más utilizados para el estudio acústico en la expresión de emociones varían según el grado de control de la señal del habla. Entre los métodos más controlados se encuentran la grabación de actores y la lectura expresiva de material emocional, mientras que las señales menos controladas se obtienen de la producción inducida y de las ocurrencias naturales (hipnosis, películas, imaginación) de las emociones (Sherer, 2003; Francisco, Gervas & Hervas, 2005; Martínez & Rojas, 2011). De acuerdo con Francisco, Gervas & Hervas (2005), la elección del método depende del dominio del estudio que se esté realizando: «cuando se investigan las emociones extremas, es más adecuada la utilización de actores, para las emociones subyacentes se recomienda el habla natural, y en los estudios centrados en los hablantes, resulta mejor la producción inducida» (p. 294).

Los enunciados reunidos para el presente estudio provienen de una prueba semicontrolada^[11] en la que se ofrece un contexto a los hablantes y se induce la producción de aserciones expresadas con una determinada emoción (Ejemplo 1). En todos los enunciados se mantiene el mismo interlocutor ficticio y se solicita de manera explícita el tipo de emoción requerida precedida por el adjetivo indefinido mucha/o de modo que se produjera la emoción en su grado más alto (Dimos, Dick & Dellwo, 2015).

Ejemplo 1: En la empresa en la que trabajas rifaron un viaje a Lima con todos los gastos pagados y te lo ganaste. Dile con mucha alegría a tu mejor amigo que ganaste un viaje a Lima.

Para evitar la coincidencia en una misma sílaba del tono nuclear y del tono de juntura terminal, se emplearon enunciados inducidos terminados en palabra llana^[12]. Se elicitaron cuatro enunciados por cada emoción de tristeza, alegría y enojo; además, se incluyeron como distractores cinco enunciados de gusto y cinco enunciados de disgusto. Como enunciados de control se elicitaron cuatro enunciados neutros. En total, se analizaron 16 enunciados por cada hablante, cuatro enunciados por cada emoción (tristeza, alegría y enojo) y cuatro neutros.

En la muestra participaron 30 informantes (15 mujeres y 15 hombres), entre los 18 y 28 años de edad (21,6±3,4) con formación escolar a nivel universitario, todos ellos oriundos y residentes de la ciudad de Medellín, Colombia. Para validar la aceptabilidad de los contextos, se elaboró un formulario en línea en la plataforma de Google Forms que contenía los contextos empleados para ser valorados a una escala de Likert de 1 a 7. El formulario fue resuelto por 50 hablantes (25 mujeres y 25 hombres) con las mismas características sociolingüísticas de los informantes encuestados. A este grupo de jueces se les preguntaba si el contexto proporcionado favorecía la producción de la emoción requerida eligiendo de 1 para contextos completamente inaceptables a 7 para contextos completamente aceptables.

El promedio de aceptabilidad de los contextos fue de 5,66±1,65, lo que indica que los hablantes consideran relativamente aceptables los contextos para generarlas emociones elicitadas. En cuanto a las emociones en particular, los contextos para la alegría fueron mejor evaluados con un promedio de aceptabilidad mayor de 6,17±1,25, en relación con la tristeza 5,52±1,64 y el enojo 5,3±1,89^[13].

El estudio se inscribe dentro del Modelo Métrico Autosegmental; este modelo reconoce la independencia en el nivel tonal con respecto al segmental y tiene como objetivo la identificación de los elementos contrastivos y su combinación en el sistema entonativo, con base en relaciones de prominencia relativa. El sistema métrico autosegmental permite una comparación detallada de los contornos contrastivos (Hualde, 2003; Prieto, 2005). Para la transcripción y etiquetaje, se siguen las convenciones del Sp-ToBI (Tones and Break Indices) (Pierrehumbert, 1980; Pierrehumbert & Beckman, 1988). Este sistema tiene como base el modelo métrico autosegmental y, según Sosa (2003), se limita a dos tonos, el alto (H) y el tono bajo (L). El sistema ToBI se basa en la diferenciación entre acentos tonales y acentos de juntura o tonos de frontera y constituye un tipo estandarizado de etiquetaje prosódico. En este sentido, se trata de un instrumento de investigación constituido por un conjunto de convenciones para la transcripción prosódica de diferentes lenguas y sus múltiples variedades lingüísticas.

Los enunciados se segmentaron en sílabas. En cada sílaba del tonema, se calculó el promedio de la F0 y la duración, es decir, en la última sílaba tónica (nuclear) del enunciado^[14], seguida por la sílaba postónica o final (postnuclear). Se normalizaron los valores de la F0 (st) y la duración (ms) (Gut, 2013). En el primer caso, se restaron los valores obtenidos de la sílaba prenuclear, nuclear y postnuclear. Para la duración, se extrajo el porcentaje de duración de la vocal en la sílaba nuclear y postnuclear (Martínez Celdrán, 2013). Se realizó el análisis estadístico con el programa SPSS, con dos variables dependientes, la F0 y la duración; en dos sílabas, nuclear y postnuclear. Se llevó a cabo una ANOVA de medidas repetidas con dos factores intra-sujeto (emoción y enunciado) y un factor inter-sujeto: sexo, se aplicó el ajuste post hoc de Bonferroni.

Las mediciones se establecieron con el programa Praat versión 6.0.35^[15] (Boersma & Weenink, 2017). Para la asignación de la representación tonal en cada enunciado, se atendió tanto al movimiento de la curva tonal como en la diferencia alcanzada en semitonos (st) (Pamies, Fernández, Martínez, Ortega & Amorós, 2002), de modo que los movimientos menores a 1,5 st se transcriben con monotonos (H*, L*) y para los movimientos mayores a 1,5 st se reservan los bitonos (L+H*, L*+H, L+>H*, H+L*) (Estebas-Vilaplana & Prieto, 2008). Cuando el ascenso o descenso excede los 3 st, se marca con los diacríticos ¡!; ¡ para los ascensos y ! para los descensos mayores a lo esperado (Velásquez-Upegui & Velázquez Patiño, 2018). También se consideraron los umbrales de percepción con relación a la duración vocálica de 33,33% (Martínez Celdrán, 2013; Pamies & Fernández, 2006). Para ello se comparó la duración en la sílaba nuclear y postnuclear con la duración de la primera sílaba átona y tónica anterior al tonema en palabras de contenido^[16].

Con respecto a la curva entonativa, se observan diferencias en la configuración según la emoción que se imprime en cada enunciado. En el caso de los enunciados de control, estos presentaron una realización plana y sostenida desde el contorno prenuclear hasta el tonema, que se representa como H*H*H*M% (Figura 1). En los enunciados emitidos con tristeza, se observa una realización similar al enunciado neutro en el contorno prenuclear, con diferencias en el tonema que, para el caso de la tristeza, termina de manera descendente H*H* H+L* L% (Figura 2).

Para el enunciado que expresa enojo, se presenta un ascenso mayor a lo esperado en las sílabas tónicas del segmento prenuclear, que en ocasiones puede replicarse en la sílaba nuclear, el tono de juntura terminal es descendente L+¡H* L+>H* H+L* L% (Figura 3), de igual manera se presentan movimientos ascendentes en la sílaba nuclear (L+H*). En este enunciado, se evidencia mayor variabilidad en el segmento prenuclear que se manifiesta en picos desplazados (L+>H*) y movimientos de bajos en la sílaba tónica con ascensos en la sílaba postónica (L*+H). Por último, en la expresión de la alegría, la primera parte del enunciado evidencia un ascenso progresivo desde la sílaba tónica, que alcanza el pico o máxima altura frecuencial en la sílaba nuclear para finalizar con un tono de juntura terminal descendente H* L+>H* H* L% (Figura 4).

Las medias de la F0 desde la sílaba prenuclear hasta la sílaba nuclear^[17] muestran diferencias estadísticamente significativas entre los movimientos tonales F=(3,84)=34,92, p<0,05, η²p=0,555. En el caso de la expresión de alegría, predomina un ascenso de la F0 de 0.8 st, mientras que, en la tristeza y el enojo, se presenta un movimiento descendente de 0,73 st y 0,62 st, respectivamente. Este último valor coincide con el enunciado control que obtuvo una media de 0,63 st. A pesar de las diferencias entre las medias en este segmento del tonema, estos movimientos no exceden el umbral tonal de percepción de 1,5 st. Las comparaciones por pares revelan que solo existen diferencias significativas en la expresión de la alegría p<0,05, en relación con las demás emociones. Sin embargo, la expresión de enojo, tristeza y del enunciado control o neutro no presentaron diferencias estadísticamente significativas entre sí p>0,05. La interacción sexo y emoción no mostró diferencias significativas en la expresión de emociones F=(3,84)=0,288, p>0,05 η²p=0,01 (Tabla 1).

Tabla 1. Media y desviación estándar diferencias de la F0 entre
la sílaba prenuclear y nuclear^[18]

Por su parte, las medias del trayecto de la F0 en la sílaba nuclear con respecto a la final también muestran diferencias en la expresión de las emociones; la mayor altura de la F0 se registró en la alegría con 2,7 st; la tristeza mantuvo un tono sostenido de 0,5 st; y el enojo presentó un movimiento de 0,9 st, estos dos últimos muy cercanos al enunciado de control con 0,8 st. El análisis estadístico mostró un efecto principal de la emoción en la F0 de la sílaba nuclear, F=(3,84)=64,22, p<0,05, η²p=0,696.

Las comparaciones múltiples indican que no hay una diferencia estadísticamente significativa entre los enunciados que expresan enojo y los enunciados de control o neutros (p>0,05). De acuerdo con el valor de las medias de la F0, solo en el caso de la expresión de alegría se excede el umbral de los 1,5 st, lo que indica que los enunciados emitidos con enojo y tristeza entrarían en el rango tonal no perceptible y no representarían distinción en relación con el enunciado neutro o control.

La interacción entre la emoción y el sexo de los participantes presentó diferencias significativas, F=(3,84)=11,409, p<0,05η²p=0,289. La comparación por pares reveló que, en el caso de los hombres, no se presentaron diferencias significativas entre los enunciados con tristeza y el enunciado neutro (p>0,05). En las mujeres, todos los efectos se reportan con una significación de p<0,05. Tanto en los hombres como en las mujeres, la F0 del enunciado con la expresión de alegría excede el umbral perceptivo, los demás casos no superan el umbral de percepción. En los enunciados emitidos por los hombres, los casos de expresión de enojo presentaron un aumento de la F0; por parte de las mujeres, este incremento se registró en el enunciado neutro (Tabla 2).

Tabla 2. Media y desviación estándar de las diferencias de la F0 entre
la sílaba nuclear y postnuclear

Con relación a la duración vocálica en la sílaba nuclear, se presentaron diferencias en las medias de cada enunciado según la emoción. La media de duración fue mayor en la expresión de la alegría con 58%, seguido por la tristeza con 56,16% y el enojo con 55,03%. Por último, el enunciado de control mostró menos duración con 50,66%. Se encuentra un efecto principal significativo de la emoción en la duración de la sílaba nuclear F=(3,84)=15,421 p<0,05 η²p =0,355. La comparación por pares indica que el enunciado control se diferencia significativamente de cada uno de los enunciados que expresan emociones (p<0,05); sin embargo, las emociones no presentaron diferencias significativas entre sí (p>0,05).

El análisis entre factores reveló una interacción significativa entre el sexo de los participantes y la expresión de emociones F=(3,84)=7,529 p<0.05 η²p =0.212. Las mujeres presentaron diferencias significativas de la duración entre los enunciados a excepción de los casos que expresan enojo y tristeza p>0.05. En los hombres, todos los efectos muestran una significancia de p>0.05 (Tabla 3).

Por su parte, el análisis de la duración vocálica en la sílaba postnuclear reveló diferencias estadísticamente significativas entre los enunciados F=(3,84)=43,418 p<0,05 η²p =0,608. La expresión de alegría obtuvo una media de 63,7%, el enojo de 57,57%, la tristeza de 55,39% y el enunciado control o neutro mostró 54,86%. La comparación por pares indicó que no hay diferencias significativas entre los enunciados que expresan enojo y tristeza (p>0,05), en los demás casos se obtuvo una significación de p<0,05. La interacción entre sexo y emoción no arrojó un efecto significativo en la duración F=(3,84)=1,226 p>0,05 η²p =0,042 (Tabla 4).

Tabla 4. Media y desviación estándar de la duración
en la sílaba postnuclear

La media de la duración en las vocales en las sílabas nuclear y postnuclear se comparó con la duración de vocales control (Tabla 5). La comparación entre la duración de la sílaba nuclear y la sílaba tónica pretonemática no excede el umbral de percepción del 33,33%. Estos mismos resultados se encontraron en los casos de la duración entre la vocal postnuclear y la vocal átona pretonemática^[19]16.

Tabla 5. Diferencia porcentual de las medias de duración entre
las sílabas del tonema y sílabas del pretonema

Al agrupar los datos por género se mantienen las mismas características mencionadas a excepción de la alegría en las mujeres, cuyas medidas se encuentran sobre el umbral de 33,33%. Es decir, la duración de las sílabas nuclear y postnuclear es perceptible en el enunciado con relación a las sílabas tónica y postónica en el pretonema (Tabla 6).

Tabla 6. Diferencia porcentual de las medias de duración entre
las sílabas del tonema y sílabas del pretonema, en mujeres y hombres.

En este estudio se observan las diferencias acústicas asociadas a la frecuencia (F0) y duración en el tonema cuando se realizan actos de habla asertivos con emociones subyacentes de alegría, tristeza y enojo. De acuerdo con los resultados, la expresión de las emociones es observable a nivel suprasegmental en la F0 y la duración en el tonema. En el caso de la F0, resulta ser un parámetro bastante claro en la expresión de la alegría; sin embargo, en las expresiones de tristeza y de enojo, no se muestran variaciones perceptibles a nivel fonético.

En este sentido, se cumple parcialmente la afirmación de Mello & Raso (2011), dado que, en los casos de la tristeza y del enojo, la información a nivel expresivo no recae necesariamente en el tonema pues ambas emociones se mantienen en el mismo rango del enunciado neutro, aunque la alegría presenta una realización diferente puesto que sí evidencia modificaciones. En lo que concierne a las expresiones de la alegría y de la tristeza, estos resultados coinciden con las conclusiones de Quilis (1980-1981), Martínez & Rojas (2011) y Rodero (2011); sin embargo, no se presentan coincidencias con relación a la expresión del enojo dado que no excede el umbral de percepción.

Este hecho puede deberse a varios factores: en primer lugar, los análisis referidos se basan en enunciados completos, a diferencia del presente estudio en el que se describe exclusivamente el tonema del enunciado; en segundo lugar, dado que los contextos de elicitación utilizados en el presente estudio obtuvieron evaluaciones de aceptabilidad diferentes, es posible que no hayan tenido el mismo efecto a la hora de provocar la expresión del enojo^[20]17; y en tercer lugar, la forma como se elicitaron los enunciados en cada investigación es diferente, aspecto que podría tener distintos efectos en la prosodia y en la expresividad^[21]18.

Los participantes entrevistados siguen las tendencias de los resultados generales; sin embargo, la diferencia entre la sílaba nuclear y postnuclear mostró que, en el caso de las expresiones del enojo y de la tristeza, las mujeres presentaron tonos nucleares planos y finales sostenidos, a diferencia de los hombres que, en la expresión del enojo, presentaron finales descendentes (Figura 5). En la expresión de enojo, las mujeres evitan las marcas de expresividad en el tonema, mientras que, en el caso de los hombres, cumplen un papel diferenciador. En este sentido, el género de los participantes incide en la producción de la prosodia y de la expresividad.

La duración de la sílaba nuclear permite reconocer diferencias entre el enunciado neutro y los enunciados que expresan emociones; sin embargo, no resulta ser tan eficaz en la diferenciación entre emociones. Este parámetro acústico no tuvo la misma realización en mujeres y hombres, dado que estos últimos no mostraron variaciones significativas en la duración, y en el caso de las mujeres solo resultaron significativos entre el enunciado neutro y la alegría. La duración de la sílaba nuclear reveló más información con relación al sexo de los participantes en comparación con la sílaba postnuclear, dado que esta última no mostró un efecto del sexo en la duración.

El umbral perceptivo de la F0 y la duración favorece el reconocimiento de la expresión de alegría; sin embargo, en los casos de la tristeza y del enojo, el tonema no excede estos umbrales, lo que se traduce en variaciones no perceptibles que asocian estos enunciados con la aserción no marcada. Con respecto a las nociones metodológicas, la elicitación por medio de situaciones inducidas es una herramienta adecuada para evaluar la expresividad de los actos de habla; no obstante, existe el riesgo de que la valoración de cada contexto no sea homogénea, lo que puede incidir en una gradación de la expresividad en cada emoción.

En conclusión, la F0 y la duración del tonema no resultan ser parámetros diferenciadores suficientes en la producción de todas las emociones; sin embargo, permite particularizar las características de algunas emociones como en la expresión de alegría. Por esta razón, resulta necesario estudiar el segmento pretonemático para determinar la composición entre los diferentes tonos que conforman el enunciado y que, en conjunto, actúan en función de la expresividad.

Cantero Serena, F. J. (2002). Teoría y análisis de la entonación. Barcelona: Edicions de la Universitat de Barcelona.

Bericat Alastuey, E. (2012). La sociología de la emoción y la emoción en la sociología. Papers, 62, 145-176.

Beller, G. (2009). Transformation of Expressivity in Speech. En S. Hancil (Ed.), The Role of Prosody in the Expression of Emotions in English and in French. Peter Lang: Germany.

Boersma, P. & Weenink, D. (2017) Praat version 6.0.35. Doing phonetics by computer. Institute of Phonetic Sciences, University of Amsterdam. Recuperado el 1 dic. de 2017 de http://www.fon.hum.uva.nl/praat/

Dimos, K., Dick, L. & Dellwo, V. (2015). Perception of levels of emotion in speech prosody. En Proceedings of 18th International Congress of Phonetic Sciences. Glasgow, UK: University of Glasgow.

De Moraes, J. A. (2011). From a prosodic point of view: Remarkson Attitudinal Meaning. En H. Mello, A. Panunzi & T. Raso (Eds.), Pragmatics and Prosody. Illocution, Modality, Attitude, Information Patterning and Speech Annotation (pp. 19-38). Firenze: Firenze Unversity Press.

Estebas-Vilaplana, E. & Pilar, P. (2008). La notación prosódica del español: una revisión del SpToBI. Estudios de Fonética Experimental, XVII, 263-286.

Fernández Planas, A. M. & Martínez Celdrán, E. (2003). El tono fundamental y la duración: dos aspectos de la taxonomía prosódica en dos modalidades de habla (enunciativa e interrogativa) del español. Estudios de Fonética Experimental, XII, 165-200.

Francisco, V., Gervás, P. & Hervás, R. (2005). Análisis y síntesis de expresión emocional en cuentos leídos en voz. Procesamiento del Lenguaje Natural, 35, 293-300.

Gil, J. M. (2006). Amenaza e invasión de la imagen. Un estudio sobre la naturaleza de la cortesía verbal. Pragmalingüística, 14, 75-86.

Gut, U. (2013). Analysing phonetic and phonological variation on the suprasegmental level. En M. Krug & J. Schlüter (Eds.), Research Methods in Language Variation and Change (pp. 244-259). Cambridge: Cambridge UP.

Lindblad, G. & Allwood. J. (2012, noviembre). Prosodic Expressions of Emotions and Attitudes in Communicative Feedback. Trabajo presentado en Proceedings of the 4th Nordic Symposium on Multimodal Communication. University of Gothenburg, Suecia.

Mello, H. & Raso, T. (2011). Illocution, Modality, Attitude: Different Names for Different Categories. En H. Mello, A. Panunzi & T. Raso (Eds.), Pragmatics and Prosody. Illocution, Modality, Attitude, Information Patterning and Speech Annotation (pp. 1-18). Firenze: Firenze Unversity Press.

Martín Butragueño, P. (2015). Acercamiento a la prosodia de los actos de habla expresivos. Datos del español de México. En E. Hernández y P. Martín (Eds.), Variación y diversidad lingüística: hacia una teoría convergente (pp. 259-349). México: El Colegio de México.

Martínez, H. & Rojas, D. (2011). Prosodia y emociones: datos acústicos, velocidad de habla y percepción de un corpus actuado. Lengua y Habla, 15, 59-72.

Hualde, J. I. (2003). El modelo métrico y autosegmental. En P. Prieto (Coord.), Teorías de la entonación (pp. 155-184). Barcelona: Ariel.

Navarro Tomás, T. (1948). Manual de pronunciación española (2.a ed.). New York: Hispanic Institute.

Pamies Bertrán, A., Fernández Planas, A. M., Martínez Celdrán, E., Ortega Escandell, A. & Amorós Céspedes, M. (2002). Umbrales tonales en español peninsular. En Actas del II Congreso Nacional de Fonética Experimental (pp. 272-278). Sevilla: Universidad de Sevilla.

Pamies Bertrán, A. & Fernández Planas, A. M. (2006). La percepción de la duración vocálica en español. En J. de D. Luque Durán (Ed.), Actas del V Congreso Andaluz de Lingüística general. Homenaje a José Andrés de Molina (pp. 501-512). Granada: Granada Lingüística.

Pierrehumbert, J. B. (1980). The phonetics and phonology of English intonation. Tesis doctoral. Tesis no publicada, Massachusetts Institute of Technology.

Pierrehumbert, J. B. & Beckman, M. E. (1988). Japanese Tone Structure. Cambridge: The MIT Press.

Quilis, A. (1980-1981). Funciones de la entonación. Homenaje a Ambrosio Rabanales. Boletín de Filología, XXXI, 443-460.

Rodríguez Bravo, Á. (2002). Propuestas para una modelización del uso expresivo de la voz. ZER, 157–175.

Rodero, E. (2011). Intonation and Emotion: Influence of Pitch Levels and Contour Type on Creating Emotions. Journal of Voice, 25(1), 25-34.doi: 10.1016/j.jvoice.2010.02.002

Russell, J. A., Lewicka, M. & Niit, T. (1992). A cross cultural study of a circumplex model of affect. Journal of personality and social psychology, 57, 848-85.

Scherer, K. R. (2003). Vocal communication of emotion: A review of research paradigms. Speech Communication, 40, 227-256.

Sosa, J. M. (1999). La entonación del español. Su estructura fónica, variabilidad y dialectología. Madrid: Cátedra.

Searle, J. (1986). Actos de habla: Ensayo de Filosofía de Lenguaje (L. M. Valdés Villanueva, Trad.). Madrid: Cátedra. (Trabajo original publicado en 1969)

Searle, J. (2014). Creando el mundo social. La estructura de la civilización humana (J. Bostelmann, Trad.). México: Paidós. (Trabajo original publicado en 2010)

Velásquez-Upegui, E. P. (2015). ¿Entonación de enunciados aseverativos con fuerza expresiva o de enunciados exclamativos? A propósito del español hablado en Colombia. Moenia, 111-130.

Velásquez-Upegui, E. P. & Velázquez Patiño, E. (2018). Prosodia de los actos de habla directivos: de los mandatos a los ruegos. Lenguas Modernas, 48, 105-119.

Wichmann, A. (2000). The attitudinal effects of prosody, and how they relate to emotion. En R. Cowie, E. Douglas-Cowie& M. Schröder (Eds.). Proceedings of the ISCA ITRW on Speech and Emotion (pp. 143-148). Belfast: Textflow.

[1]* Doctora en Lingüística de El Colegio de México, México. Profesora e investigadora del área de Lingüística en la Facultad de Lenguas y Letras de la Universidad Autónoma de Querétaro. Correo electrónico: evapvelasquez@gmail.com

[2]** Licenciada en Lengua Castellana, Inglés y Francés de la Universidad de La Salle en la ciudad de Bogotá, Colombia. Maestranda en Lingüística de la Universidad Autónoma de Querétaro. Correo electrónico: garzonolgalu@gmail.com

[3]*** Licenciada en Lenguas Modernas en Español de la Universidad Autónoma de Querétaro, México. Correo electrónico: soto_1317@hotmail.com

Ideas, IV, 4 (2018), pp. 1-20

[4]. Los autores agradecen a los estudiantes de la Facultad de Lenguas y Letras de la Universidad Autónoma de Querétaro, Ana Francesca Gallegos Poletti, Yonathan Escobar, José Armando San Martín y Stanislav Mulik por su participación en el proyecto.

[5]. De igual manera, resulta necesario reconocer si estas posibles regularidades prosódicas asociadas a los actos de habla son constantes con independencia de las características de los hablantes (dialecto, género, edad o nivel de instrucción) o si, por el contrario, son modificadas por factores culturales.

[6]. Este trabajo parte del proyecto más general dedicado al estudio de la producción y percepción de la prosodia, con el apoyo del Fondo para el Fortalecimiento de la Investigación (FOFI), Universidad Autónoma de Querétaro.

[8]. Según Rusell, Leicka & Nitt (1992), enojo, tristeza y miedo han sido consideras como emociones básicas. Bericat (2012, pp. 2) explica que “Las emociones primarias se consideran respuestas universales, fundamentalmente fisiológicas, evolutivamente relevantes y biológica y neurológicamente innatas. Por el contrario, las secundarias, que pueden resultar de una combinación de las primarias, están muy condicionadas social y culturalmente”.

[10]. En este sentido, valdría la pena analizar si el alcance de la expresión de emociones se extiende no solo a los tipos oracionales sino también a los diferentes actos de habla y, en ese caso, reconocer qué papel juega la prosodia para expresar la fuerza ilocutiva en un acto de habla central y adyacente, por ejemplo, una orden expresada con tristeza o con enojo.

[11]. La selección de un método específico conlleva ventajas y desventajas analíticas. En este caso, se pierde naturalidad en la emisión y no se logra controlar el efecto que un contexto específico puede generar en un hablante en la medida en que este evalúa la situación de acuerdo con su experiencia.

[13]. El promedio de aceptabilidad en mujeres (5,7±1,64) y hombres (5,62±1,67) presentó valores poco diferenciados.

[14]. Se calculó el movimiento de la F0 en el tonema a partir de la diferencia entre la sílaba prenuclear y nuclear y, entre esta última y la sílaba postnuclear.

[17]. Aunque en este estudio se analiza el tonema se observan diferencias en la realización del segmento prenuclear que pueden sugerir, justamente, que la expresividad presenta una prosodia particular, Velásquez-Upegui (2015).

[18]. Las medias de los enunciados que expresan enojo, tristeza y neutro representan movimientos descendentes.

[19]16. La comparación de la duración entre la sílaba nuclear y la sílaba átona pretonemática tampoco sobrepasa el umbral preceptivo.

[20]17. Vale la pena estudiar el efecto dialectal o sociocultural en la prosodia y la expresión de las emociones y que, en este caso, pudiera explicar la diferencia en la expresión del enojo en diferentes grupos de hablantes. También es importante tener en cuenta la evaluación social que la expresión de una emoción como el enojo puede traer consigo; es muy probable que el enojo produzca una valoración social negativa del hablante y que, por esta razón, se neutralicen los rasgos prosódicos de modo que se aproximen al enunciado no marcado, mientras que en la expresión de alegría, por ejemplo, se maximice su expresión dado que conlleva una evaluación social positiva.

[21]18. Se encontró un efecto estadísticamente significativo del tipo de enunciado en la F0 de todas las emociones F=(3,84)=35,865 p<0,05 η²p =0,562; aunque no es el objetivo del presente estudio, es interesante determinar el efecto que tiene el contexto de elicitación en la gradación de las emociones. En este sentido, unas situaciones pueden provocar más enojo, alegría o tristeza que otras.

Prenuclear – Postnuclear (st)	Mujeres		Hombres
Prenuclear – Postnuclear (st)	Media	Desv. Est.	Media	Desv. Est.
Alegría	0,71	0,16	0,88	0,16
Enojo	0,94	0,24	0,52	0,24
Tristeza	0,75	0,1	0,57	0,1
Neutro	0,83	0,12	0,44	0,12

Nuclear – Postnuclear (st)	Mujeres		Hombres
Nuclear – Postnuclear (st)	Media	Desv. Est.	Media	Desv. Est.
Alegría	2,43	2	2,96	2,42
Enojo	0,61	2,11	1,3	1,86
Tristeza	0,02	1,22	0,9	1,48
Neutro	1,3	0,77	0,44	1,5

Sílaba Nuclear	Mujeres		Hombres
Sílaba Nuclear	Media %	Desv. Est.	Media %	Desv. Est.
Alegría	61,28	11,31	54,73	9,61
Enojo	56,92	11,24	55,43	10,76
Tristeza	54,56	19,44	55,49	11,2
Neutro	48,76	14,05	52,52	11

Sílaba Postnuclear	Mujeres		Hombres
Sílaba Postnuclear	Media %	Desv. Est.	Media %	Desv. Est.
Alegría	65.50	10.66	61.89	8.25
Enojo	58.57	8.95	56.56	10.16
Tristeza	55.71	7.57	55.07	8.23
Neutro	55.37	8.85	54.35	8.11

%	S. Nuclear	S. Tónica	%	S. Postnuclear	S. Átona	%
Alegría	58	45,88	20,9	63,7	46,7	26,69
Enojo	56,16	50,81	9,53	57,57	45,74	20,55
Tristeza	55,03	48,65	11,6	55,39	50,34	9,117
Neutro	50,66	48,46	4,34	54,86	52,46	4,375

Duración	Mujeres						Hombres
Duración	S. Nuclear	S. Tónica	%	S. Posnucl.	S. Átona	%	S. Nuclear	S. Tónica	%	S. Posnucl.	S. Átona	%
Alegría	61,28	41,14	32,9	65,5	42,16	35,6	54,73	50,83	7,126	61,89	49,05	20,75
Enojo	56,92	51,21	10	58,57	49,3	15,8	55,43	50,41	9,056	56,56	42,16	25,46
Tristeza	54,56	48,32	11,4	55,71	56,69	-1,8	55,49	48,99	11,71	55,07	43,4	21,19
Neutro	48,76	49,41	-1,33	55,37	62,01	-12	52,52	47,9	8,797	54,35	46,09	15,2