El modelo de los cinco grandes factores
La personalidad normalmente se considera como el conjunto de características que hacen pensar, sentir y actuar de una manera única a una persona (McKnight et al., 2019) y, en un extremo, como un constructo superordinado que engloba diversos elementos tanto cognitivos como no cognitivos (Dangi et al., 2020). Por lo tanto, se refiere a la particularidad del individuo y aquello que lo distingue de todos los demás, así como a un conjunto de características psicológicas estables y duraderas en el tiempo y las situaciones que permiten establecer un estilo característico de interacción con el contexto físico y social (Mõttus et al. 2017). Según Barbachán-Ruales et al. (2018), los estudiantes universitarios poseen una multiplicidad de rasgos intrínsecos a su personalidad; sin embargo, esta se revela eficaz al manifestarse en circunstancias susceptibles de ser interpretadas a la luz del autoconocimiento. En esta línea, se buscan agentes motivacionales que los impulsen a estudiar y a enfrentar los desafíos delineados en el ámbito educativo, lo que le brinda la esperanza de alcanzar sus designios y propósitos.
La personalidad podría concebirse como un sistema determinado por rasgos y procesos dinámicos que intervienen en el proceso psicológico individual. Si bien existen algunos planteamientos que destacan estos elementos, el modelo de los cinco grandes factores (5GF; McCrae & Costa, 1999, 2004) es uno de los más importantes y es la taxonomía más reconocida para evaluar los rasgos de personalidad (Zhang et al., 2019). Durante las últimas décadas, el modelo de los 5GF ha sido reconocido como una representación primordial de los rasgos prominentes y no patológicos de la personalidad, cuya modificación contribuye a la aparición de trastornos de personalidad, como los trastornos antisociales, límite y narcisista (Angelini, 2023).
El modelo de los 5GF indica que los individuos se caracterizan por un patrón de pensamientos, sentimientos y acciones que pueden agruparse en torno a cinco dimensiones: neuroticismo, extroversión, apertura, amabilidad y responsabilidad (McCrae & Costa, 2004). Su validez, universalidad y estabilidad longitudinal han sido respaldadas por la investigación empírica (e.g., McAdams & Pals, 2006), ya que este modelo tiende a ser más fuerte en las culturas occidentales que en las no occidentales, así como con similar nivel educativo y de ingresos (Rammstedt et al., 2013), aunque también se conoce que no se replica en algunos contextos (e.g., Fetvadjiev & van der Vijver, 2015), ya que las modificaciones realizadas a diversas escalas alteran tanto el instrumento como las interpretaciones que se hacen de los ítems (e.g., Fetvadjiev & van der Vijver, 2015), lo que impulsa la creación de otros modelos teóricos de personalidad orientados a determinadas idiosincrasias (e.g., Gurven et al., 2013). Esto sugiere que las diferencias culturales y étnicas pueden influir en la forma en que se expresan y perciben los rasgos de la personalidad. Aunque el modelo 5GF ofrece un marco pertinente para comprender la personalidad humana, es importante reconocer la necesidad de enfoques complementarios en determinadas culturas y etnias.
La primera dimensión, el neuroticismo, se caracteriza por la tendencia a experimentar afecto negativo (tristeza, miedo, ira, culpa, etc.), y se asocia a la estabilidad emocional y a la gestión de las emociones, que se traduce en vulnerabilidad y ansiedad (Zhang et al., 2024). De este modo, puede predecir una menor capacidad para lidiar con eventos adversos (Angelini, 2023; Zuo et al., 2024). La segunda dimensión, extroversión, se asocia a un estado de sociabilidad caracterizado por el asertividad y la confianza, es decir, aquellas personas que aprecian la convivencia con los demás y el trabajo en equipo, que son emocionalmente positivas (Bertoquini & Ribeiro, 2006) y son capaces de impactar individualmente sobre la interacción del grupo de pertenencia (Barry & Friedman, 1998). La tercera dimensión denominada apertura se relaciona con la imaginación, curiosidad, originalidad, con intereses diversificados y no tradicionales, con una actividad intelectual proactiva, y la preferencia por tareas que involucran complejidad cognitiva (McCrae & Costa, 1997). La cuarta dimensión, la amabilidad, está caracterizada por la simpatía, flexibilidad, confianza, tolerancia y preocupación por los demás, con orientación prosocial y con preferencia por el desarrollo de actividades grupales (Costa & McCrae, 1992), lo que facilitaría el establecimiento de relaciones interpersonales positivas. La última dimensión, responsabilidad, se refiere a la organización, autodisciplina, persistencia, prudencia y capacidad de planificación (Kaftan & Freund, 2018) para lograr las metas personales, además de estar asociada a un mayor autocontrol y a un menor nivel de externalización agresiva (McCrae & Costa, 1999).
Conforme con lo expuesto, la evaluación de la personalidad es relevante en el ámbito universitario tanto para labores de investigación como para contextos aplicados, ya sea por su relevancia evolutiva en cuanto a sus diferencias según sexo o edad (e.g., Zhang et al., 2024; Zhao et al., 2024), o por su asociación con variables relevantes como el rendimiento académico (responsabilidad; Vedel, 2014), la motivación académica (neuroticismo y responsabilidad; McGeown et al., 2014), la procrastinación (neuroticismo y apertura; Ocansey et al., 2020), la autorregulación motivacional (responsabilidad; Ljubin-Golub et al., 2019), deshonestidad académica (responsabilidad y amabilidad; Giluk & Postlethwaite, 2015), autoeficacia académica (responsabilidad y apertura; McIIloy et al., 2015), apoyo social (extraversión; Barańczuk, 2019), burnout académico (neuroticismo; Prada-Chapoñan et al., 2020; amabilidad y neuroticismo; Araújo, 2024), o el bienestar subjetivo (Nunes et al., 2009).
Personalidad y diferencias según sexo
Las diferencias evolutivas o socioculturales entre hombres y mujeres se evidencian en la manifestación de sus conductas en entornos específicos (Schmitt et al., 2017), por lo que es relevante contar con medidas válidas y confiables para exponer esas diferencias. Por ejemplo, estudios anteriores indican que las diferencias en función del sexo con respecto a los cinco grandes de la personalidad no son concluyentes, ya que si bien las estudiantes universitarias muestran puntuaciones más altas en los cinco grandes rasgos de la personalidad (Bunker et al., 2021; Sander & Fuente, 2020), otros estudios muestran que las mujeres registraron puntuaciones más altas en extraversión, amabilidad y neuroticismo que los hombres (Liu et al., 2024), y para otros autores los hombres puntúan más alto en apertura, extraversión y responsabilidad (Abdel-Khalek, 2021). Por otro lado, en otros estudios se encontró que las mujeres puntúan más alto en extraversión, responsabilidad y apertura, mientras que puntúan de forma similar en amabilidad y neuroticismo (Bunnett, 2020; Dominguez-Lara et al., 2019). Sin embargo, en ocasiones los grupos se comparan sin brindar evidencias de invarianza de medición (Pendergast et al., 2017), lo que podría llevar a cuestionar la legitimidad de las diferencias encontradas dado que se podrían adjudicar a aspectos ajenos al constructo (sesgo).
Personalidad y bienestar subjetivo
El bienestar subjetivo (BS) hace referencia a un conjunto de valoraciones emocionales y cognitivas hechas sobre las distintas áreas de la vida (Diener et al., 2009). Por un lado, la dimensión cognitiva se corresponde con la satisfacción con la vida (SV), aquel proceso de evaluación general de la propia vida (Emmons, 1986) que surge de la comparación entre las circunstancias actuales e ideales de la vida de la persona, aunque considerando elementos importantes como las metas, valores o la cultura (Calleja & Masón, 2020). Por otro lado, la dimensión emocional se constituye por el afecto positivo (AP) y afecto negativo (AN; Diener et al., 2002), los cuales representan los elementos emocionales (placer, felicidad, angustia, etc.). De esta forma, un BS elevado incluye diversas experiencias emocionales positivas, pocas experiencias emocionales negativas (e.g., depresión o ansiedad) y la SV entendida como un todo. Así, se entiende que diferentes trayectorias de vida, rasgos de personalidad, arquitectura cerebral, así como el entorno y la cultura en los que los individuos se encuentran, influencian la perspectiva individual y subjetiva del bienestar (Oguntayo et al., 2024; van Valkengoed et al., 2023).
En este orden de ideas, uno de los predictores más estudiados del BS es la personalidad (Lucas, 2018), específicamente desde el modelo de los 5GF, que proporciona dos explicaciones sobre la asociación entre dichos constructos. En primer lugar, se habla de un modelo temperamental que explica las relaciones directas entre los sistemas fisiológicos subyacentes y las experiencias afectivas que los individuos tienen. En segundo lugar, de un modelo instrumental que entiende el bienestar como un resultado indirecto de las condiciones que los individuos crean en función de sus rasgos de personalidad (Lucas, 2018; McCrae & Costa, 1991).
Entonces, el neuroticismo y la extroversión pueden estar relacionados al BS a través de los mecanismos inherentes a ambos modelos. Por ejemplo, desde el modelo temperamental, el nivel de BS experimentado por personas con elevados neuroticismo y extroversión puede ser parcialmente justificado por sus niveles afectivos básicos y por la intensidad de las respuestas emocionales que los caracterizan (McCrae & Costa, 1991). En cuanto al modelo instrumental, la responsabilidad y apertura se considera como rasgos importantes, aunque no determinantes para el BS (McCrae & Costa, 1991). No obstante, la confianza de los extrovertidos para afrontar la vida, así como la percepción situacional de amenaza y preocupación por eventos potencialmente estresantes vividos por individuos con alto grado de neuroticismo, ayudan a cambiar la percepción del contexto y, en consecuencia, afectan el BS (Margolis & Lyubomirsky, 2018).
Sobre la relación entre personalidad y BS, la evidencia empírica indica que la extraversión se relaciona directamente con el AP y con la SV; la responsabilidad se asocia de forma directa con la SV y con el AP, y tanto la extraversión como la responsabilidad se relacionan inversamente con el AN. El neuroticismo se vincula con niveles elevados de AN, así como con niveles bajos de SV y de AP (Anglim et al., 2020; Carmona-Halty & Rojas-Paz, 2014; Jensen et al., 2020; Kobylińska et al., 2022).
El Big Five Inventory y sus versiones breves
De acuerdo con lo mencionado, es clara la importancia de la personalidad para la predicción del comportamiento del individuo, por lo que es relevante evaluarla con instrumentos que cuenten con evidencias de confiabilidad y validez. Entonces, si bien se usan una diversidad de escalas para tal fin, uno de los instrumentos de libre acceso más conocidos y utilizados es el Big Five Inventory (BFI; John et al., 1991), que posee una versión en español estándar libre de regionalismos, lo que facilita su comprensión en diferentes contextos hispanohablantes (Benet-Martínez & John, 1998), no es demasiado extensa (44 ítems), es de libre acceso (el usuario no debe comprar los derechos de uso) y cuenta con estudios psicométricos en el contexto latinoamericano (Dominguez-Lara et al., 2018; Salgado et al., 2016) y recientemente en universitarios chilenos (Lara et al., 2021).
El BFI evalúa los 5GF de forma dimensional y cuenta con diversas versiones breves que brindan una valoración más comprehensiva de las dimensiones del modelo. Esto resulta de utilidad sobre todo cuando se pretende evaluar más de un constructo en un mismo estudio en el marco de diseños explicativos y se desea maximizar la participación del respondiente, o cuando el tiempo o espacio disponible para evaluar el constructo es bastante corto. Por ejemplo, existen versiones de 10 ítems (Rammstedt & John, 2007) y 15 ítems (Gerlitz & Schupp, 2005; Marcos et al., 2023; Zhang et al., 2019) con dos y tres ítems por dimensión respectivamente, las cuales evidencian resultados aceptables en el contexto europeo occidental (Courtois et al., 2020; Guido et al., 2015; Rammstedt, 2007), aunque su calidad psicométrica disminuye cuando se analizan en contextos distintos (Dominguez-Lara & Merino-Soto, 2018a; Kim et al., 2010; Kunnel et al., 2019).
A partir de esa situación se generó una versión alternativa de 15 ítems (BFI-15p; Dominguez-Lara & Merino-Soto, 2018a) que presenta evidencia psicométrica favorable a nivel de estructura interna en Perú y México (Dominguez-Lara & Merino-Soto, 2018b; Dominguez-Lara et al., 2022). Resulta de interés analizar su adecuación en una muestra chilena considerando la importancia de la personalidad en el ámbito académico (Mammadov, 2022) porque, hasta donde se conoce, no existen instrumentos breves que midan este constructo, lo que también podría contribuir a realizar futuros estudios transnacionales en el ámbito de la personalidad. Además, el análisis de invarianza de medición de acuerdo con el sexo fue una recomendación de estudios previos que, por cuestiones metodológicas, no se pudo ejecutar (Dominguez-Lara & Merino-Soto, 2018b; Dominguez-Lara et al., 2022).
El presente estudio
Las evidencias de validez con relación a la estructura interna son importantes dado que permiten concluir si la configuración de los ítems es coherente con la teoría previa (Steyn & Ndofirepi, 2022), por lo que el estudio analizó si la estructura interna de las dos versiones del BFI-15 (peruana y alemana) es compatible con el modelo de los 5GF en universitarios chilenos, considerando la distribución de ítems y la magnitud de cargas factoriales.
En cuanto a la estructura interna del BFI-15, se espera que el modelo peruano tenga mayor respaldo en la muestra chilena que el modelo alemán, debido a la proximidad geográfica y aspectos culturales en común (Hipótesis 1).
La literatura indica que las dimensiones del modelo de los 5GF se encuentran vinculados teórica y empíricamente (Dominguez-Lara et al., 2018; Jensen et al., 2020; Lara et al., 2021), por lo que se esperan asociaciones positivas entre las dimensiones extraversión, amabilidad, responsabilidad y apertura, y asociación negativa entre estas dimensiones y el neuroticismo (Hipótesis 2). En cuanto a la confiabilidad, se espera que los coeficientes calculados (α y ω) alcancen magnitudes aceptables (> .70; Hipótesis 3), y que la medida con mayor respaldo estructural (BFI-15p o BFI-15a) presente evidencias de invarianza de medición entre hombres y mujeres (Hipótesis 4).
Finalmente, es necesario implementar otros procedimientos para brindar más evidencias de validez, sobre todo aquellos que involucren constructos afines teóricamente con el objetivo de enriquecer los hallazgos iniciales. En ese sentido, se espera que las dimensiones de la personalidad del BFI-15 se asocien significativamente con las dimensiones del BS: SV, AP y AN. Específicamente, la siguiente dirección de las correlaciones: AP y SV presentarán una asociación positiva con extraversión, amabilidad, responsabilidad y apertura, mientras que la asociación de estas dimensiones con AN será negativa. Por su lado, neuroticismo mostrará una asociación positiva con AN, y negativa con AP y SV (Hipótesis 5).
Método
Diseño
Se trata de un estudio instrumental (Ato et al., 2013) orientado al estudio de las propiedades psicométricas de dos versiones del BFI-15 (peruana y alemana), tanto en lo que respecta a la estructura interna como a la asociación con otras variables y la confiabilidad.
Participantes
Utilizando un muestreo no probabilístico y por conveniencia, en el presente estudio participaron voluntariamente 1011 estudiantes universitarios chilenos (54.80 % mujeres) de edades comprendidas entre 18 y 30 años (M = 20.55; DE = 2.11). Los estudiantes se encontraban matriculados en diferentes instituciones de educación superior adscritas al Consorcio de Universidades del Estado de Chile, cursando el primero (23 %), segundo (27 %), tercero (30 %) y cuarto año (20 %) y en diversos planes de estudio: psicología (18 %), trabajo social (12 %), ingeniería (25 %), kinesiología (15 %), enfermería (19 %) y física (11 %). Como criterio de inclusión para participar en el estudio se consideró ser mayor de edad y estar matriculado en alguna institución del Consorcio de Universidades del Estado de Chile.
Instrumentos
Se utilizó la versión en español del Big Five Inventory (BFI; Benet-Martínez & John, 1998) orientado a la evaluación de la personalidad. El BFI evalúa los 5GF (extraversión, amabilidad, responsabilidad, neuroticismo y apertura) por medio de 44 ítems de cinco opciones de respuesta que van desde Muy en desacuerdo (1) hasta Muy de acuerdo (5). Cabe mencionar que no se usó como base la versión extensa validada en Chile (Lara et al., 2021), ya que no cuenta con algunos ítems necesarios para estructurar las versiones peruana y alemana (ítems 11, 22, 26, 28, 38). De este modo, las versiones de 15 ítems alemana (Gerlitz, & Schupp, 2005) y peruana (Dominguez-Lara & Merino-Soto, 2018a) fueron estructuradas a partir de los ítems del BFI según se muestra en la Tabla 1.
Además del BFI, se evaluó las tres dimensiones del BS (SV, AP, y AN). Específicamente, se usó la traducción al español de la Satisfaction with Life Scale (SWLS; Diener et al., 1985) realizada por Atienza et al. (2000). La SWLS evalúa de manera global la satisfacción con la vida a través de cinco ítems con puntuaciones comprendidas entre totalmente en desacuerdo (1) y totalmente de acuerdo (7). En población chilena se han encontrado adecuados indicadores de confiabilidad y validez (Vera-Villarroel et al., 2012).
A su vez, se utilizó la traducción al español del Positive and Negative Affect Schedule (PANAS; Watson et al., 1988) desarrollada por Robles y Paéz (2003). PANAS incluye 20 ítems (10 para afecto negativo y positivo, respectivamente) con opciones de respuesta comprendidas entre muy poco o nada (1) y extremadamente (5). En población chilena se han encontrado adecuados indicadores de confiabilidad y validez (Dufey & Fernández, 2012).
Procedimiento
En primer lugar, con la finalidad de detectar dificultades en la comprensión, se realizó un análisis lingüístico del BFI. En concreto, tres jueces expertos tuvieron la labor de determinar si los ítems del BFI podrían no ser comprendidos por la población objetivo (e.g., estudiantes universitarios chilenos). Durante esta etapa ningún ítem fue objetado ni modificado. En una segunda etapa, a través de los canales institucionales del Consorcio de Universidades del Estado, se envió una invitación a diferentes jefaturas de carrera a participar del estudio. En esta etapa se les envío la documentación relativa a los objetivos y necesidades del estudio a las jefaturas que aceptaron colaborar. En una tercera etapa, el procedimiento incluyó el contacto con los estudiantes en sus respectivas salas de clase, la formalización de su participación a través de un consentimiento escrito que incluía los objetivos y aspectos generales del estudio, y finalmente la aplicación del instrumento de manera individual, anónima y voluntaria, siguiendo un procedimiento de lápiz y papel. Este procedimiento se realizó según los principios de la Declaración de Helsinki (World Medical Association, 1964).
Análisis de World Medical Association datos
En cuanto al análisis descriptivo preliminar, los índices de asimetría y curtosis se consideran aceptables si están alrededor de 2 y 7, respectivamente (Finney & DiStefano, 2006). Con relación al análisis estructural, se implementó un análisis basado en los modelos exploratorios de ecuaciones estructurales (ESEM; Asparouhov & Muthén, 2009) con el método de estimación WLSMV, basado en matrices policóricas, a las dos estructuras propuestas (BFI-15a y BFI-15p). Se usó la rotación target oblicua (ε = .05; Asparouhov & Muthén, 2009), mediante la cual se estimó libremente la carga factorial del ítem del factor principal y las cargas secundarias se especificaron como cercanas a cero (~0).
Los modelos se valoraron con base en sus índices de ajuste, así como por la magnitud de las cargas factoriales (medidas de representatividad del constructo). En este sentido, fueron evaluados el CFI (> .90; Marsh et al., 2004), el RMSEA (< .08; Browne & Cudeck, 1993) y el WRMR (≤ 1.00; DiStefano et al., 2018). Se esperó cargas factoriales cercanas a .60 considerando el número de ítems por dimensión (Dominguez-Lara, 2018). A su vez, en vista que el ESEM provee información de cargas factoriales en los factores secundarios (cargas cruzadas), se calculó el índice de simplicidad factorial (ISF) para valorar la relevancia de estas, de tal manera que un ISF superior a .70 (Fleming & Merino-Soto, 2005) indicarían que el ítem está influido en mayor grado por un solo factor. Para tales fines se usó el programa Mplus versión 7.
La confiabilidad del constructo se estimó con el coeficiente ω (> .70; Hunsley & Marsh, 2008). De forma preliminar al cálculo del coeficiente α se analizó el supuesto de tau-equivalencia (Dunn et al., 2014), o la igualdad estadística de las cargas factoriales dentro de cada dimensión. Así, se consideró la variación del estadístico χ2, en donde una diferencia estadísticamente significativa entre el modelo congenérico y tau-equivalente indica que no se cumple el supuesto. Para este procedimiento se usó el comando DIFFTEST del Mplus (Asparouhov & Muthén, 2006).
En cuanto a la confiabilidad de las puntuaciones, dado el tamaño muestral (> 300) y cantidad de ítems (< 6), se consideró como aceptables magnitudes del coeficiente α de Cronbach por encima de .70 (Ponterotto & Ruckdeschel, 2007). No obstante, en vista de que el coeficiente α es sensible al número de ítems y el cumplimiento de la tau-equivalencia, se implementó el promedio de la correlación entre los ítems (r ij > .20; Clark & Watson, 1995).
Posteriormente, se analizó la invarianza de medición de la mejor versión breve entre hombres y mujeres con un análisis factorial multigrupo. Este procedimiento consiste en una restricción gradual de la equivalencia en la estructura interna (invarianza configural), cargas factoriales (invarianza débil), umbrales (invarianza fuerte) y residuales (invarianza estricta) entre los grupos (Pendergast et al., 2017). Así, la invarianza de medición es respaldada según la variación de los índices de ajuste CFI y RMSEA (ΔCFI > -.01, ΔRMSEA < .015; Chen, 2007).
Por último, la asociación entre las dimensiones del BFI-15 y las dimensiones del bienestar subjetivo (satisfacción con la vida, AP y AN) se evaluó con el coeficiente de correlación de Pearson. Se trabajó desde un enfoque de magnitud del efecto y se consideró como significativa una correlación mayor que .20: entre .20 y .50, asociación baja; entre .50 y .80, moderada; por encima de .80, alta (Ferguson, 2009). Cabe mencionar que la asociación entre las dimensiones del BFI-15 se valoró según la magnitud de la correlación interfactorial según los parámetros establecidos anteriormente.
Resultados
En cuanto al análisis descriptivo, la asimetría y curtosis de todos los ítems fueron aceptables (Tabla 2). En lo que respecta a las evidencias de validez basadas en la estructura interna, tanto el modelo alemán (CFI = .977; RMSEA (90%) = .053 (.044, .062); WRMR = .630) como el peruano (CFI = .995; RMSEA (90%) = .029 (.019, .040); WRMR = .393) tuvieron indicadores aceptables.
En cuanto a la magnitud de las cargas factoriales, el modelo peruano (Tabla 4) y el alemán (Tabla 3) presentan una y cuatro cargas de magnitud baja (< |.50|), en orden. Por último, el modelo peruano presenta los ítems factorialmente más simples (solo un ítem complejo; Tabla 4), a diferencia del modelo alemán con seis (40 %) ítems complejos (Tabla 3). Si bien la estructura pentafactorial se recupera favorablemente en ambos casos, el modelo más parsimonioso y con mejores parámetros factoriales es el peruano (Hipótesis 1 recibe respaldo).
Por otro lado, en cuanto a las correlaciones interfactoriales, el modelo alemán presentó cinco correlaciones no significativas (< .20), mientras que en el modelo peruano solo se halló una. Por ello, la segunda hipótesis recibe respaldo para el modelo peruano.
Notas: (I): Ítem invertido; en cursiva: cargas factoriales en el factor teórico; F1: Extraversión; F2: Amabilidad; F3: Responsabilidad; F4: Neuroticismo; F5: Apertura; ISF: Índice de simplicidad factorial.
De forma preliminar al análisis de la confiabilidad se analizó la tau-equivalencia, la cual no recibió respaldo en la versión peruana (Δχ2 = 94.47; Δgl = 10; p < .001) ni en la versión alemana (Δχ2= 138.89; Δgl = 10; p < .001). No obstante, se reporta el coeficiente α para fines descriptivos.
Según la Tabla 5, la versión alemana presenta los indicadores más bajos de confiabilidad del constructo y de puntuaciones. De forma más específica, sobre el coeficiente α, el BFI-15p alcanza magnitudes cercanas al mínimo requerido (≈ .70), aunque la correlación inter-ítem promedio en todos los casos fue aceptable. La versión alemana no llega al mínimo establecido en ambos casos.
Por último, el coeficiente ω alcanza magnitudes aceptables en todas las dimensiones del BFI-15p, y en el BFI-15a solo supera a .70 en dos dimensiones. Entonces, la versión peruana presenta mejores indicadores de confiabilidad del constructo y de puntuaciones (Hipótesis 3).
Notas: (I): Ítem invertido; en cursiva: cargas factoriales en el factor teórico; F1: Extraversión; F2: Amabilidad; F3: Responsabilidad; F4: Neuroticismo; F5: Apertura; ISF: Índice de simplicidad factorial.
Notas: F1: Extraversión; F2: Amabilidad; F3: Responsabilidad; F4: Neuroticismo; F5: Apertura; α: coeficiente alfa; r: promedio de la correlación entre ítems; ω: coeficiente omega.
Invarianza de medición según sexo
Para esta etapa, solo se consideró la versión peruana, en vista de las características estructurales y de confiabilidad de la versión alemana. De acuerdo con la variación de los índices de ajuste (Tabla 6), existe evidencia de invarianza de medición entre hombres y mujeres (Hipótesis 4).
Sobre las evidencias de validez basadas en la relación con otras variables, en términos generales, las dimensiones neuroticismo y responsabilidad muestran un patrón relacional significativo con las dimensiones del BS según lo esperado (Tabla 7). Estos resultados brindan respaldo para la Hipótesis 5.
Notas: CFI: Índice de ajuste comparativo; RMSEA: Error de aproximación cuadrático medio; IC: intervalo de confianza; Δ: variación.
Discusión
La investigación aquí descrita tuvo como objetivo reunir evidencia de validez basada en la estructura interna de dos versiones del BFI-15 en estudiantes universitarios chilenos, así como su asociación con el BS. Ante las evidencias reportadas, se estima que este objetivo fue alcanzado.
En cuanto al análisis de la estructura interna, aunque la magnitud de los índices de ajuste son un indicio razonable de dimensionalidad, las magnitudes favorables aparecen constantemente en el contexto del análisis ESEM, pero no garantizan una estructura interna sólida debido a la existencia de cargas cruzadas (e.g., Lara et al., 2021). Por ello, es deseable que se valoren otros elementos asociados con la estructura interna, como la magnitud de las cargas factoriales y la simplicidad factorial. Además de garantizar la validez del modelo, los modelos con cargas factoriales inconsistentes o excesivamente complejos pueden indicar problemas con la interpretación de los datos o con la propia estructura del instrumento (Matos & Rodrigues, 2019).
En ese sentido, solo un ítem de la versión peruana del BFI-15 (BFI-15p) muestra una carga baja y es factorialmente complejo en el grupo de participantes chilenos. Pero en la versión alemana (BFI-15a) se observaron más ítems con esas características. Estos resultados coinciden con el estudio realizado en universitarios peruanos (Dominguez-Lara & Merino-Soto, 2018a) en el que la propuesta alemana no prosperó porque los ítems no estaban lo suficientemente asociados para consolidar una dimensión, lo que repercutió tanto en la representatividad del constructo (cargas factoriales por debajo de lo esperado) como en la simplicidad factorial (presencia de ítems factorialmente complejos). Asimismo, los hallazgos son similares a los obtenidos con universitarios mexicanos, en donde la BFI-15p recibió evidencia favorable con respecto a su estructura interna en ese grupo (Dominguez-Lara et al., 2022). Es necesario resaltar que aquellos ítems catalogados como “complejos” en el BFI-15a son los ítems inversos, lo que reafirma la recomendación de minimizar o prescindir de su uso debido a los problemas metodológicos que traen consigo (ver Suárez-Alvarez et al., 2018). Esto se podría explicar por la cercanía cultural (Rammstedt et al., 2013), ya que existen más similitudes de Chile con Perú y México, donde funciona bien el BFI-15p, que con Alemania, donde su versión sí tiene evidencia favorable en países cercanos (e.g., Courtois et al., 2020).
Con relación a la confiabilidad, se destaca el desempeño de la BFI-15p en cuanto a la confiabilidad del constructo (> .70). No obstante, la confiabilidad de las puntuaciones fue determinante, ya que si bien la versión peruana mostró resultados aceptables (≈ .70), no fue el caso de la versión alemana (< .60). Esta situación se torna más compleja si se tiene en cuenta que ninguno de los modelos cumplió la tau-equivalencia, lo que implica que la confiabilidad está infraestimada (Candrinho et al., 2023; Dunn et al., 2014), y dados los valores del coeficiente ω el BFI-15p parece ser el más eficiente. Esto repercute notablemente en la toma de decisiones, ya que se conoce que la magnitud de la confiabilidad de las puntuaciones (coeficiente α) de una variable afecta negativamente los análisis estadísticos posteriores (Merino-Soto, 2020). Además, el coeficiente α depende del número de ítems y del cumplimiento de la tau-equivalencia (Candrinho et al., 2023), por lo que se utilizó de forma complementaria la correlación inter-ítem promedio como medida de confiabilidad de las puntuaciones (Gallego et al., 2024), pero aun en esas circunstancias el BFI-15a tiene mal desempeño en comparación con el BFI-15p.
En ese sentido, solo el BFI-15p presenta un mejor desempeño en la confiabilidad del constructo y puntuaciones. Este panorama se apreció en otros estudios en donde la confiabilidad de las puntuaciones de la versión alemana fue bastante baja (Dominguez-Lara & Merino-Soto, 2018a; Kim et al., 2010; Kunnel et al., 2019), mientras que el BFI-15p presentó coeficientes de mayor magnitud (Dominguez-Lara et al., 2022; Dominguez-Lara & Merino-Soto, 2018a, 2018b).
En vista de estos hallazgos es necesario indicar que la presencia de magnitudes bajas del coeficiente α aun con índices de ajuste aceptables podría asociarse tanto a la brevedad de la escala como a la amplitud del constructo que se evalúa (Stanley & Edwards, 2016). En cualquier caso, se debe tener en cuenta que estas magnitudes no son útiles para la toma de decisiones derivadas del uso individual del instrumento en un entorno profesional, solo es útil para contextos vinculados con la investigación.
Con respecto a la invarianza, se encontró evidencia favorable en hombres y mujeres, por lo que su uso permitirá realizar comparaciones justas. En ese sentido, sería interesante estudiar esas diferencias a futuro, ya que sería un estudio pionero considerando el uso de versiones breves.
La magnitud y dirección de las asociaciones entre las dimensiones del BFI-15p y las dimensiones del BS coinciden con evidencia previa (Anglim et al., 2020; Carmona-Halty & Rojas-Paz, 2014; Jensen et al., 2020; Kobylińska et al., 2022). Esto brinda más evidencias de validez en tanto que un perfil de personalidad caracterizado por bajo neuroticismo, alta extroversión, alta amabilidad y alta responsabilidad facilitaría el desarrollo de perspectivas cognitivas positivas, así como relaciones más estables y satisfactorias (Serrano et al., 2020). Esto es así dado que dependiendo del nivel en determinado rasgo de personalidad, el individuo desarrollará más afectos positivos (o negativos) frente a los diferentes eventos que experimente en su vida, lo que repercutirá directamente en su satisfacción, lo que resulta importante en el contexto universitario.
En cuanto a las implicaciones prácticas de los resultados, el BFI-15p presenta una característica distintiva en comparación con otros instrumentos para este propósito: su cantidad reducida de ítems. Así, su uso reduce la posibilidad de respuestas aleatorias o poco conscientes que podrían afectar los resultados. Además, la parsimonia del BFI-15p reduce la probabilidad de rechazo a participar en encuestas debido a limitaciones de tiempo. Esto es especialmente relevante dado que los investigadores utilizan diversas escalas en los estudios, y el uso de escalas reducidas como el BFI-15p puede minimizar estos problemas. Esto permite, por ejemplo, una aplicación rápida en diversas situaciones, como evaluación psicológica en procesos de selección o investigaciones institucionales para evaluar a sus profesionales. Además, se destaca la importancia de continuar la evaluación de los rasgos de personalidad en el contexto universitario. La especificidad de este contexto requiere una atención especial al bienestar, la calidad de vida y la salud mental de los estudiantes, justificada por las evidencias observadas en los diferentes estudios citados sobre la relación entre estas variables y los rasgos de personalidad. De forma complementaria, resulta de utilidad contar con una versión breve del BFI que presente adecuadas propiedades psicométricas en otros países de la región, ya que ello facilitaría las investigaciones interculturales porque se conoce que, al menos de forma individual, la estructura interna se replica satisfactoriamente. De este modo, de forma conjunta con la validación de la versión extensa en Chile (Lara et al., 2021), se tienen más herramientas a libre disposición para los académicos e investigadores a fin de continuar enriqueciendo el conocimiento acerca del constructo en esta parte del continente dada su relevancia a lo largo de la vida de la persona (Mõttus & Rozgonjuk, 2021).
En cuanto a las fortalezas del estudio, es necesario destacar el tamaño muestral (> 1000), que permitió mayor precisión en las estimaciones. Del mismo modo, debe destacarse el uso del ESEM, ya que actualmente resulta la mejor opción para representar un modelo complejo, como el 5GF, en lugar de un análisis basado en el análisis factorial confirmatorio (e.g., Chiorri et al., 2016). No obstante, también se encontraron limitaciones inherentes al método, como los sesgos asociados a las escalas de autoevaluación, especialmente para este contexto, así como la ausencia de representatividad de los datos con relación a la población universitaria chilena. Si bien el elevado tamaño muestral reduce el error de muestreo, la generalización debe realizarse con cautela.
Se concluye que el BFI-15p es un instrumento que presenta propiedades psicométricas adecuadas para su uso en universitarios chilenos: una estructura interna sólida, indicadores adecuados de confiabilidad, y se asocia coherentemente con las dimensiones del BS, uno de los constructos más importantes y que orienta políticas públicas en países europeos (Calleja & Masón, 2020).
Por último, para futuros estudios de replicación se recomienda el uso de más variables externas para profundizar en el conocimiento sobre la validez de las interpretaciones de los puntajes de esta medida. Además, se pueden emplear otras formas de control de calidad de respuesta para minimizar los sesgos de sobreestimación y subestimación de las características de la personalidad. Sin embargo, considerando el amplio tamaño de la muestra y los procedimientos utilizados en esta investigación, los datos sugieren la adecuación del BFI-15p. Del mismo modo, en futuros estudios se podría utilizar un muestreo de tipo probabilístico, y así realizar un análisis comparativo según el sexo, ya que la argumentación teórica, el análisis del estado del arte y de la evidencia empírica excede los objetivos de este manuscrito. Por último, ayudaría conocer la estabilidad temporal de las dimensiones, así como un análisis de invarianza según país de procedencia debido a la importancia de la personalidad en diferentes contextos (Dash et al., 2019; Thielmann et al., 2020; Zell & Lesick, 2022).