LVA (layered Voice Análisis) Analizador de voz por capas
Contenido |
Introducción
Entre los procedimientos orientados a la detección de la mentira, se encuentran los basados en una orientación psicofisiológica, que parten de la medición, registro y análisis de la detección de la activación del sujeto como medio para evaluar su credibilidad.
En esta orientación psicofisiológica se encuentra la voz, canal comunicativo que contiene atributos que correlacionan con los procesos cognitivos y emocionales que el sujeto entrevistado atraviesa mientras habla.
El mecanismo del habla humana es uno de los procesos más complejos que es capaz de realizar el cuerpo humano por la gran cantidad de músculos y sistemas físicos utilizados y la forma en que estos se sincronizan.
La voz es el sonido producido por la espiración del aire, vibrando al pasar por los órganos fonoarticulatorios y resonadores que son, la laringe, la faringe, las fosas nasales y boca.
Las cualidades de la voz:
-La frecuencia dependiente fundamentalmente de la laringe, es la cantidad de vibraciones por segundo que produce las cuerdas vocales, su regulación se produce mediante los músculos tensores.
-La intensidad dependiente fundamentalmente de la laringe, es regulada por la presión subglótica de aire.
-El timbre dependiente de la laringe y del resto de órganos fonoarticulatorios, es decir depende de la caja de resonancia, de las dimensiones del tracto vocal y sus variaciones mediante el distinto acomodamiento del individuo. Identidad de la persona.
Inicialmente, el cerebro comprende una situación dada y las posibles consecuencias de cualquier cosa que se diga. Entonces, cuando una persona decide hablar, el aire es empujado hacia arriba desde los pulmones a las cuerdas vocales. Esto hace que las cuerdas vocales vibren a una frecuencia específica y produzcan un sonido. La vibración del aire continúa fluyendo hacia la boca, donde es manipulado por la lengua, los dientes y los labios produciendo flujos de sonidos que nosotros interpretamos como palabras o frases.
El cerebro sigue de cerca todos estos procesos, asegurando que el sonido emitido es el que se pretende, que sea inteligible y que esté a un volumen que puede ser escuchado por el oyente. Debido al constante monitoreo cerebral, cada “evento” que pasa a través del cerebro deja rastro en el flujo de voz.
Si bien parece no existir patrones vocales asociados para cada emoción, diversos autores sí han concluido que existen determinadas características acústicas relacionadas con las emociones básicas. Así, Iriondo Sanz (2008) realizó una traducción de las propuestas de Murray y Arnott (2008) en las se comprueba cómo se pueden atribuir cualidades diferenciadas a cinco de las emociones básicas en las características de velocidad, cualidad y articulación de la voz y de promedio, rango y cambios en la frecuencia fundamental.
La tecnología LVA 6.50 de Nemesysco se enmarca en el ámbito del uso de la voz para la detección de la mentira, ignorando lo que el sujeto está diciendo (es decir, el contenido específico) y centrándose en los cambios en la actividad cerebral que se reflejan en la voz.
Definición
LVA 6.50 es una herramienta perteneciente a la empresa Nemesysco basada en la tecnología LVA (layered Voice Análisis). Es una tecnología inventada en Israel en 1997 por Amir Liberman, director general de la compañía. Originalmente se desarrolló con fines de seguridad y actualmente proporciona soluciones de análisis de voz en mercados de defensa y civiles.
LVA utiliza la detección de “los rastros” de la actividad cerebral mediante la voz. Parte de la idea de que los cambios en la percepción cortical y la interpretación de los hechos se manifiestan en la forma de onda vocal durante el habla.
Se basa en una amplia gama de análisis del espectro de la voz para detectar los cambios involuntarios en la onda de voz. El análisis del espectro de voz, realizado en tiempo real o a partir de grabaciones, se basa en la característica de la voz humana compuesta por la combinación de muchas frecuencias, clasificadas en varios grupos conocidos como “formantes”. Los “formantes” son copias de esas combinaciones de frecuencias con en diferentes amplitudes y difieren de una persona a otra. El rango normal de frecuencias en varones humanos es de entre 100 Hz a 3 KHz, la voz femenina es generalmente más alta y oscila entre los 200 Hz y 6 KHz. El análisis de LVA presenta una clasificando de combinaciones de frecuencias de estos grupos denominados "formantes".
LVA 6.50
La clave de la tecnología LVA, que utiliza 129 parámetros vocales, deriva de la información generada a partir de algoritmos que analizan cambios mínimos en el Rango de la Alta Frecuencia Relativa (RAFR) y en el Rango de la Baja Frecuencia Relativa (RBFR). Las permutaciones entre estos dos rangos de voz es lo que la herramienta recibe y analiza con el objetivo de detectar y medir los cambios involuntarios en la forma de onda del habla y crear la base de lo que denomina perfil emocional del entrevistado.
A modo de ejemplo, en los estados de alta emocionalidad y alta excitación se observan Rangos de Alta Frecuencia Relativa (RAFR) y en estados de estrés, de pensamiento y de otros procesos cognitivos como la imaginación, se dan Rangos de la Baja Frecuencia Relativa (RBFR).
El término “Análisis de Capas” indica que LVA utiliza diferentes enfoques y modelos analíticos para combinándolos ofrecer conclusiones, basadas en estructura de “capa sobre capa”. Así, el proceso de análisis de LVA se compone de varios pasos, algunos de los cuales dependen de la funcionalidad selecciona en el sistema:
1. Capa de proceso de segmentación. En esta primera parte se identifican los segmentos relevantes en el flujo de datos de la voz.
2. Capa de proceso de selección secundario. Una vez que un segmento de voz está marcado para análisis, en la siguiente capa de análisis se somete a un nuevo proceso de selección y se eliminan partes de los componentes del lenguaje humano que la herramienta no tiene capacidad de analizar.
3. Capa de análisis de dominio de tiempo. Tomando los componentes válidos para análisis resultado del paso 2, se analizan para identificar lo que la herramienta llama “indicadores emocionales” primarios. Estos son pequeñas secuencias inaudibles y que no pueden ser controladas, que crean desviaciones en los patrones del habla del entrevistado.
4. Estas secuencias se miden y analizan usando mediciones cuantificables y aplicando método estadístico para crear el segundo nivel de parámetros vocales que LVA utiliza para su análisis.
5. Capa de análisis de dominio de frecuencia. En esta etapa, se analiza una gama específica de frecuencias de voz usando el método FFT ([Fast Fourier Transform][1]). La modulación de la frecuencia se examina para determinar los componentes únicos, estabilidad estructural y otros indicadores comercialmente confidenciales.
6. Capa de la fase de calibración. Dependiendo del modo de operación, LAV calcula una línea base de 3 dimensiones del estado emocional del participante. La línea base se compone de un valor promedio de los parámetros vocales, la sensibilidad de estos parámetros (en términos de valores altos y bajos) y de su estabilidad a lo largo del tiempo. En función de esta línea base y en función del tipo de utilización del LVA, se calcula una “fórmula de riesgo” que por naturaleza es una medida subjetiva.
7. Capa de análisis primario. Una vez que se ha calculado la línea base, todos los parámetros vocales de todos los segmentos de voz se comparan con ella, tomando en cuenta la sensibilidad del parámetro específico. El resultado de esta fase revela el nivel de excitación, confusión / certidumbre, estrés (en términos de lucha o huida), concentración, anticipación, vacilación, vergüenza y esfuerzo mental invertido en la enunciado relevante.
8. Capa de cálculo del “riesgo”. Usando la fórmula de riesgo específica y única para cada sujeto, calculada en la fase de calibración, los indicadores primarios se usan para calcular la desviación total respecto a la línea base de veracidad. Cuanto mayor sea la desviación, la herramienta muestra una mayor probabilidad de engaño o falsedad.
9. Capa de probabilidad del error. Los mismos parámetros emocionales básicos y calculados, en esta fase de comparan con una fórmula estadística de acuerdo a investigaciones propias y llega a una medición estadística objetiva de las posibilidades de falsedad.
10. Capa de detección de “patrones de engaño”. En esta fase, toda la estructura emocional se contrasta con un conjunto predefinido de “estructuras emocionales”, que la herramienta las toma como indicadores (en varios grados de probabilidad) de diferentes tipos de engaño (por ejemplo, derivadas de diferentes motivaciones).
11. Capa de detección de emoción. Si fuese necesario por el tipo específico de análisis (por ejemplo, en el análisis Nemesysco QA5 SDK para proveedores de Call Centers), los parámetros vocales se usan para generar la “bolsa de emociones”, que incluye: enfado, felicidad, tristeza, estrés, concentración, excitación, confusión, vacilación, anticipación y vergüenza, todas en un rango normalizado de valores entre 0 y 30.
12. Capa de tecnología Lionet TM. Es un mecanismo de decisión heurístico entrenable, diseñado para mejorar más el análisis general y para aprender a identificar, basándose en la experiencia y en el feedback de los usuarios, nuevos tipos de estructuras emocionales, indicativos de estados emocionales, como por ejemplo: “listo para comprar” o “cancelación de una orden”, que podría ser apropiados para aplicaciones de call centers.
13. Capa final de análisis. Dependiendo del tipo de utilización, LVA examina todos los resultados de la fase de análisis para llegar a un análisis de texto del segmento analizado, basado en una jerarquía interna de reglas. Si no se encuentra ningún indicio el resultado será “Verdad”. Si se encuentra únicamente alguna señal de excitación, el sistema mostrará el mensaje de “excitación” y así sucesivamente. LVA tiene 5 niveles de análisis de falsedad: “riesgo leve”, “sospechoso”, “inexacto”, “probablemente falso” y “riesgo alto”. La determinación de falsedad, si se requiere por el tipo de utilización del LVA, se mostrará sólo si hay datos suficientes (nivel de riesgo y probabilidad de mentira) para soportar este resultado.
14. Capa de análisis general (la “firma emocional” de una sesión completa). Una vez que la conversación o la sesión de prueba ha terminado, la tecnología crea un vector de números que resume toda la actividad emocional detectada a través de los diferentes segmentos de voz. Este vector puede entonces procesarse de nuevo por el mecanismo LioNet, para determinar una clasificación de la sesión completa de acuerdo a las preferencias del usuario o a las necesidades específicas del sistema
En sus capas fundamentales, la tecnología identifica varios indicadores clave a partir de la forma de la onda, cada una indicativa de un tipo diferente de actividad cerebral o proceso cognitivo. Los indicadores tipo “Ts”, por ejemplo, corresponden a intervenciones de alta frecuencia local asociada habitualmente con una reacción emocional. Los “Js” se dan en situaciones en las que una relativamente baja frecuencia se superpone a la frecuencia principal (fundamental “F0”) y se asocian a procesos lógicos. Los “As”, “Xs” y “Fs” corresponden a secuencias más complicadas y su descripción exacta no es descrita por la compañía por motivos de confidencialidad y protección de su “know-how”. Estos indicadores fundamentales se usan para calcular 2 conjuntos de estructuras y 51 parámetros de voz/emoción categorizados en seis grupos:
1. Grupo emocional: utilizado para representar estrés emocional, nivel de excitación, análisis de felicidad y tristeza, enfado (parcialmente) y atmosfera general de la sesión.
2. Grupo lógico: utilizado para representar el estrés cognitivo, niveles de confusión/certeza, esfuerzo mental, análisis de imaginación y vacilación (también usado parcialmente para detección de enfado).
3. Grupo de energía: usado para proporcionar información de apoyo para algunos análisis emocionales, siendo por si mismo un valioso conjunto de indicadores.
4. Grupo de estrés relacionado: se utiliza para generar el análisis general de tensión (detección según paradigma lucha o huida) y como apoyo al cálculo de la probabilidad de mentira y de la detección del estrés clínico.
5. Grupo de estabilidad: usado para calcular la concentración, vergüenza, indicadores de vacilación SOS (Say-or-Stop), anticipación y activación.
6. Grupo especial de indicadores: usado en diferentes capas del proceso de análisis, típicamente como apoyo a la detección realizada por el resto de grupos.
Los 9 patrones de engaño, llamados “estructuras emocionales”, que utiliza la herramienta están asociados con diferentes motivaciones para el engaño y, según Nemesysco, habitualmente tiene probabilidad alta, de ser detectados. Estos patrones los usa la herramienta para análisis en mayor profundidad en las modalidades offline y de investigación. La utilización de estos patrones requiere de un buen entendimiento de la situación en la que se aplica el test, ya que algunos patrones sólo aplican en ciertas situaciones:
• Patrón 1 de engaño: Mentira ofensiva
• Patrón 2 de engaño: Excitación y conflicto lógico extremos
• Patrón 3 de engaño: Estrés de nivel extremo con SOS (Say or Stop)
• Patrón 4 de engaño: Mentira debido a vergüenza
• Patrón 5 de engaño: Alerta extrema y bajos niveles de pensamiento
• Patrón 6 de engaño: Alerta extrema baja y conflicto severo
• Patrón 7 de engaño: Alerta extrema baja y excitación muy alta
• Patrón 8 de engaño: Alerta extrema baja y conflicto muy alto
• Patrón 9 de engaño: Caso general extremo
Nemesysco afirma que LVA puede detectar variaciones en la actividad cerebral y clasificarlos en términos de estrés, de emoción, de engaño y de los diferentes estados emocionales. Según la compañía, esto permite dar indicaciones sobre cómo los sujetos evaluados se sienten mientras hablan y advertir al entrevistador sobre posibles aspectos dignos de atención. Esta información permitiría identificar intenciones maliciosas, proporcionar evaluaciones de riesgo y revelar emociones del entrevistado.
Objetivo
Es detectar las emociones a través del análisis de la voz, identificar el estado de ánimo del sujeto en el momento del análisis, el estrés, los procesos cognitivos, las reacciones emocionales y detectar la credibilidad del sujeto.
Como Nemesysco afirma, los profesionales en el campo de la verificación de la verdad saben que no existe tal cosa como un verdadero "detector de mentiras", ya que la mentira no está asociada a una reacción específica o estado mental”.
La mentira es el resultado de un proceso lógico detrás del que hay una intención particular. Algunas personas mienten para protegerse de una amenaza y otras obtener posibles beneficios. Debido a las diferentes motivaciones es difícil determinar unas características psicológicas o fisiológicas que diferencien inequívocamente la mentira de la verdad.
El objetivo de la herramienta LVA 6.50 es detectar la intención detrás de las palabras habladas, revelando así la intención de mentir, consiguiendo estar más cerca de ser un detector de emocional que podría usarse como detector de la mentira.
La herramienta realiza el análisis de conversaciones en tiempo real o en grabaciones, facilitando una evaluación de su credibilidad, mediante:
• La identificación del estado de ánimo del sujeto y el análisis de las propiedades relevantes de su voz
• La identificación de diferentes tipos de estrés, procesos cognitivos y reacciones
• Creando una “firma emocional” de la expresión del individuo en un momento dado
• Detectando motivación engañosa, intención criminal y, en general credibilidad, mediante la identificación de códigos clave reflejados en su voz, obteniendo la firma de voz.
LVA 6.50 es una herramienta diseñada para usarse por Gobiernos y Fuerzas Oficiales de Seguridad, Agencias de Seguridad de Gobierno, Investigadores Privados y Corporativos. Su objetivo es permitir una verificación más rápida de la verdad, buscando más eficiencia en los procesos de investigación y mayor rentabilidad para las organizaciones.
Según Nemesysco, LVA 6.50 es una herramienta desarrollada para investigación.
Eficacia
Según datos de la compañía, en situaciones en las que existen verdaderas intenciones de engaño, establece un índice de detección por encima del 90%. Si bien Nemesysco especifica ciertas aspectos a considera para una aplicación eficaz de la herramienta:
• debe ser empleada en las situaciones reales, en las que las intenciones de engaño sean reales y
• ha de llevarse a cabo por operadores entrenados y con material de validez efectiva (sin exceso de ruido de fondo, preguntas incoherentes, etc).
Este dato difiere de los resultado hallados en la investigación “Assesing Deception by Voice Analysis: Part II: The LVA” realizada por James D. Harnsberger y Harry Hollien y publicada en “Investigative Sciences Journal” Volume 8, Number 1, January 2016, llevada a cabo para revisar la eficacia del LVA como evaluador de estrés psicológicos cuando se emplea en un intento de detectar el engaño. En este estudio los hallazgos reportados por Horvath, McCloughan, Weatherman y Slowik (2013), en su evaluación del valor de LVA en la detección de la mentira, proporcionan los siguientes resultados:
• los operadores de LVA produjeron llamadas correctas para el engaño, en promedio, en el 25% del tiempo cuando el engaño fue verificado por examen de polígrafo.
• si no existía engaño (es decir, los sospechosos / sujetos eran verídicos) los operadores LVA eran correctos en el 49% del tiempo.
• cuando las personas "culpables" habían confesado su participación en el asunto bajo investigación y por lo tanto habían reconocido su engaño, la exactitud del análisis LVA promedió el 48%.
En resumen, no hubo ningún caso en el que el LVA produjo decisiones correctas en un nivel mayor que el azar. En otras palabras, la investigación disponible, no muestra la LVA con la capacidad de detectar el engaño ni la veracidad.
Aplicación
LVA 6.50 se utiliza como una herramienta de investigación y factor de decisión en áreas de Seguridad y Comerciales.
Los usuarios del ámbito de la Seguridad requieren herramientas que les proporcione la cantidad adecuada y necesaria de información para el caso en cuestión. Cualquier dato no relevante puede ocultar lo que es esencial. Según Nemesysco, LVA permite identificar los segmentos de información relevantes rápidamente y proporciona datos críticos sobre el riesgo de engaño, para permitir al usuario enfocar el tiempo de la investigación a potenciales sospechosos y reducir el tiempo dedicado a datos irrelevantes.
Mientras los productos de uso comercial de Nemesysco proporcionan datos más generales, LVA tiene un rango dinámico de sensibilidad que permite a los usuarios de nivel básico enfocarse en aquellos indicadores emocionales que son absolutamente relevantes. Además, LVA está equipado con herramientas que permiten explorar partes de información con mayor profundidad. La tecnología LVA se puede utilizar en tiempo real (para cualquier tipo de caso o tema) y en el modo fuera de línea (para exploraciones más profundas) a partir de datos registrados en casi cualquier tipo de fuente, según afirma la compañía.
De acuerdo a información de Nemesysco, la LVA 6.5 se ha aplicado en ámbitos y empresas como:
• Aeroportuario (Aeropuerto de Domodedovo (Rusia))
• Seguros (Compañías de seguros Británicas)
• Policial
• Finanzas (Ministerio de Finanzas de Guatemala)
• Servicios de Correos (Rusia)
• Departamento Correccional de Wisconsin (EEUU)
• Cámara de Seguros del Estado de Nuevo México (EEUU)
En el caso de utilizarse la herramienta LVA como elemento probatorio de culpabilidad, Nemesysco recomienda combinarla con otras estrategias y elementos de prueba y no aconseja su uso como elemento único y exclusivo de discriminación. Así mismo, recuerda que no es una prueba admisible en los Tribunales.
Referencias
- Elkins, A-C. .(2010). Evaluating the Credibility Assessment Capability of Vocal Analysis Software. Extraído el 27 de mayo de 2005. http://www.ministryoftruth.me.uk/wp-content/uploads/2012/02/Elkins2010.pdf
- Elkins, A. C. Burgoon J. Validating Vocal Analysis Software to Assess Credibility in Interpersonal Interaction A Multilevel Factor_Analytic Approach. Extraído el 27 de mayo de 2015. http://www.researchgate.net/profile/Judee_Burgoon/publication/260961632_Validating_Vocal_Analysis_Software_to_Assess_Credibility_in_Interpersonal_Interaction_A_Multilevel_Factor_Analytic_Approach/links/54161e900cf2fa878ad3fd28.pdf
- García Atarés, N. López Muñiz, A. Sánchez Barbero, Mª. R. Smith-Fernández, V. Suárez Quintanilla, J. A. de Toro Santos, F. J. (2004)Anatomía de los órganos del lenguaje, visión y audición. Madrid. Editorial Médica Panamericana, S.A.
- López, R., Fernando Gordillo, & Marta Grau. (2016). Comportamiento no Verbal. Madrid: Pirámide.
- Nemesysco. Layered Voice Analysis (LVA)Technology White Paper. Extraido el 27 de mayo de 2015. http://ethics.mx/rec-tec/1/08%20LVA%20Technology%20White%20Paper%202012%20Espa%C3%B1ol.pdf
- Petisco Rodríguez, J.M. Detección y medición del engaño. ¿Mienten los detectores de mentiras?. Cuadernos de la Guardia Civil: Revista de seguridad pública, ISSN 1136-4645, Nº 46, 2012 , págs. 63-76
- J. D. Harnsberger, H. Hollien, C. A. Martin, and K. A. Hollien, “Stress and deception in speech: evaluating layered voice analysis, ”Journal of forensic sciences, vol. 54, no. 3, pp. 642–650, 2009.
- J. D. Harnsberger, H. Hollien, “Assessing deception by voice analysis: part II: The LVA, ”Investigate Science Journal”, vol. 8, no. 1, 2016.