El potencial discriminatorio de las secuencias de categorías gramaticales en la atribución forense de autoría de textos en español

Spassova, Maria Stefanova

El potencial discriminatorio de las secuencias de categorías gramaticales en la atribución forense de autoría de textos en español

Spassova, Maria Stefanova

Dirigida por:

María Teresa Turell Julià Director/a

Universidad de defensa: Universitat Pompeu Fabra

Fecha de defensa: 04 de diciembre de 2009

Tribunal:

Enrique Bernárdez Sanchís Presidente
Núria Bel Rafecas Secretario/a
Lawrence Solan Vocal
Jordi Cicres Bosch Vocal
Malcolm Coulthard Vocal

Tipo: Tesis

Teseo: 283830 DIALNET TDX editor

Resumen

El objetivo principal de esta tesis es evaluar el potencial discriminatorio de los n-gramas- esto es, combinaciones de secuencias de categorías gramaticales- como posibles marcas de autoría para los fines de la comparación forense de textos escritos en español. La tesis se centra en dos tipos específicos de n-gramas: los bigramas y los trigramas. Las principales hipótesis de la tesis son, por un lado, que los n-gramas poseen un potencial discriminatorio alto en el análisis de producciones escritas por diferentes autores (variación inter autor). Por otro lado, que la frecuencia de los n-gramas no varía de forma significativa entre las producciones escritas del mismo individuo en el transcurso del tiempo (variación intra autor). La evaluación del potencial discriminatorio de los n-gramas se ha llevado a cabo en dos corpus diferentes: a) un corpus general de la lengua española; y b) un corpus de casos forenses reales. Los resultados han indicado que los dos tipos de n-gramas tienen un potencial discriminatorio alto cuando se aplican a los dos corpus. Además, se ha demostrado que la frecuencia de los n-gramas no varía significativamente entre textos escritos producidos por el mismo autor en un intervalo temporal inferior a 20 años.