El potencial discriminatorio de las secuencias de categorías gramaticales en la atribución forense de autoría de textos en español

Spassova, Maria Stefanova

El potencial discriminatorio de las secuencias de categorías gramaticales en la atribución forense de autoría de textos en español

Spassova, Maria Stefanova

unter der Leitung von:

María Teresa Turell Julià Doktorvater/Doktormutter

Universität der Verteidigung: Universitat Pompeu Fabra

Fecha de defensa: 04 von Dezember von 2009

Gericht:

Enrique Bernárdez Sanchís Präsident
Núria Bel Rafecas Sekretär/in
Lawrence Solan Vocal
Jordi Cicres Bosch Vocal
Malcolm Coulthard Vocal

Art: Dissertation

Teseo: 283830 DIALNET TDX editor

Zusammenfassung

El objetivo principal de esta tesis es evaluar el potencial discriminatorio de los n-gramas- esto es, combinaciones de secuencias de categorías gramaticales- como posibles marcas de autoría para los fines de la comparación forense de textos escritos en español. La tesis se centra en dos tipos específicos de n-gramas: los bigramas y los trigramas. Las principales hipótesis de la tesis son, por un lado, que los n-gramas poseen un potencial discriminatorio alto en el análisis de producciones escritas por diferentes autores (variación inter autor). Por otro lado, que la frecuencia de los n-gramas no varía de forma significativa entre las producciones escritas del mismo individuo en el transcurso del tiempo (variación intra autor). La evaluación del potencial discriminatorio de los n-gramas se ha llevado a cabo en dos corpus diferentes: a) un corpus general de la lengua española; y b) un corpus de casos forenses reales. Los resultados han indicado que los dos tipos de n-gramas tienen un potencial discriminatorio alto cuando se aplican a los dos corpus. Además, se ha demostrado que la frecuencia de los n-gramas no varía significativamente entre textos escritos producidos por el mismo autor en un intervalo temporal inferior a 20 años.