El potencial discriminatorio de las secuencias de categorías gramaticales en la atribución forense de autoría de textos en español

  1. Spassova, Maria Stefanova
Dirigida por:
  1. María Teresa Turell Julià Director/a

Universidad de defensa: Universitat Pompeu Fabra

Fecha de defensa: 04 de diciembre de 2009

Tribunal:
  1. Enrique Bernárdez Sanchís Presidente
  2. Núria Bel Rafecas Secretario/a
  3. Lawrence Solan Vocal
  4. Jordi Cicres Bosch Vocal
  5. Malcolm Coulthard Vocal

Tipo: Tesis

Teseo: 283830 DIALNET lock_openTDX editor

Resumen

El objetivo principal de esta tesis es evaluar el potencial discriminatorio de los n-gramas- esto es, combinaciones de secuencias de categorías gramaticales- como posibles marcas de autoría para los fines de la comparación forense de textos escritos en español. La tesis se centra en dos tipos específicos de n-gramas: los bigramas y los trigramas. Las principales hipótesis de la tesis son, por un lado, que los n-gramas poseen un potencial discriminatorio alto en el análisis de producciones escritas por diferentes autores (variación inter autor). Por otro lado, que la frecuencia de los n-gramas no varía de forma significativa entre las producciones escritas del mismo individuo en el transcurso del tiempo (variación intra autor). La evaluación del potencial discriminatorio de los n-gramas se ha llevado a cabo en dos corpus diferentes: a) un corpus general de la lengua española; y b) un corpus de casos forenses reales. Los resultados han indicado que los dos tipos de n-gramas tienen un potencial discriminatorio alto cuando se aplican a los dos corpus. Además, se ha demostrado que la frecuencia de los n-gramas no varía significativamente entre textos escritos producidos por el mismo autor en un intervalo temporal inferior a 20 años.