Propuesta de formalización de las locuciones nominales para un diccionario electrónico español
- 1 Universidad Complutense de Madrid, España
- Barrios Rodríguez, María Auxiliadora (coord.)
ISSN: 0212-7636, 2171-6692
Año de publicación: 2021
Título del ejemplar: De la palabra y las palabras. Trabajos de Lexicología y Fraseología
Número: 36
Páginas: 67-87
Tipo: Artículo
Otras publicaciones en: ELUA: Estudios de Lingüística. Universidad de Alicante
Resumen
Las locuciones nominales del español constituyen un rico recurso para la evaluación de personas, entidades y acontecimientos, pero no siempre hay acuerdo en cuanto a su categorización semántica y sintáctica. Su clasificación debería ser sistemática y coherente, y así se facilitaría su inclusión en cualquier recurso lingüístico. Sin embargo, las diversas fuentes ofrecen datos que pueden resultar contradictorios para cualquier desambiguador morfosintáctico o semántico. Así, por ejemplo, los diccionarios de uso del español recogen estas locuciones agrupadas por su forma, de modo que en la entrada canela se puede encontrar canela en rama y canela en polvo, pero la polisemia de canela en rama (tipo de canela, o alguien o algo excelente) solo se refleja en la definición. Los diccionarios electrónicos precisan de información semántica y sintáctica, por lo que se debe hacer explícito que el primer sentido de canela en rama funciona como un sustantivo y el segundo como un adjetivo. Aquí nos servimos de una tipología y de un modo de formalizar las locuciones nominales del español creada en el marco de la Teoría Sentido-Texto y basada en el análisis semántico de un corpus de setecientas setenta y seis construcciones nominales. Las locuciones se clasifican de modo formal mediante unas funciones léxicas creadas ad hoc. Esta propuesta se ha implementado en el diccionario electrónico del español Diretes. Gracias a la formalización mencionada, se puede navegar en el diccionario en sentido inverso al habitual, de modo que desde bueno se puede llegar a excelente, y desde excelente a canela en rama. Se presentan algunos resultados y se concluye que, a pesar de lo reducido del corpus analizado, la implementación en el diccionario permite validar la tipología de las locuciones nominales con la que se ha trabajado y la formalización de funciones léxicas propuesta.
Información de financiación
Esta investigación se ha realizado en el curso del proyecto “Diretes: Diccionario Reticular Español. Diccionario analógico y relacional con acceso en red desde el sentido y desde la forma” (FFI-2017-83293), financiado por el Ministerio de Ciencia, Innovación y Universidades, y por fondos europeos (FEDER).Financiadores
Referencias bibliográficas
- Alonso Ramos, M. (2009). "Delimitando la intersección entre composición y fraseología", LEA: Lingüística Española Actual, 31(2), pp. 243-275.
- Anglada Arboix, E. (2005). Lexicografía española. Barcelona: Universitat de Barcelona.
- Apresjan, J., I. Boguslavsky, L. L. Iomdin, A. Lazursky, V. Sannikov, V. Sizov y L. Tsinman (2003). "ETAP-3 Linguistic Processor: a Full-Fledged NLP Implementation of the Meaning-Text Theory". Moscú: Institute for Information Transmissions Problems: http://proling.iitp.ru/bibitems/ETAP_and_MTT.pdf (26/10/2021).
- Barrios Rodríguez, M.A. (2010). El dominio de las funciones léxicas en el marco de la Teoría Sentido-Texto. Estudios de Lingüística del español (ELiEs), vol 30. http://elies.rediris.es/elies30/index30.html (26/10/2021).
- Barrios Rodríguez, M.A. (2015). Las colocaciones del español. Madrid: Arco/Libros.
- Barrios Rodríguez, M.A. (2019a). "¿Aún queda alguien para quien no exista un diccionario? Diretes, un diccionario electrónico apto para máquinas". En Cazorla, M.C., M.A. García Aranda, & P. Nuño (eds.). Lo que hablan las palabras. Estudios de lexicología, lexicografía y gramática en honor de Manuel Alvar Ezquerra. Lugo: Axac, pp. 33-46.
- Barrios Rodríguez, M.A. (2019b). "Minimal and inverse definitions: a semi-experimental proposal when building a Spanish dictionary with semantic primes and molecules". En Peeters, B., K. Mullan y L. Sadow (eds.). Studies in Ethnopragmatics, (Cultural) Semantics, and Minimal English. Berlin: Springer, pp. 191-212.
- Barrios Rodríguez, M. A. (2020). "The making of the Diretes dictionary". En Gavriilidou, Z., M. Mitsiaki y A. Fliatouras (eds.). Lexicography for inclusion. EURALEX Proceedings. XIX Congress of the European Association for Lexicography. Alexandroupolis: Democritus University of Thrace/ European Association for Lexicography, pp.13-22.
- Barrios Rodríguez, M. A. (2022). Las colocaciones nominales: una aproximación desde la Teoría Sentido-Texto. Santiago de Compostela: Verba. Anuario Galego de Filoloxía, Anexo 82.
- Barrios Rodríguez, M. A. e I. Boguslavsky. (2019). "A Spanish E-dictionary: Standard and Non-standard Lexical Functions". En Kahane S. y K. Gerdes (eds.). Depling 2019 Proceedings. Stroudsburg: Association for Computational Linguistics (ACL): https://www.aclweb.org/anthology/W19-7700/ (26/10/2021).
- Bosque-Gil, J., J. Gracia, E. Montiel-Ponsoda y G. Aguado-de-Cea (2016). "Modelling multilingual lexicographic resources for the web of data: the K dictionaries case". En Kenerman, I., I. Kosem, S. Krek y L. Trap-Jensen (eds.). Proceedings GLOBALEX Lexicographic Resources for Human Language Technology: http://www.lrec-conf.org/proceedings/lrec2016/workshops/LREC2016Workshop-GLOBALEX_Proceedings-v2.pdf (26/10/2021).
- Bosque-Gil, J., J. Gracia, E. Montiel-Ponsoda y A. Gómez-Pérez (2018). "Models to represent linguistic linked data", Natural Language Engineering, 24(6), pp. 811-859.
- Bosque-Gil, J., D. Donke, J. Gracia y I. Kernerman (2019). "Validating the Ontolex-lemon with K-dictionaries Multilingual Data". En Kosem, I. et alii. Electronic lexicography in the 21 st century. Proceedings of e-Lex 2019 Conference. Brno: Lexical Computing, pp. 726-746: https://elex.link/elex2019/wp-content/uploads/2019/09/eLex_2019_41.pdf (26/10/2021).
- Bosque Muñoz, I. (1989). Las categorías gramaticales. Relaciones y diferencias. Madrid: Síntesis.
- Bosque Muñoz, I. (1999). "El nombre común". En Bosque Muñoz, I. y V. Demonte Barreto (eds.). Gramática descriptiva de la lengua española. Madrid: Espasa, pp. 3-75.
- Bosque Muñoz, I. (2004). Redes. Diccionario combinatorio del español contemporáneo. Madrid: S.M.
- Bosque, I. (2017). "Posibilidades de un diccionario onomasiológico de modismos para estudiantes de ELE. En Ainciburu, M. C. y C. Fernández Silva (eds.). La adquisición de la lengua española: aprendizaje, enseñanza, evaluación. Estudios en Homenaje a Marta Baralo Ottonello. Buenos Aires: Autores de Argentina, pp. 26-37.
- Buenafuentes de la Mata, C. (2007). Procesos de gramaticalización y lexicalización en la formación de compuestos en español. Barcelona: Universidad Autónoma de Barcelona.
- Buenafuentes de la Mata, C. (2010). La composición sintagmática en español. Ciluenga: San Millán de la Cogolla.
- Buendía-Castro, M. (2020) Verb collocations in dictionaries and corpus: an integrated approach for translation purposes. Berlín: Peter Lang.
- Bustos Gisbert, E. (1986). La composición nominal en español. Salamanca: Ed. Universidad de Salamanca.
- Cabezas García, M. (2020). Los términos compuestos desde la Terminología y la Traducción. Berlin: Peter Lang.
- Casares, J. (1992) [1969]. Introducción a la lexicografía moderna. Madrid: Consejo Superior de Investigaciones Científicas.
- Corpas Pastor, G. (1996). Manual de fraseología española. Madrid: Gredos.
- Fonseca, A., F. Sadat y F. Laureau (2016a). "A Lexical Ontology to Represent Lexical Functions". En LREC (ed.). Proceedings of the 2nd Workshop on Language and Ontologies (OntoLex): http://www.lrec-conf.org/proceedings/lrec2016/workshops.html (26/10/2021).
- Fonseca, A., F. Sadat y F. Laureau (2016b). "Lexform: A lexical function ontology model". En COLING 2016 Organizing Committee (ed.). Proceedings of the Workshop on Cognitive Aspects of the Lexicon. Osaka: Aclanthology, pp. 145-155: https://aclanthology.org/W16-5320.pdf (26/10/2021).
- Fonseca, A., F. Sadat y F. Laureau (2017). "Combining Dependency Parsing and a Lexical Network Based on Lexical Functions for the Identification of Collocations". En Mitkov, R. (ed.). Computational and Corpus-Based Phraseology. EUROPHRAS 2017. Lecture Notes in Computer Science, Vol. 10596. Cham: Springer. https://link.springer.com/chapter/10.1007%2F978-3-319-69805-2_31 (26/10/2021).
- García Page, M. (2008). Introducción a la fraseología española. Estudio de las locuciones. Barcelona: Antrophos.
- García Page, M. (2011). "Hombre rana, hombre clave, ¿un mismo fenómeno?", Verba, 38, pp. 127-170.
- García Page, M. (2012). "Pourquoi perrito caliente nest pas la même chose que patata caliente ? Du composè á la locution nominale". En Blasco, X., S. Fuentesy S. Mejri (eds.). Les locutions nominales en langue générale. Barcelona: Universitat Autònoma, pp. 79-108.
- Ionov, M., J. P. McCrae, C. Chiarcos, T. Declerck, J. Bosque-Gil y J. Gracia (2020). Proceedings of the 7th Workshop on Linked Data in Linguistics (LDL-2020): https://www.aclweb.org/anthology/2020.ldl-1.0.pdf (26/10/2021).
- Koike, K. (2001). Colocaciones léxicas en el español actual: estudio formal y léxico-semántico. Madrid: Universidad de Alcalá/ Takushoku University.
- Koike, K. (2009). "Las locuciones nominales del español". Takushoku Language Studies, 12(1), pp. 1-45.
- Kouvara, E., M. González, J. Grosse and R. Sauri (2020). "Determining Differences of Granularity between Cross-Dictionary Linked Senses" En Gavriilidou, Z., M. Mitsiaki, A. Fliatouras (eds.). Lexicography for inclusion. EURALEX Proceedings. XIX Congress of the European Association for Lexicography. Alexandroupolis: Democritus University of Thrace/ European Association for Lexicography, pp.109-118.
- Liu, L. (2018). Colocaciones nominales en español y en chino: estudio contrastivo (tesis inédita). Madrid: Universidad Complutense de Madrid.
- McCrae, J. P., J. Bosque-Gil, J. Gracia, P. Buitelaar, P. Cimiano (2017). "The Ontolex-Lemon model: development and applications". Proceedings of eLex 2017 Conference: http://john.mccr.ae/papers/mccrae2017ontolex.pdf (26/10/2021).
- Melčuk, I. (1984). Dictionnaire explicatif et combinatoire du français contemporain. Recherche Lexico-Sémantiques I. Montreal : Les Presses de l'université de Montréal.
- Melčuk, I. (1996). "Lexical functions: A tool for the description of lexical relations in a lexicon". En L Wanner (ed.). Lexical Functions in Lexicography and Natural Language Processing. Amsterdam/ Philadelphia: John Benjamin, pp. 37-102.
- Mel'čuk, I. (2006): «Parties du discours et locutions», Bulletin de la Société de Linguistique de Paris, 101(1), pp. 29-65.
- Mel'čuk I. (2014). Semantics. From meaning to text. Volume 3. John Benjamins Publishing Company. Amsterdam/Philadelphia.
- Mel′čuk I., and L. Wanner (1996). "Lexical Functions and Lexical Inheritance". En L. Wanner (ed.). Lexical Functions in Lexicography and Natural Language Processing. Amsterdam: John Benjamins Publishing Company, pp. 209-278.
- Mel′čuk I., and L. Wanner (2001). "Towards a Lexicographic Approach to Lexical Transfer in Machine Translation (Illustrated by the German-Russian Language Pair)". Machine Translation, 16, pp. 21-87.
- Mihindukulasooriya, N., G. Rossiello, P. Kapanipathi, I. Abdelaziz, S. Ravishankar, M. Yu, A. Gliozzo, S. Roukos, A. Gray. (2020). "Leveraging Semantic Parsing for Relation Linking over knowledge bases".
- Mikolov, T., K. Chen, G. Corrado y J. Dean (2013). "Efficient Estimation of Word Representations in Vector Space", Computation and Language: https://arxiv.org/abs/1301.3781 (26/10/2021).
- Moliner, M. (2016). Diccionario de uso del español. Madrid: Gredos.
- Orduña López, J. L. (2019). ¿Locuciones nominales o compuestos sintagmáticos? A propósito del español del valle de Aburrá. Íkala. Revista de lenguaje y cultura, XXVI (3), pp. 619-636.
- Penadés Martínez, I. (2008). Diccionario de locuciones nominales, adjetivas y pronominales para la enseñanza del español. Madrid: Arco/Libros.
- Pilehvar, M. T., Camacho-Collados, J. (2019). "WiC: The word-in-context dataset for evaluating context-sensitive meaning representations". Proceedings of the NAACL-HLT Conference: https://aclanthology.org/N19-1128.pdf (26/10/2021).
- Polguère, A. (2007). "Lexical function standardness". En Leo Wanner (ed.). Selected Lexical and Grammatical Issues in the Meaning-Text Theory. In Honour of Igor Melčuk. Amsterdam/ Philadelphia: John Benjamin, pp. 43-95.
- Polguère, A. (2015). "Non-compositionalité: ces sont toujours les locutions faibles qui trinquent". Verbum XXXVII(2). 257-280.
- Real Academia Española. (2009). Nueva gramática de la lengua española. Madrid: Espasa.
- Roukos, S. (2014). "IBM Cognitive Computing. An NLP Renaissance!". Proceedings of the Conference on Empirical Methods in Natural Language Processing (EMNLP). Doha: Association for Computational Linguistics, p. 1.
- Seco, M. , O. Andrés y G. Ramos (2004). Diccionario fraseológico documentado del español actual. Locuciones y modismos españoles. Madrid: Aguilar.
- Torner, S. y E. Bernal (eds.) (2017). Collocations and other lexical combinations in Spanish. New York: Routledge.
- Wanner, L. y F. Laureau. (2009). "Applying the Meaning-Text Theory Model to Text Synthesis with Low- and Middle-Density Languages in Mind". En Nirenburg, S. (ed). Language Engineering for Lesser-Studied Languages. Amsterdam/Berlín/Oxford/okyo/Washington D. D.: IOS Presses, pp. 207-242.
- Zuluaga, A. (1980). Introducción al estudio de las expresiones fijas. Verlag Peter D. Lang: Frankfurt.