ENC-99

 

TITULO:

Descripción de conocimiento lingüístico y su aplicación al análisis sintáctico del Español

Autor: Sofía Galicia-Haro

Título: M. C.

Filiación: Estudiante de Doctorado del Laboratorio de lenguaje natural y Procesamiento de Texto. Centro de Investigación en Computación. Instituto Politécnico Nacional. México, D. F.

Autor: Alexander Gelbukh

Título: Ph.D.

Filiación: Profesor Investigador. Jefe del Laboratorio de lenguaje natural y Procesamiento de Texto. Centro de Investigación en Computación. Instituto Politécnico Nacional. México, D. F.

Autor: Igor Bolshakov

Título: Ph.D.

Filiación: Profesor Investigador. Jefe del Laboratorio de lenguaje natural y Procesamiento de Texto. Centro de Investigación en Computación. Instituto Politécnico Nacional.

 

Contacto: Sofía Galicia Haro.

Email: sofia@pollux.cic.ipn.mx

Fax: +52(5) 586-2936

Postal Address:Laboratorio de Lenguaje Natural, CIC, IPN, Juan de Dios Batiz s/n, esq. Mendizabal, Zacatenco, 07738 México D.F., Mexico.

Abstract

Se presenta la aplicación del formalismo considerado en la teoría Significado Û Texto (Meaning Û Text) para el análisis sintáctico del español. En este método, basado en gramáticas con dependencia, el diccionario combinatorio empleado para el análisis sintáctico consta de patrones para palabras, principalmente verbos, donde se describen todas sus valencias y las formas en que ellas se realizan. Estos patrones contienen conocimiento lingüístico necesario para el análisis sintáctico.

Los patrones del diccionario combinatorio no solamente ayudan a reducir el número de posibles variantes generadas por el analizador sino que permiten detectar información del nivel sintáctico que está conectada con la semántica de la palabra y que es requerida a niveles más profundos del análisis de lenguaje natural.

 

Taller de evaluación  Taller de Lógica y Computación


 

Descripción de conocimiento lingüístico
y su aplicación al análisis sintáctico del Español

 

Sofía Galicia-Haro, Alexander Gelbukh, Igor Bolshakov

Centro de Investigación en Computación

 


Resumen

Se presenta la aplicación del formalismo considerado en la teoría Significado Û Texto (Meaning Û Text) para el análisis sintáctico del español. En este método, basado en gramáticas con dependencia, el diccionario combinatorio empleado para el análisis sintáctico consta de patrones para palabras, principalmente verbos, donde se describen todas sus valencias y las formas en que ellas se realizan. Estos patrones contienen conocimiento lingüístico necesario para el análisis sintáctico.

Los patrones del diccionario combinatorio no solamente ayudan a reducir el número de posibles variantes generadas por el analizador sino que permiten detectar información del nivel sintáctico que está conectada con la semántica de la palabra y que es requerida a niveles más profundos del análisis de lenguaje natural.

1.    Introducción

Para la representación de la estructura sintáctica en inglés se adoptaron las estructuras consideradas por las teorías lingüísticas derivadas del estructuralismo norteamericano, basadas en constituyentes o estructura de frase. Esas teorías lingüísticas también han sido adoptadas para la representación sintáctica en otros lenguajes (alemán, francés, etc.). En cambio las teorías lingüísticas desarrolladas a partir de los estudios de Tesnière [Tesnière, 69], las gramáticas de dependencias, no han sido ampliamente empleadas.

Por otra parte, la estructura de subcategorización se ha considerado como una información lingüística básica necesaria en los diccionarios para el procesamiento de lenguaje natural [EAGLES, 96]. Principalmente se ha empleado con la finalidad de restringir el número de variantes generadas en el análisis sintáctico y para la generación de textos. Los diccionarios de los marcos de subcategorización que se han compilado con este propósito, manualmente, por ejemplo ALVEY [Boguraev, 87] y COMLEX [Grishman et al, 94], y automáticamente [Briscoe & Carrol, 97] y están basados en teorías de estructura de frase o de constituyentes.

En los formalismos gramaticales modernos se considera la información de subcategorización, que generalmente incluye referencias a todos los niveles de descripción gramatical (morfológico, sintáctico y semántico), aunque la cantidad de información que consideran difiere entre ellos. La forma de la descripción y el nivel donde se sitúa la descripción están definidos por el formalismo y los niveles considerados en él. Por ejemplo, los formalismos que consideran roles temáticos, describen las valencias del verbo por tipos de roles, los formalismos sin representación de nivel semántico describen la información semántica en términos sintácticos. Utilizamos el término valencia para describir semánticamente un actuante del verbo, es decir, el rol semántico del actuante, por lo que valencia y actuante se emplean indistintamente.

Los formalismos basados en dependencias difieren de los formalismos basados en constituyentes, en cuanto a subcategorización se refiere, en que los primeros hacen una clara separación entre los complementos reales y los circunstanciales. En la Dependency Unification Grammar (DUG) [Hellwig, 83] se consideran los complementos –dependientes de un elemento léxico que son requeridos por la semántica combinatoria inherente de la palabra–, los adjuntos –aumentan la estructura de dependencias en forma arbitraria– y los conjuntados –introducidos por una conjunción. En la teoría Significado Û Texto (Meaning Û Text Theory, MTT) [Mel’cuk, 88] se describe la diátesis de cada verbo, es decir, la correspondencia entre los actuantes semánticos, los de la sintaxis profunda y los de la sintaxis superficial. Por consiguiente, la información de subcategorización es específica para cada verbo, y, además, se separan las representaciones de una misma forma de palabra para un verbo dado con diferentes significados.

En los formalismos basados en constituyentes, esta separación no es primordial, por lo que pueden incluirse predicados cuya ocurrencia es obligatoria en el contexto local de la frase pero que no son seleccionados semánticamente por el verbo. Al no considerarse la información de subcategorización de una forma específica para cada verbo, generalmente se realiza una clasificación y entonces cada clase o marco de subcategorización es un patrón de composición de complementos que puede ser compartido por varios verbos. Estas consideraciones repercuten en la descripción de la diátesis que bajo este esquema considera que el verbo puede aparecer en una diversidad de marcos de subcategorización.

Para el español, considerando como finalidad el procesamiento de textos sin restricciones, existen dificultades al querer describir los objetos de los verbos en la forma en que se ha hecho para el inglés. Algunas características del español como su orden menos rígido, la inversión del sujeto, etc. requieren de una descripción más adecuada.

La descripción de todos los objetos de los verbos del español bajo el formalismo de la MTT que emplea los llamados Patrones de Manejo (Government Patterns, PM) [Steele, 90] permite definir, de una manera más adecuada esas características que difieren del inglés. En las descripciones de los PMs cada palabra encabezado describe su significado, sus actuantes, las palabras específicas que introducen los complementos que realizan sus valencias y las combinaciones de esos complementos, incluyendo el orden de sus ocurrencias, para las opciones permitidas y prohibidas. Este formalismo permite incluir cierto conocimiento semántico: el significado de la palabra encabezado del verbo y sus valencias, y sus características semánticas como animidad (si es necesario).

En este artículo, primero describimos brevemente la zona sintáctica en la MTT. Después discutimos las características del español que tienen una representación más adecuada bajo este formalismo mediante algunos ejemplos tomados de un corpus grande del español (LEXESP)[1]. Enseguida se describen los marcos de información de subcategorización basados en la MTT y finalmente los métodos posibles para realizar el análisis sintáctico.

2.    Zona sintáctica del diccionario en la MTT

La zona sintáctica del diccionario en la teoría MTT describe, con la ayuda de una tabla de PM, la siguiente información: correspondencia entre las valencias semánticas y sintácticas de la palabra encabezado, todas las formas en que se realizan las valencias sintácticas y la indicación de obligatoriedad de la presencia de cada actuante, si es necesario.

Después de la tabla de PM se presentan dos secciones: restricciones y ejemplos. Las restricciones consideradas en los PMs son de varios tipos: semánticas, sintácticas o morfológicas; entre estas restricciones también se considera la compatibilidad entre valencias sintácticas. La sección de ejemplos cubre todas las posibilidades: ejemplos para cada actuante, ejemplos de todas las posibles combinaciones de actuantes y finalmente los ejemplos de combinaciones imposibles o indeseables.

La parte principal de la tabla de PM es la lista de valencias sintácticas de la palabra encabezado. Se listan de una manera arbitraria pero se prefiere el orden de incremento en la oblicuidad: sujeto, objeto directo, objeto indirecto, etc. Cada encabezado usualmente impone cierto orden; por ejemplo, una entidad activa –sujeto– toma el primer lugar, después el objeto principal de la acción, después otro complemento (si existe), etc. También la forma de expresión del significado de la palabra encabezado influye el orden. Por el momento, en nuestro diccionario en lugar de la definición sólo usamos una descripción corta en inglés, por ejemplo la expresión para acusar es: Person V accuses person W of action X before person Y(persona V acusa a persona W de acción X ante persona Y).Esta expresión precede cada PM.

Otra información obligatoria en cada valencia sintáctica es la lista de todas las posibles formas de expresión de la valencia en los textos. El orden de opciones para una valencia dada es arbitrario, pero las opciones más frecuentes aparecen normalmente primero. Las opciones se expresan con símbolos de categorías gramaticales o palabras específicas.

A continuación presentamos una descripción para el verbo acusar aunque una descripción más amplia de este diccionario aparece en [Galicia-Haro et al, 97]:

 

1 = V

2 = W

3 = X

4 = Y

1.  NP

2.  NP

1.  de  NP

4.  ante NP

 

 

2.  de  INF

 

Obligatoria

Obligatoria

 

 

 

Ejemplos:

 

V + W

Juan acusa a María.

V + W + X

Juan acusa a María de robo.

V + W + X + Y

Juan acusa a María de robo ante los demás estudiantes.

Ejemplos de las combinaciones prohibidas:

V + Z

*Juan acusa de robo.

X + Y

*Acusa de robo ante los demás estudiantes.

Aquí NP representa un sintagma nominal e INF representa un sintagma verbal infinitiva. Solamente se presentan algunos ejemplos y no la totalidad. En Ejemplos de las combinaciones prohibidas solamente se considera la indicación de obligatoriedad.

3.    Características del español más adecuadas bajo la MTT

3.1  Orden de palabras

El orden de palabras en el español es más libre comparado con el inglés y por lo tanto se requiere considerar los órdenes posibles de aparición de las valencias. Por ejemplo, en las frases siguientes el objeto indirecto no aparece después del verbo, de tres maneras distintas: 1) en la forma a NP antes del verbo, 2) como pronombre reflexivo entre sujeto y verbo, y 3) como clítico dentro del verbo. Los ejemplos son:

1)          A quienes acusan de comportamiento arrogante.

2)          El fiscal me acusa de delito de alta traición.

3)          Acusándole de ser el sostenedor y portavoz de Mario Segni.

Para el inglés funciona buscar usualmente todos los objetos del verbo después de él. Sin embargo, para el español, esta información de posibles posiciones de la valencia es necesaria para el analizador sintáctico. En la sección 4 se presentan todas las combinaciones obtenidas de LEXESP para el verbo acusar con los correspondientes pesos estadísticos.

3.2  Sujeto y animidad

La descripción del sujeto como una valencia más del verbo permite el reconocimiento correcto y más fácil de valencias del verbo. La inversión del sujeto es considerada como un recurso estilístico de frecuencia de aparición menor, pero a este respecto, el español presenta diferencias con otros lenguajes romances. En [Zubizarreta 94] se explica que investigaciones recientes sobre el orden de las palabras en el español indican que el español y el italiano permiten la inversión libre del sujeto, a diferencia del francés. Por ejemplo, en las siguientes frases, el sujeto aparece después del verbo en dos formas distintas, como nombre propio y como NP.

1)          Le acusaba Apel de desembocar en una ilusión idealista por <...>.

2)          A quien acusaron varios testigos.

Figura 1. Marco de Información de Subcategorización.

Donde: + denota uno o más elementos; * denota cero o más elementos; ~ denota el verbo

 


Con el orden de palabras fijo, en ambos casos puede haber un reconocimiento erróneo de valencias o del significado del verbo o ambos, aunque en la primera frase el reconocimiento de nombre propio lo evitaría. En la segunda frase se requiere diferenciar entre entidad animada y grupo nominal inanimado para reconocer el sujeto de acusar1 ‘denunciar a alguien como culpable de algo’. La valencia realizada como NP inanimado corresponde al verbo acusar2 ‘revelar algo, ponerlo de manifiesto’ [DEUM, 96]. Si varios testigos se reconoce como NP inanimado existe confusión entre sujeto y complemento que resultará en una asignación de estructura incorrecta o de otro significado, por las siguientes razones.

La animidad en español tiene ciertas particularidades. En la mayoría de los lenguajes el objeto directo está conectado con el verbo sin preposiciones; pero en español, las entidades animadas están conectadas con la preposición a y las no animadas directamente (veo a mi vecina y veo una casa). La animidad se considera como una personificación, por ejemplo gobierno en español es un sustantivo animado y al dirigirse a él se utiliza la preposición a (veo al gobierno). Además de personas, la animidad abarca grupos de personas, animales, países, entidades abstractas (organizaciones, partidos políticos), etc. En cambio en ruso donde también existe oposición obligatoria de palabras por animidad, los grupos de personas, los países, las ciudades no se personifican en sentido gramatical; en inglés tampoco se aplica he o she a tales entidades.

Aunque la preposición a también tiene otros usos, aquí nos referimos exclusivamente a su conexión con el objeto directo. Este uso sirve para diferenciar el significado de algunos verbos, por ejemplo, querer algo (tener el deseo de obtener algo) y querer a alguien (amar o estimar a alguien). Así que la animidad es una característica evidentemente sintáctica pero con alusión semántica que se considera para la realización de las valencias y en ciertos casos permite determinar el sujeto del verbo y distinguirlo del objeto.

3.3  Información detectable en el nivel sintáctico

Existe información semántica detectable en el nivel sintáctico requerida en niveles más profundos del procesamiento de lenguaje natural. Por ejemplo, la detección de valencias sintácticas que se enlazarán a las valencias semánticas y la distinción entre complementos reales del verbo y complementos circunstanciales realizados con la misma descripción de subcategorización.

Figura 2 MAS del verbo acusar1

 


La identificación de valencias del verbo se realiza a través de la detección de palabras específicas introductoras de los complementos. Para algunos verbos una sola palabra se identifica como la palabra que introduce los complementos que expresan una valencia, en cambio en otros verbos varias palabras se emplean con el mismo propósito. Por ejemplo, para acusar, de en de NP es la preposición que introduce el complemento mediante el cual se expresa la acción por la cual se acusa a alguien. Para el verbo expresarse laspreposiciones en, de, con y mediante en en NP, de NP, con NP, mediante NP se emplean para realizar la valencia que describe la forma en que se expresa algo. Las preposiciones también ayudan a distinguir el significado de algunos verbos. Por ejemplo, hay muchos verbos como lanzar que tiene diferentes significados: existe lanzar1 (lanzó una pelota) y lanzar2 (la lanzaron de su casa),estos dos verbos homónimos emplean diferentes preposiciones para cada significado específico.

Para algunos verbos, un marco de subcategorización describe tanto valencias del verbo como circunstancias. Por ejemplo, algunos verbos locativos [Rojas, 88] requieren complementos con la noción de espacio, cuya marca aparece tanto en la palabra introductora del complemento como en el complemento mismo. Por ejemplo, con el verbo colocar, en la frase coloca un libro en este momento en el espacio disponible, el marco de subcategorización en NP describe tanto una valencia (en el espacio libre) como un complemento irrelevante para su significado (en este momento). En los PMs, esta marca de locatividad al igual que la de animidad se introduce en la realización de las valencias.

4.    Marcos Avanzados de Subcategorización

De aquí en adelante nos referimos a los marcos avanzados de subcategorización (MAS) en lugar de PM para evitar un nombre ligado especialmente a la MTT y para introducir información adicional que sirva al análisis sintáctico. La información contenida en estos marcos corresponde a la expuesta en la sección 2, considerada en la tabla de PM, salvo la indicación de obligatoriedad de la presencia de cada valencia. En un MAS, la indicación de obligatoriedad, las posibles combinaciones de actuantes y las combinaciones prohibidas han sido consideradas de otra forma.

El español tiene un orden de palabras más libre que el inglés pero no totalmente libre, por lo que las posibles combinaciones de valencias son limitadas. A partir de la indicación de obligatoriedad se pueden definir algunas combinaciones no deseadas pero no la totalidad. Las combinaciones posibles y las prohibidas pueden definirse basándose en cierta experiencia pero no reflejarían los cambios en el lenguaje ni las preferencias en dominios específicos. Por lo que para adquirir esta información se consideró la obtención de pesos estadísticos. Si una valencia tiene presencia en todas las oraciones extraídas del corpus para un verbo específico, se considera como una evidencia de obligatoriedad. El analizador sintáctico empleará esta evidencia para buscar las valencias aún en enlaces distantes. Por ejemplo, el verbo acusar requiere la presencia del objeto directo, con esta indicación, el analizador sintáctico buscará este pedazo de información alrededor del verbo, considerando también las probabilidades de su aparición antes y después del verbo.

Así que se obtienen los pesos estadísticos para cada valencia referidos a las palabras introductoras de ellas y después los pesos estadísticos de las combinaciones de valencias referidas a la posición de cada valencia respecto al verbo. Esta información estadística da un rango de las descripciones de cada tipo específico de cada valencia y de sus combinaciones que permitirán incrementar la eficiencia del analizador sintáctico. En la figura 1 se muestra la descripción general de los MASs.

En las figuras 2 y 3 se muestran (en una presentación más práctica que la definida en la figura 1) los MASs obtenidos a partir de un total de 227 oraciones del corpus LEXESP para el verbo acusar. De la información obtenida, se reconocen acusar1 y acusar2. La valencia realizada mediante NP que no pertenece a la expresión de acusar1 (sección 2) marca la diferencia entre los dos verbos siempre y cuando pueda discriminarse entre entidades animadas y no animadas.

Para compilar marcos de subcategorización de este tipo requerimos información sintáctica, estadística y conectada con la semántica. En la parte semántica es necesario incluir la marca de animidad y de locatividad en el corpus. Además, se requiere detectar la llamada atracción léxica (coocurrencia en estructura sintáctica) entre los verbos y las preposiciones que introducen las valencias y diferenciar las valencias correspondientes a diversos significados del verbo.

Una aproximación para la obtención de esta información, a partir de un corpus, en cuanto a detección de las frases preposicionales y complementos que realizan las valencias se describe en [Gelbukh, 1998]. La detección de valencias del verbo requiere anotación manual pero la información extraída para la compilación de los MASs facilitará la detección y anotación de las valencias del verbo.

5.    Análisis sintáctico

Para la realización del análisis sintáctico usando los MASs, se puede emplear la estrategia natural y general de análisis sintáctico en dos pasos de las gramáticas lexicalizadas. El primer paso se selecciona el conjunto de estructuras correspondientes a cada palabra en la oración de entrada. El segundo paso analiza sintácticamente la oración respecto a las estructuras seleccionadas.

En [Joshi, 94] se presenta una variante, dada una oración de entrada el analizador selecciona el conjunto de llamadas supertags (árboles elementales) para cada elemento léxico de la oración de entrada e se intenta combinar las supertags buscando todas las posibilidades para finalmente producir el análisis sintáctico de la oración. Cuando se completa este análisis hay una sola supertag para cada palabra –asumiendo que no hay ambigüedad global. Alternativamente, se puede eliminar o reducir sustancialmente la ambigüedad de asignación de las supertags antes del segundo paso, usando información local como las dependencias léxicas locales o métodos estadísticos.

Figura 3. MAS del verbo acusar2

 


Otra variante es el analizador sintáctico creado dentro del proyecto ruso EDAP-2, para traducción inglés-ruso, que emplea un diccionario de patrones de manejo sintáctico. Este analizador sintáctico emplea dos tipos de reglas: de sintagmas y de preferencia. Las reglas de sintagmas son las más importantes. Establecen una relación sintáctica entre dos palabras. El sintagma contiene un conjunto de condiciones que deben cumplir estas dos formas de palabra. El algoritmo que se emplea es el siguiente. En un primer paso se crea un grafo de hipótesis posibles representadas por ligas binarias entre palabras. En un segundo paso se eliminan algunas de las hipótesis para crear un árbol. El primer paso se realiza al aplicar las condiciones lineales de todos los sintagmas y el segundo paso se logra mediante algoritmos de filtrado que consideran información lingüística.

Otra posibilidad es mediante transductores de estados finitos, como lo presenta [Roche, 97] tanto para TAGs como utilizando un diccionario de patrones sintácticos. Esta posibilidad se presenta atractiva dada su probada eficiencia y precisión. En cualquiera de estas posibilidades, los MASs presentan la información necesaria para resolver las ambigüedades al unir las valencias de las palabras.

Conclusiones

Se describió la aplicación del formalismo considerado en la teoría Significado Û Texto (Meaning Û Text) para el análisis sintáctico del español, las ventajas de su uso al describir más adecuadamente características del lenguaje, es decir, conocimiento lingüístico. También se describió la información requerida para el diccionario y la forma en que se podría realizar el análisis sintáctico.

En este método, basado en gramáticas con dependencia, el diccionario combinatorio consta de patrones para palabras, principalmente verbos aunque también pueden describirse de esta forma algunos adjetivos y sustantivos, y en él se describen todas sus valencias y las formas en que ellas se realizan. Se mostró la necesidad de incluir información estadística tanto para representar combinaciones de valencias y la condición de obligatoriedad de algunas valencias como para incrementar la eficiencia del analizador sintáctico

También se discutió la necesidad de detectar cierta información del nivel sintáctico (para distinguir diferentes significados de un verbo, para discriminar las valencias de los verbos, etc.) que está conectada con la semántica de la palabra y que es requerida a niveles más profundos del análisis de lenguaje natural.

Referencias

1.        [Boguraev, B. et al. 1987] Boguraev, B. et al. The derivation of a grammatically indexed lexicon from the Longman Dictionary of Contemporary English. In Proceedings of the 25th Annual meeting of the Association for Computational Linguistics, Stanford, CA. 1987.

2.        [Briscoe & Carroll, 1997] Briscoe, E. & Carroll, J. Automatic extraction of subcategorization from corpora. In Proceedings of the 5th ACL Conference on Applied Natural Language Processing. Washington, DC. 1997.

3.        [DEUM, 1996] DEUM. Diccionario del Español usual en México. El Colegio de México.1996.

4.        [EAGLES, 1996] EAGLES. Recommendations on Subcategorization. Http: // www. ilc. pi. cnr. it/ EAGLES96/ synlex/ synlex. html 1996.

5.        [Galicia-Haro et al 1997]Galicia-Haro, S.N.,  I.A. Bolshakov, A.F. Gelbukh Syntactical managing patterns for the most common Spanish verbs. CIC’97, Nuevas Aplicaciones e Innovaciones Tecnológicas en Computación, Simposium internacional de computación, 12-14 de noviembre, pp. 367 - 371, CIC, IPN, México D.F. 1997.

6.        [Gelbukh et al 1998]. Gelbukh, A., I. Bolshakov, S. N. Galicia Haro. Automatic Learning of a Syntactical Government Patterns Dictionary from Web-Retrieved Texts // International Conference on Automatic Learning and Discovery, Carnegie Mellon University, Pittsburgh, PA, USA, June 11 - 13, pp. 261 - 267. 1998.

7.        [Grishman et al 1994] Grishman, R., C. Macleod, and A. Meyers. COMLEX syntax: building a computational lexicon. In the proceedings of the 15th Conference on Computational Linguistics, pp. 268-272 (COLING-94). 1994.

8.        [Hellwig, 1983] Hellwig, P. Dependency Unification Grammar, in E. Hajicova (ed.), Functional Description of Language, Charles University, Prague, pp. 67-84. 1983.

9.        [Joshi & Srinivas. 1994] Joshi, A. and B. Srinivas Disambiguation of Super Parts (or Supertags) of Speech Almost Parsing. In Proceedings of the 15th International Conference on Computational Linguistics, pp. 154-160 (COLING-94). . 1994.

10.     [Mel’cuk, 1988] Mel’cuk, I. A. Dependency Syntax: Theory and Practice. State University of New York Press. 1988.

11.     [Perlmutter, 1983] Perlmutter, D. editor Studies in Relational Grammar 1. University of Chicago Press.1983.

12.     [Roche, 1997] Roche, E. Parsing with Finite-State Transducers. In Finite-State Language Processing edited by E. Roche and Y. Schabes. The MIT Press. 1997.

13.     [Rojas, 1988] Rojas, C. Verbos locativos en español. Aproximación sintáctico-semántica. Universidad Autónoma de México. 1988.

14.     [Steele, 1990] Steele, J. Meaning – Text Theory. Linguistics, Lexicography, and Implications. James Steele, editor. University of Ottawa press. 1990.

15.     [Tesnière, 1969].Tesnière, L. 1969. Éléments de syntaxe structurale, Paris: Klincksieck. 1969.

16.     [Zubizarreta, 1994] Zubizarreta, María Luisa. El orden de palabras en español y el caso nominativo. En Gramática del Español, edición a cargo de Violeta Demonte. El Colegio de México.1994.


 



[1] El corpus LEXESP fue proporcionado amablemente por H. Rodríguez, UPC-LSI, Barcelona, España.