17 de agosto 2020    /   IDEAS
por
 

La lingüista computacional que bucea en el diccionario y exhibe sus tesoros en Twitter

17 de agosto 2020    /   IDEAS     por          
Compártelo twitter facebook whatsapp
thumb image

Se define a sí misma como filóloga y lingüista computacional. No es de extrañar, visto lo visto, que las palabras y la manera en la que se relacionan e interactúan sean para ella algo más que un oficio. Laura Martín-Pérez dedica parte de su tiempo a bucear en el diccionario. Como los arqueólogos que rescatan pecios en el fondo del océano, Martín-Pérez hace emerger en su cuenta de Twitter vocablos como cogitabundo (muy pensativo), garambaina (letra de trazos ilegibles, como la de los médicos), aloque (tinto claro o rosado) y pernear (impacientarse).

¿Por qué ese afán de bucear en el diccionario?

Cuando comencé a trabajar dentro del mundo del Procesamiento de Lenguaje Natural (PLN), una de las primeras tareas en las que participé fue listar las palabras más frecuentes del español. Me impresionó que no con muchas palabras se pudiera describir nuestro día a día, leer un periódico, expresar ideas. Y entonces pensé en los más de 93.000 lemas que tiene el diccionario de la Real Academia de la Lengua.

Todas las palabras existen por alguna razón; tienen una motivación. Fue entonces cuando pensé que el mundo que nos rodea podía ser expresado de una manera más rica, más exacta y más bella. Lo único que hacía falta era rescatar el significante, la palabra en sí. Así que bucear en el diccionario para encontrar palabras que se pudieran aplicar a nuestro día a día se convirtió en una rutina. Cuando buceo en el diccionario me topo también con palabras poco frecuentes, pero muy bellas. Estas últimas me encantan especialmente y me dan un poco de pena. Están ahí quietas en el diccionario… Casi nadie las usa. Me encanta bucear en el diccionario.

¿Cómo encuentras esas palabras tan raras y bonitas?

Lo primero que hay que pensar es en qué se va a buscar. No se puede buscar algo si no sabes qué buscas –lógicamente–. Siempre son dos ideas las que me motivan a buscar: ¿Habrá alguna palabra para…? o ¿habrá alguna palabra relacionada con…?

 Si voy un día a la sierra, pienso qué palabras habrá relacionadas con el campo; si estoy en casa cocinando, pienso qué palabras habrá relacionadas con la cocina o si estoy jugando con mi perro, pienso qué palabras rodean a estos animales. Las palabras nos rodean y están ahí esperando a que las usemos.

Mi reacción siempre es la misma: ¡Anda! Hay una palabra para…

El Diccionario de la Real Academia de la Lengua no permite buscar por significado, es decir, no se puede saber qué palabras contienen en su definición, por ejemplo bondad o maldad. Conozco dos recursos digitales que sí que permiten estas búsquedas. El primero es el Diccionario Avanzado de la Real Academia de la Lengua y es de pago. El segundo es DIRAE, de  Gabriel Rodríguez Alberich, y es de uso libre.

¿Qué palabras te sorprenden más? ¿Cuáles son tus favoritas?

Me sorprenden muchísimo palabras que perfectamente podríamos usar en nuestro día a día, pero que por desconocimiento, no las usamos.

También me gustan mucho las palabras cuya definición es visual, es decir, cuando leo la definición me imagino el concepto perfectamente en mi mente. Por ejemplo:

  • Flechería. Conjunto de flechas disparadas.
  • Laminera. Abeja suelta que se adelanta a las demás al olor del pasto que le agrada.

Me maravillan también las palabras que tienen una etimología con historia. Por ejemplo:

  • Gazpacho. Quizá del ár. hisp. *gazpáčo,y este del gr. γαζοφυλάκιον gazophylákion ‘cepillo de la iglesia’, por alus. a la diversidad de su contenido, ya que en él se depositaban como limosna monedas, mendrugos y otros objetos.
  • Tulipán. Del fr. tulipan,y este del turco tülbent ‘turbante’.)

Estas podrían ser mis 10 palabras o expresiones favoritas del momento. No tienen un orden. Me gustan todas casi por igual… Intento incorporarlas a mi día a día y se las enseño a mi familia, compañeros de trabajo, amigos… Así es más fácil recordarlas.

PalabraDefinición
ZorronglónDicho de una persona: Que ejecuta pesadamente, de malagana y murmurando o refunfuñando, lo que le mandan.
CatacaldosPersona que emprende muchas cosas sin fijarse en ninguna.
SusurridoRuido suave que hacen algunas cosas naturales.
Hacer la jarritaHacer ademán de pagar algún gasto común, llevándosela mano al bolsillo.
BaticorPena, dolor. (De batir y el desus. cor ‘corazón’.)

*Vaya, el corazón hecho trizas.

AmusgarEntrecerrar los ojos para ver mejor.
PerecearDilatar, retardar o diferir algo por flojedad, negligencia o pereza.
PerlarCubrir o salpicar algo de gotas de agua, lágrimas
CandilazoArrebol crepuscular.
DestoserseToser sin necesidad, o fingir la tos, ya previniéndose para hablar, yapara que sirva de seña.

¿Qué sorpresas que desconocemos se esconden en el diccionario?

 Creo que no mucha gente conoce que en el DLE no solo se pueden buscar palabras, sino que se pueden buscar expresiones, anagramas, entradas del diccionario que comiencen por, terminen en o contengan alguna palabra o segmento de una palabra…

En el DIRAE o en el Diccionario Avanzado de la RAE además se puede buscar por cualquier elemento que contenga la definición. Por ejemplo, si se busca «loc. Adv.», se verán todas las locuciones adverbiales; o «desus.», se verán todas las palabras con la marca desusado.

https://twitter.com/MPGArual/status/1294553783993860096

¿Sabrías decir qué cantidad de palabras que viven en el diccionario no usamos y, sin embargo, no están marcadas como en desuso?

No puedo decir el número exacto de palabras, pero sí, sin duda utilizamos un porcentaje muy muy pequeño (¿habrá una palabra para muy muy pequeño? ¡Ajam! Existe tamarrusquito). He leído varios artículos y entradas de internet donde se dice que una persona no utiliza más de 300 palabras en su día a día. Me parecen poquísimas.

De hecho, ahora mismo llevo escritas 1.358 palabras, contando repeticiones (por ejemplo de se repite 116 veces. Sin repeticiones, he usado 525. Ahora quedaría lematizarlas, es decir, contar como únicas las formas, por ejemplo, diccionario y diccionarios… Como se ve, realmente no he utilizado muchas.

Creo que, en general, no sabemos usar bien el diccionario. ¿Qué debemos aprender a hacer? ¿Qué aconsejas tú?

Veo muchas consultas a la RAE en Twitter y pienso: ¿es que no pueden buscarlo en el diccionario? Y justamente después pienso que quizás no sepan buscar o no sepa la dirección web de la RAE o ni si quiera sepa que hay una aplicación móvil. Una vez me dijeron (hace años) que la RAE dejaba buscar tres palabras y luego tenías que pagar (atónita me quedé). Quizá no nos enseñen a manejar estos recursos o no tengamos el suficiente interés como para aprenderlo o retenerlo.

Creo que el primer contacto que tenemos con el Diccionario de la Real Academia de la Lengua es en el colegio y es ahí donde nos enseñan a utilizarlo. Se me hace muy difícil pensar que alguien no haya consultado nunca una palabra en este  recurso digital o en papel.

La web del DLE y la misma aplicación para el móvil es sencilla de usar y muy intuitiva. Hay un apartado donde explica cómo se usa el diccionario. Es este. Quizá quedaría más práctico si se hiciera un vídeo.

https://twitter.com/MPGArual/status/1293885244651851777

Eres lingüista computacional. ¿Hasta qué punto se enseña a las máquinas a utilizar y conocer palabras raras? ¿Aplicas tus descubrimientos a tu trabajo o es solo una cuestión lúdica?

Actualmente trabajo desarrollando asistentes virtuales y mi trabajo se centra en hacer que el asistente virtual entienda lo que la gente escribe. Para que la máquina pueda entender lo que los usuarios escriben, primero tengo que enseñar a la máquina las palabras (léxico), y luego cómo estas se combinan (sintaxis). No creo que tenga ningún sentido enseñar a la máquina palabras muy raras que nadie use, puesto que ocurrirá como ocurre ahora: se quedarán perdidas.

Lo que sí aplico de mis descubrimientos es la manera de buscar palabras. Me es muy útil saber buscar redes semánticas y léxicas para nutrir los corpus de los asistentes. Por ejemplo, si tenemos un asistente virtual al que le podamos preguntar el tiempo, me interesa conocer las diferentes maneras que hay para decir llover, parar de llover o lluvia, ya que una persona podrá decir: ¿va a diluviar mañana? o ¿cuándo escampará?

Se define a sí misma como filóloga y lingüista computacional. No es de extrañar, visto lo visto, que las palabras y la manera en la que se relacionan e interactúan sean para ella algo más que un oficio. Laura Martín-Pérez dedica parte de su tiempo a bucear en el diccionario. Como los arqueólogos que rescatan pecios en el fondo del océano, Martín-Pérez hace emerger en su cuenta de Twitter vocablos como cogitabundo (muy pensativo), garambaina (letra de trazos ilegibles, como la de los médicos), aloque (tinto claro o rosado) y pernear (impacientarse).

¿Por qué ese afán de bucear en el diccionario?

Cuando comencé a trabajar dentro del mundo del Procesamiento de Lenguaje Natural (PLN), una de las primeras tareas en las que participé fue listar las palabras más frecuentes del español. Me impresionó que no con muchas palabras se pudiera describir nuestro día a día, leer un periódico, expresar ideas. Y entonces pensé en los más de 93.000 lemas que tiene el diccionario de la Real Academia de la Lengua.

Todas las palabras existen por alguna razón; tienen una motivación. Fue entonces cuando pensé que el mundo que nos rodea podía ser expresado de una manera más rica, más exacta y más bella. Lo único que hacía falta era rescatar el significante, la palabra en sí. Así que bucear en el diccionario para encontrar palabras que se pudieran aplicar a nuestro día a día se convirtió en una rutina. Cuando buceo en el diccionario me topo también con palabras poco frecuentes, pero muy bellas. Estas últimas me encantan especialmente y me dan un poco de pena. Están ahí quietas en el diccionario… Casi nadie las usa. Me encanta bucear en el diccionario.

¿Cómo encuentras esas palabras tan raras y bonitas?

Lo primero que hay que pensar es en qué se va a buscar. No se puede buscar algo si no sabes qué buscas –lógicamente–. Siempre son dos ideas las que me motivan a buscar: ¿Habrá alguna palabra para…? o ¿habrá alguna palabra relacionada con…?

 Si voy un día a la sierra, pienso qué palabras habrá relacionadas con el campo; si estoy en casa cocinando, pienso qué palabras habrá relacionadas con la cocina o si estoy jugando con mi perro, pienso qué palabras rodean a estos animales. Las palabras nos rodean y están ahí esperando a que las usemos.

Mi reacción siempre es la misma: ¡Anda! Hay una palabra para…

El Diccionario de la Real Academia de la Lengua no permite buscar por significado, es decir, no se puede saber qué palabras contienen en su definición, por ejemplo bondad o maldad. Conozco dos recursos digitales que sí que permiten estas búsquedas. El primero es el Diccionario Avanzado de la Real Academia de la Lengua y es de pago. El segundo es DIRAE, de  Gabriel Rodríguez Alberich, y es de uso libre.

¿Qué palabras te sorprenden más? ¿Cuáles son tus favoritas?

Me sorprenden muchísimo palabras que perfectamente podríamos usar en nuestro día a día, pero que por desconocimiento, no las usamos.

También me gustan mucho las palabras cuya definición es visual, es decir, cuando leo la definición me imagino el concepto perfectamente en mi mente. Por ejemplo:

  • Flechería. Conjunto de flechas disparadas.
  • Laminera. Abeja suelta que se adelanta a las demás al olor del pasto que le agrada.

Me maravillan también las palabras que tienen una etimología con historia. Por ejemplo:

  • Gazpacho. Quizá del ár. hisp. *gazpáčo,y este del gr. γαζοφυλάκιον gazophylákion ‘cepillo de la iglesia’, por alus. a la diversidad de su contenido, ya que en él se depositaban como limosna monedas, mendrugos y otros objetos.
  • Tulipán. Del fr. tulipan,y este del turco tülbent ‘turbante’.)

Estas podrían ser mis 10 palabras o expresiones favoritas del momento. No tienen un orden. Me gustan todas casi por igual… Intento incorporarlas a mi día a día y se las enseño a mi familia, compañeros de trabajo, amigos… Así es más fácil recordarlas.

PalabraDefinición
ZorronglónDicho de una persona: Que ejecuta pesadamente, de malagana y murmurando o refunfuñando, lo que le mandan.
CatacaldosPersona que emprende muchas cosas sin fijarse en ninguna.
SusurridoRuido suave que hacen algunas cosas naturales.
Hacer la jarritaHacer ademán de pagar algún gasto común, llevándosela mano al bolsillo.
BaticorPena, dolor. (De batir y el desus. cor ‘corazón’.)

*Vaya, el corazón hecho trizas.

AmusgarEntrecerrar los ojos para ver mejor.
PerecearDilatar, retardar o diferir algo por flojedad, negligencia o pereza.
PerlarCubrir o salpicar algo de gotas de agua, lágrimas
CandilazoArrebol crepuscular.
DestoserseToser sin necesidad, o fingir la tos, ya previniéndose para hablar, yapara que sirva de seña.

¿Qué sorpresas que desconocemos se esconden en el diccionario?

 Creo que no mucha gente conoce que en el DLE no solo se pueden buscar palabras, sino que se pueden buscar expresiones, anagramas, entradas del diccionario que comiencen por, terminen en o contengan alguna palabra o segmento de una palabra…

En el DIRAE o en el Diccionario Avanzado de la RAE además se puede buscar por cualquier elemento que contenga la definición. Por ejemplo, si se busca «loc. Adv.», se verán todas las locuciones adverbiales; o «desus.», se verán todas las palabras con la marca desusado.

https://twitter.com/MPGArual/status/1294553783993860096

¿Sabrías decir qué cantidad de palabras que viven en el diccionario no usamos y, sin embargo, no están marcadas como en desuso?

No puedo decir el número exacto de palabras, pero sí, sin duda utilizamos un porcentaje muy muy pequeño (¿habrá una palabra para muy muy pequeño? ¡Ajam! Existe tamarrusquito). He leído varios artículos y entradas de internet donde se dice que una persona no utiliza más de 300 palabras en su día a día. Me parecen poquísimas.

De hecho, ahora mismo llevo escritas 1.358 palabras, contando repeticiones (por ejemplo de se repite 116 veces. Sin repeticiones, he usado 525. Ahora quedaría lematizarlas, es decir, contar como únicas las formas, por ejemplo, diccionario y diccionarios… Como se ve, realmente no he utilizado muchas.

Creo que, en general, no sabemos usar bien el diccionario. ¿Qué debemos aprender a hacer? ¿Qué aconsejas tú?

Veo muchas consultas a la RAE en Twitter y pienso: ¿es que no pueden buscarlo en el diccionario? Y justamente después pienso que quizás no sepan buscar o no sepa la dirección web de la RAE o ni si quiera sepa que hay una aplicación móvil. Una vez me dijeron (hace años) que la RAE dejaba buscar tres palabras y luego tenías que pagar (atónita me quedé). Quizá no nos enseñen a manejar estos recursos o no tengamos el suficiente interés como para aprenderlo o retenerlo.

Creo que el primer contacto que tenemos con el Diccionario de la Real Academia de la Lengua es en el colegio y es ahí donde nos enseñan a utilizarlo. Se me hace muy difícil pensar que alguien no haya consultado nunca una palabra en este  recurso digital o en papel.

La web del DLE y la misma aplicación para el móvil es sencilla de usar y muy intuitiva. Hay un apartado donde explica cómo se usa el diccionario. Es este. Quizá quedaría más práctico si se hiciera un vídeo.

https://twitter.com/MPGArual/status/1293885244651851777

Eres lingüista computacional. ¿Hasta qué punto se enseña a las máquinas a utilizar y conocer palabras raras? ¿Aplicas tus descubrimientos a tu trabajo o es solo una cuestión lúdica?

Actualmente trabajo desarrollando asistentes virtuales y mi trabajo se centra en hacer que el asistente virtual entienda lo que la gente escribe. Para que la máquina pueda entender lo que los usuarios escriben, primero tengo que enseñar a la máquina las palabras (léxico), y luego cómo estas se combinan (sintaxis). No creo que tenga ningún sentido enseñar a la máquina palabras muy raras que nadie use, puesto que ocurrirá como ocurre ahora: se quedarán perdidas.

Lo que sí aplico de mis descubrimientos es la manera de buscar palabras. Me es muy útil saber buscar redes semánticas y léxicas para nutrir los corpus de los asistentes. Por ejemplo, si tenemos un asistente virtual al que le podamos preguntar el tiempo, me interesa conocer las diferentes maneras que hay para decir llover, parar de llover o lluvia, ya que una persona podrá decir: ¿va a diluviar mañana? o ¿cuándo escampará?

Compártelo twitter facebook whatsapp
¿Hay que compartir cama para tener una buena relación de pareja?
iCorrect: cómo convertir los mensajes en lecciones de lengua
El origen de los dichos: Tener su aquel
Revoluciones, hashtags y overpromise
 
Especiales
 
facebook twitter whatsapp
Opiniones 1
  • Es muy interesante, creo que podría tener muchas más aplicaciones, sobre todo en investigación científica e histórica. Me deprime un poco que pongan «el diccionario» cuando se refieren al DLE o al DRAE, que son diccionarios bastante pobres y mal hechos. Por ejemplo, la vigésimo segunda edición del DRAE tenía unos 2000 chilenismos, pero el principal diccionario de chilenismos tenía más de 60.000 cuando no estaba completo, ¿qué pasará en México o en Perú?. Me imagino que podría haber más de 1 millón de palabras en nuestro idioma y casi ninguna está en el DLE. Ojalá se expanda el campo de búsqueda y lleguen grandes descubrimientos.

  • Comentarios cerrados.

    El rollo legal de las cookies

    La Ley 34/2002 nos obliga a avisarte de que usamos cookies propias y de terceros (ni de cuartos ni de quintos) con objetivos estadísticos y de sesión y para mostrarte la 'publi' que nos da de comer. Tenemos una política de cookies majísima y bla bla bla. Si continúas navegando, asumimos que aceptas y que todo guay. Si no te parece bien, huye y vuelve por donde has venido, que nadie te obliga a entrar aquí. Pincha este enlace para conocer los detalles. Tranquilo, este mensaje solo sale una vez. Esperamos.

    ACEPTAR
    Aviso de cookies
    Publicidad