¿Cómo hicimos Apalabrados en gallego?

  • 26 Marzo, 2013
  • Cilenis
  • 0 Comments

Etermax y Cilenis se aliaron para crear Apalabrados en gallego. La historia de cómo surgió ya os la hemos contado, pero qué fue lo que hicimos nosotros exactamente? Vamos a tratar de explicaros en qué consistió nuestro trabajo para así conocer cuál fue nuestra implicación en el proyecto.

La aplicación necesitaba para empezar a andar un recurso lingüístico imprescindible: el diccionario gallego. Partimos entonces de un diccionario de lemas electrónico: el Vocabulario Ortográfico da Lingua Galega (VOLGa). Este diccionario presenta las palabras variables en su forma canónica, es decir, no hay plural para los nombres, tampoco hay plural ni femenino para los adjetivos, y los verbos solo se recogen en forma infinitiva.

Necesitábamos, pues, expandir esos lemas para tener un diccionario completo. Como en el diccionario de lemas las palabras estaban categorizadas, fuimos creando reglas para cada categoría. Así, se generaron las reglas genéricas y específicas de la formación del plural de los substantivos; las reglas para plural y femenino de los adjetivos, y, por último, con nuestro conjugador automático Cilenis Conxugador conseguimos las conxugaciones de todos los verbos.

La otra gran tarea para completar las necesidades del juego consistió en dar una puntuación a las letras y decidir qué letras entrarían en la versión en gallego. Intentamos hacerlo de una forma sistemática por lo que primero separamos las formas del diccionario en letras para contabilizar cuántas veces aparecía cada letra. Es decir, nos interesaba su frecuencia. Con bandas de frecuencia ordenadas de mayor a menor podíamos obtener información más precisa para ajustar la puntuación de cada letra. Por ejemplo, tienen más de 400.000 apariciones en el diccionario la “a”, “e”, “r” y “s” , y menos de 1000 apariciones la “ñ” y “q”. Abajo podéis ver la lista completa.

Ha habido cierto debate, pues existen determinadas letras en gallego que no se consideran parte del alfabeto, pero que sí existen en determinadas palabras, como es el caso de la “j” y la palabra “Jazz” que recoge el diccionario de la RAG. Pero pensando en la práctica del juego y teniendo en cuenta la bajísima frecuencia, decidimos ceñirnos al alfabeto gallego y no incluir la “j”, “k”, “w” e “y”.

1 punto (+400.000): a e r s
2 puntos (200-400.000): o i n d
3 puntos (150-200.000): c t
4 puntos (100-150.000): m l u
5 puntos (80-100.000): b p
6 puntos (50-80.000): g f
7 puntos (35-40.000): x v
8 puntos (30-35.000): z
9 puntos (20-30.000): h
10 puntos (10-15.000): ñ q

Aquí finalizó nuestro trabajo, sin embargo a Etermax todavía le queda incluir las letras y puntuaciones apuntadas. En la próxima actualización del Apalabrados gallego todo nuestro trabajo estará disponible para que lo disfrutéis.

0 Comments