Como fixemos o Apalabrados en galego

  • 26 Marzo, 2013
  • Cilenis
  • 0 Comentarios

Etermax e Cilenis aliáronse para xerar o Apalabrados galego, a historia de como xurdiu xa vola contamos. Pero que foi o que fixemos nós exactamente? Imos tratar de explicarvos en que consistiu o noso traballo.

A aplicación necesitaba para comezar a andar un recurso lingüístico imprescindible: o dicionario galego de formas. Partimos entón dun dicionario de lemas electrónico: o Vocabulario Ortográfico da Lingua Galega (VOLGa). Este dicionario presenta as palabras na súa forma canónica, é dicir, non hai plurais para os nomes, non hai tampouco plural nin feminino para os adxectivos, e os verbos só se recollen en forma infinitiva.

Necesitabamos, pois, expandir eses lemas para ter o dicionario completo que se precisaba para o xogo. Como no dicionario de lemas as palabras estaban categorizadas, fomos creando regras para cada categoría. Así, xeráronse as regras xenéricas e específicas da formación do plural dos substantivos; as regras para plural e feminino dos adxectivos, e, por último, co noso conxugador automático Cilenis Conxugador conseguimos as conxugacións de todos os verbos.

A outra gran tarefa para completar as necesidades do xogo foi dar a puntuación ás letras, e ademais escoller que letras entrarían na versión en galego. Tentamos facelo de xeito sistemático, polo que primeiro separamos as formas do dicionario en letras para contabilizar cantas veces aparecía cada letra. É dicir, interesábannos a súa frecuencia. Con bandas de frecuencia ordenadas de maior a menor podiamos obter información máis precisa para axustar a puntuación de cada letra. Por exemplo, teñen máis de 400.000 aparicións no dicionario o “a”, “e”, “s”, “r, e menos de 1000 aparicións o “ñ” e “q”; embaixo podedes ver a lista completa.

Houbo certo debate, pois existen determinadas letras no galego que non se consideran parte do alfabeto, pero que si existen en determinadas palabras, por exemplo, o “j” e a palabra Jazz, como referenda o dicionario da RAG. Mais pensando na xogabilidade e tendo en conta a baixísima frecuencia, decidimos cinguirnos ao alfabeto galego e non incluír o “j”, “k”, “w” e “y”.

1 punto (+400.000): a e s r
2 puntos (200-400.000): o i n d
3 puntos (150-200.000): c t
4 puntos (100-150.000): m l u
5 puntos (80-100.000): b p
6 puntos (50-80.000): g f
7 puntos: (35-40.000): x v
8 puntos: (30-35.000): z
9 puntos: (20-30.000): h
10 puntos: (10-15.000): ñ q

Aquí finalizou o noso traballo, no entanto a Etermax aínda lle falta incluír as letras e puntuacións que desenvolvemos. Na próxima actualización do Apalabrados galego todo o noso traballo estará dispoñible para que o desfrutedes.

0 Comments