La cruzada de estos españoles para que la lengua ibérica llegue a tu ordenador

Son líneas rectas, puntos y círculos que, unidos, forman caracteres extraños: emes y erres al revés, una especie de piruleta, flechas con varias puntas… Se trata de los caracteres de la lengua ibérica, una de las que hablaban nuestros antepasados en la península.

Pero no esperes encontrar estos símbolos en tu teclado, al lado de los emojis, o en el menú de símbolos del procesador de textos, junto a rayas largas o comillas angulares. De momento: un grupo de españoles, estadounidenses y un martiniqués trabajan para que pronto lo hagas.

La iniciativa surgió “un poco como efecto secundario, si tú quieres, del proyecto Hesperia”, explica a Xataka Noemí Moncunill, investigadora de la Universidad de Barcelona y una de las promotoras. Con Hesperia, el profesor de la Universidad Complutense Javier de Hoz quiso que en internet estuvieran no solo las inscripciones de la lengua ibérica, sino del resto de lenguas paleohispánicas que había en la península antes de la llegada de los romanos.

“En el proceso de digitalización de estas inscripciones, nos dimos cuenta de que un aspecto importante también era fijar las escrituras y el estándar internacional”, relata Moncunill. “Para fijar o para hacer una versión electrónica de la escrituras hay que hacerlo a través del consorcio Unicode”.

Unicode es conocido por ser el organismo que establece los emojis oficiales. Fue quien en 2016 dio el visto bueno al de la paella, que surgió de una iniciativa publicitaria en España. Pero además, establece los estándares para los signos ortográficos que encontramos en los procesadores de textos o codifica los caracteres de las lenguas muertas. De él forman parte grandes empresas tecnológicas como Apple, Google o Adobe, los gobiernos de Bangladés e India y universidades como la de Berkeley, en California.

Hablando de Berkeley. Durante el proceso, Moncunill y sus compañeros contactaron con el Script Encoding Initiative, un grupo de esta universidad estadounidense que trabaja con equipos de investigación y con minorías lingüísticas y que ayuda a conectar con el perfil técnico de Unicode. “A veces es difícil que la gente de humanidades hablemos el mismo idioma que los técnicos. Es necesario y es muy útil que alguien que conoce las dos formas de trabajar actúe como puente entre las dos comunidades”.

En él hay lingüistas de Berkeley, pero también “perfiles más técnicos”. “Tienen ya unas listas confeccionadas de escrituras que no están en Unicode y que tienen suficiente interés o gente trabajando en ellas como para que se codifiquen”. El ibérico era una de ellas, así que, cuando Moncunill y sus compañeros llegaron, “ellos estuvieron muy abiertos e incluso contentos”.

Aunque habían contactado antes, la primera propuesta preliminar la mandaron en 2015. Luego han llegado más (1 y 2). Los españoles han sugerido no solo codificar esta, sino el resto de lenguas paleohispánicas, como la celtíbera. “Aunque es verdad que unas no están muy bien descifradas, se pueden codificar porque las formas sí se conocen. Aunque no sepas siempre cuál es el valor fonético de los signos, sí sabes cuál es el repertorio de signos que hay que codificar”.

Cómo funciona el Script Encoding Initiative

El Script Encoding Initiative es el encargado de defender la propuesta en Unicode. Deborah Anderson es el contacto entre el equipo español y los lingüistas que trabajan con ella. “Noemí y su equipo han sido los proponentes perfectos”, cuenta a Xataka. “Han respondido rápido a las preguntas y han hecho revisiones según lo solicitado. Han sido muy pacientes, ya que este proceso lleva varios años”.

La versión que manden ahora Moncunill y sus compañeros será “la casi final”. El grupo Script Ad Hoc, que lidera Anderson, la llevará ante el comité técnico de Unicode (UTC, en inglés), previa revisión cuidadosa “para identificar cualquier posible problema que pudiera surgir durante el debate en el UTC”. Este “puede hacer algunas propuestas de modificación todavía o sugerir algún cambio, pero normalmente son cambios menores”.

Si el UTC hace preguntas o comentarios, la aprobación se retrasaría. “Sin embargo, Script Ad Hoc y UTC han visto la propuesta paleohispánica muchas veces, así que confío con cautela en que podría aprobarse”. Pero no siempre es el caso, “así que no querría predecir el resultado”.

"Han visto la propuesta paleohispánica muchas veces, así que confío con cautela en que podría aprobarse"

La próxima reunión de este comité, a cuyo cargo está la vicepresidenta de Unicode y extrabajadora de IBM Lisa Moore, es entre el 23 y el 26 de julio de este año. Los caracteres también los debe aprobar un subcomité del ISO, la Organización Internacional para la Estandarización, que se reúne una vez al año.

Tras la publicación oficial, explica Anderson, se pueden crear las fuentes y teclados normalizados. Además, quizá sería necesario que los softwares se actualizasen. Las fuentes han de ser “estables”, añade por su parte Moncunill, es decir, que las podamos usar en Twitter, al escribir en una tableta o al convertir un archivo a .pdf, por poner ejemplos distantes.

Como sucedió con el emoji de la paella, Unicode dará el visto bueno. Pero para ello, hay que poner de acuerdo a los grandes de Silicon Valley. Moncunill dice que “lo difícil es que Facebook, Google, Microsoft, Apple…, todos estos gigantes informáticos acepten la codificación que tú propones y se comprometan a utilizar en todos los aparatos o todos los programas que vayan saliendo”.

Cómo están diseñando los caracteres

Arthur Francietta es el encargado de diseñar los caracteres que Unicode debería aprobar. Miembro del Atelier National de Recherche Typographique (Taller Nacional de Investigación Tipográfica, una escuela de arte francesa orientada a la tipografía), integra el proyecto The Missing Scripts, que junto a la Script Encoding Initiative pretende reivindicar la variedad de escrituras del mundo y las minoritarias que todavía no están en Unicode.

Este martiniqués califica a Xataka de “muy agradable” la experiencia con las lenguas paleohispánicas. Ya dibujó el primer dibujo de fuentes para Unicode; uno de los requisitos era que con la primera propuesta mandaran algunos caracteres y preferiblemente luego se colocasen en Open access para que la gente los usara (están trabajando para colgarlos, y lo harán una vez que Unicode dé el visto bueno a la propuesta final).

Para los caracteres “comienzo por el dibujo o la caligrafía para fijar las formas y un estilo particular”. Luego, usa Glyphs, “que permite dibujar formas vectoriales con la ayuda de curvas de Bézier [un sistema para el dibujo técnico], pero también es una herramienta para desarrollar fuentes”. En esta fase es común imprimir los símbolos para detectar errores “y otras aberraciones ópticas”.

A cada signo o carácter se le dará un código único. De hecho, los hexadecimales para las lenguas paleohispánicas ya están reservados. En la imagen tienes más información:

Los caracteres de la lengua ibérica

El proceso para escoger los caracteres que un día pueden formar parte de nuestros teclados es “muy largo y muy complejo”, explica Moncunill. “Hay que crear una escritura estándar, por así decirlo. Hay que seleccionar, de todas las variantes de cada signo, solo una”. El investigador Joan Ferrer, compañero de Moncunill en Barcelona, fue el encargado de ‘dibujar’ el repertorio básico de signos para Francietta.

“Solo debemos elegir la variante más representativa de cada signo, normalmente la más frecuente”, explica Ferrer a Xataka, “y recrearla mediante un programa de dibujo vectorial, en mi caso una versión antigua de Freehand [un programa de Adobe para crear imágenes que derivó en Illustrator] que ha sobrevivido a la actualización periódica del sistema operativo”, explica Ferrer.

El modelo básico de la escritura ibérica nororiental, una de las que están proponiendo para Unicode, “fue establecido por [el arqueólogo granadino] Manuel Gómez-Moreno en 1922, cuando descubrió que la escritura ibérica combinaba signos alfabéticos para vocales y consonantes”. A ellas incorporaron novedades de investigaciones posteriores, como la escritura ibérica suoriental, “aunque no todas tienen aún una aceptación unánime”.

La lengua ibérica tenía cinco vocales, que corresponderían a las actuales del castellano, y consonantes que representan los sonidos de las b, d, g, k, t, l, m, n, r y s. Junto a ellos, dos sonidos parecidos a los de la erre y la ese españolas. Ferrer explica que es “una simplicación” y que el sistema podría ser más complejo. La combinación de vocales y consonantes da lugar a sílabas que se representan con caracteres, como muestra este cuadro:

Además, los investigadores se imaginan el significado de algunas palabras: 'śalir' “aparece en las monedas de plata y suponemos que significa 'plata' o quizás un tipo concreto de moneda de plata”, y 'egiar' “parece bastante claro que significa 'hecho por' u 'obra de’”.

Mientras la lista de emojis sigue creciendo, hay colaboradores de Unicode que piden más esfuerzos para codificar símbolos de lenguas históricas. Ya existen propuestas de entrada para el cuneiforme, el maya, el etrusco o los jeroglíficos egipcios. Mientras, algún día, junto al emoji de la paella, puede haber otro logro español: el de los caracteres de las lenguas que usaron nuestros antepasados.

Imágenes | Cedidas por Arthur Francietta (1, 2 y 3) y Joan Ferrer (4 y 5).

Ver todos los comentarios en https://www.xataka.com

VER 14 Comentarios

Portada de Xataka