Seguro que algunos de vosotros habéis vivido una de esas situaciones en las que tenéis que rellenar un formulario en papel y hay algún campo en el que no hay suficiente espacio. Apellidos compuestos o localidades con nombres largos solían ser un problema, pero eso ha ido más allá en internet.
En esta era en la que nuestros nombres son parte fundamental de todo tipo de procesos hay casos en los que precisamente esos nombres y apellidos pueden convertirse en toda una pesadilla. Y si no, que se lo digan a una joven norteamericana llamada Jennifer Null.
Apellidos que son una condena (digital)
Estos días conocíamos la historia de esta chica y de su problema con todo tipo de formularios online. Su apellido había sido motivo de bromas durante gran parte de su vida, pero la cosa fue mucho más allá cuando comenzó a intentar usarlo en formularios web para todo tipo de operaciones como reservas de vuelos o cumplimentación de impresos de Hacienda.

Su apellido, 'Null' -la traducción literal es 'nulo' o 'inválido'-, es precisamente un valor típico de todo tipo de programas informáticos en los que ese valor suele dar como respuesta algún tipo de error.
Si Jennifer introduce ese apellido en los formularios, lo normal es que no la dejen completar el proceso, algo que ha convertido muchas operaciones en una larga consulta telefónica en el que por supuesto quien está al otro lado suele decirle que está tratando de tomarle el pelo.
Hay otros casos, como los de las personas que por ejemplo tienen apellidos demasiado largos que no caben en sus documentos de identidad. Es el caso de Janice Keihanaikukauakahihulihe'ekahaunaele, una mujer hawaiana que sufrió la limitación de 36 caracteres para el apellido en los documentos de su estado.
Nuestra eñe y nuestras tildes desaparecen en internet
Ese problema forma parte de los llamados casos o valores extremos de los métodos de prueba de todo tipo de desarrollos software.

En las célebres pruebas de caja negra se evalúan valores fáciles, valores realistas, valores ilegales y valores extremos, y lo que ocurre en formularios como los mencionados es que esos valores precisamente no suelen probarse porque suelen ser muy poco probables o nadie se imagina ciertos casos extremos que al final acaban presentándose.
El problema se ha hecho aún más grande con la llegada de internet y de la globalización: los juegos de caracteres y su codificación han hecho que en muchos casos esos problemas se puedan solucionar, pero hay muchísimos casos en los que la ausencia de soporte para cierta codificación de caracteres puede dar muchos quebraderos de cabeza.
¿Qué pasa con la eñe en mi correo electrónico?
De hecho si hay un caso evidente en ese limitado soporte de caracteres, ese es el correo electrónico. Ahí desaparecen tanto nuestras eñes como nuestras tildes, y lo mismo ocurre en otros idiomas con caracteres especiales, aunque aquí también hay potenciales cambios a la vista.

El RFC 5322 es uno de los documentos más importantes a la definir el uso de direcciones de correo electrónico válidas en las que se pueden usar solo ciertos caracteres ASCII tanto en el nombre de usuario como de dominio, pero precisamente el uso de los IDNs de los que hablábamos ha hecho que poco a poco se vayan extendiendo direcciones de correo en las que esos caracteres especiales existen y, lo más importante, "funcionan" en muchos casos.
Como comentaban en StackOverflow, eso hace que sea posible utilizar direcciones de correo electrónico como mason@日本.com o wildwezyr@fahrvergnügen.net en los que al menos el nombre de dominio (no el de usuario) sí puede contener esos caracteres.
Cuidado porque al utilizarlos podemos poner en un brete a ciertos clientes de correo y por supuesto a ciertos usuarios, pero el soporte para dichas combinaciones es oficial y la ICANN como el IETF están trabajando en este tipo de soporte con nuevas documentaciones como el RFC 3490.

Existen de hecho sistemas como los códigos Punycode que permiten trasladar caracteres ASCII a caracteres soportados en la codificación Unicode que sí está aceptada en los nombres de dominios. Eso ha hecho que sea posible elegir por ejemplo caracteres especiales de idiomas como el español, el alemán o el griego.
También ha habido problemas con eso: algunos caracteres especiales, pueden servir para ataques de phishing. En Sophos avisaban hace años de cómo un cibercriminal podría crear una réplica de la página de Apple sin que nos diéramos cuenta en un análisis superficial si este utilizara caracteres cirílicos muy parecidos a las "pes" minúsculas.
Internet trata de adaptarse
Esa realidad es patente en nuestro idioma, donde los caracteres especiales no son especialmente afines a la era digital. Aunque es posible utilizar dominios con letras como la eñe -la ICANN tiene muy bien explicados estos casos en sus IDNs-, lo cierto es que la utilización de esta letra hace que esos dominios sean difícilmente accesibles por usuarios de otros juegos de caracteres.

El problema inverso es idéntico, y de hecho en todo tipo de formularios lo de introducir las tildes y las eñes puede dar un problema grave no solo en el formulario, sino en la verificación física.
Ha ocurrido durante años con los documentos oficiales como el carnet de identidad, en el que nuestros nombres y apellidos aparecen en mayúsculas y sin tildes porque las imprentas con las que se creaban estos documentos no disponían de soporte para mayúsculas con tilde.
Seguramente algunos hayáis dudado entre incluir o no esos caracteres especiales de nuestro idioma en una reserva de un vuelo ya que según qué destinos -y quién revise esos datos una vez estemos a punto de facturar o embarcar- podrán aparecer problemas por una vocal sin tilde o una ene que en realidad es una eñe en vuestro pasaporte o documento de identidad.
El problema es muy conocido entre los desarrolladores y aquellos que trabajan con bases de datos y todo tipo de formularios: la codificación de caracteres es algo con lo que todos estos desarrollos deben contar para que el soporte de cadenas de texto en esos servicios y aplicaciones sea adecuado, pero con todo y con eso el problema está ahí. Estamos aprendiendo a convivir con él, nos tememos.
En Xataka | El desafío de poner nombre a los productos tecnológicos
Ver 49 comentarios
49 comentarios
jimmy_olano
Hace muchos años ya, a finales de los 80, los únicos teclados que llegaban a Venezuela eran en inglés y para escribir los acentos o la ñ -QUE NOS ENORGULLECE DE TENERLA- pues íbamos al famoso ALT+164 "ñ" o ALT+165 "Ñ" (eso sí, con el teclado numérico).
Luego en 1994 llegaron los teclados con su flamante Ñ (con la base de datos escogíamos almacenamiento formato BRITÁNICO y nos iba bien hasta con las fechas dd/mm/aaaa) y corrimos a colocarselo al servidor POR FIN SERÍAMOS AMOS Y SEÑORES DEL DICHOSO CACHARRITO, reinicio, todo bien, por monitor las pruebas , acentos, eñes, ¡ALEGRÍA!...
...hasta que tuvimos que conectarnos por la linea de comandos a la base de datos... Y EL MOTOR de BD NO FUNCIONÓ PORQUE SE NEGABA A CORRER CON ESE TIPO DE TECLADO... halá a apagar, conectar el teclado viejo (ni siquiera era PS/2 era el otro tipo "conector gordo" y los puertos USB ni siquiera los habían inventado) y encender el servidor.
Hasta que ese servidor quedó inservible (no recuerdo la razón) nunca pudimos escribir nuestros acentos y eñes TRISTE, MUY TRISTE LA COSA.
Hoy en día ha mejorado de manera enormemente con el uso de los caracteres UNICODE (por cierto 日本 se traduce como Japón pero cada palabra significa "sol-origen" o en poético castellano EL ALBA -en inglés "sun-rise"-) TODAVÍA QUEDA MUCHO POR LABRAR aquí en Venezuela el SENIAT (recaudador de impuestos) nos obliga -por ley- a utilizar "impresoras fiscales" son unos aparatitos con autonomía (propio reloj, memoria fiscal que cada venta queda grabada hasta que se agota el espacio) Y TENEMOS PROBLEMAS DE NUEVO CON LA Ñ lo que hago es que cada vez que se envía a la imrpesora fiscal el nombre del cliente yo mando a sustituir por "N~" lo cual es la solución menos mala para indicar nuestra gloriosa ñ.
Por cierto, la que yo llamo virgulilla "~" es el caracter ASCII 126 y es lo máximo que acepta la impresora debido a que se conecta por cable serial 9 pines (si, por COM1 que casi ninguna tarjeta madre trae ahora -tampoco puerto paralelo-) y el gobierno quiere EVITAR que uno envie el ESC+códigos a la impresora fiscal (que de paso es de matriz de puntos aún).
EN CUANTO A LOS CORREO ELECTRÓNICOS la norma incluso permite espacios -sí, leísteis bien ESPACIOS- *siempre y cuando* vayan encerrados entre paréntesis
h t t p s : // en. wikipedia .org/wiki/Email_address#Valid_email_addresses
pero evidentemente, AL IGUAL QUE LAS IMPRESORAS FISCALES QUE COMENTÉ solo aceptan hasta el caracter 126, la virgulilla "~".
ES ASÍ COMO EL CASTELLANO SE NIEGA A MORIR y no morirá mientra nos, programadores que aman su lengua materna, sigamos "machacando" el software sol a sol.
Muchas gracias por su atención. 8-)
crisct
Nombre: Jennifer
Apellidos: drop table *;commit;
Bum jajaja vaya un apellido rarito..
nuevocharrua
el apellido es la cadena de caracteres "Null" el valor null es un valor vació
(común mente es un puntero a 0), no entiendo como puede dar error...
Alkar
Pero cómo es posible que a estas alturas nadie haya citado al pequeño Bobby Tables...
r a g n o r
En mi caso, para la publicación de artículos científicos, he optado por quitar la tilde y sustituir la Ñ de mi apellido por una N para evitar problemas. Aunque en el futuro se acepten estos caracteres para direcciones web y de correo, hay que tener en cuenta que fuera del país no todos tienen la misma facilidad para introducirlos.
elkubano
El problema pricipalmente no es la mala programacion como tal, si no que para evitar inyecciones sql creo recordar que hay unas directivas en el archivo php.ini el cual si no recuerdo son strip_tags y escapeshellcmd las cuales rechazan cualquier entrada rara que pueda entrar en conflicto y si sintiendolo mucho por esa persona es la manera mas segura y cortar de raiz este tipo de ataques, cierto que podriamos usar expreciones regulares para validar los formularios, pero solo hace falta cagarla una vez para que tengamos expesta nuestra web... saludos
JuanAnt
Cada día me alucina más la informática a nivel de software y webs.
cristianhome
Esto me recuerda el curioso caso de little bobby tables.
royendershade
Mi unico problema es una tilde en el apellido, y no la incluyo nunca cuando hago gestiones de vuelos o en servicios extranjeros. No creo que me pongan nunca problemas con una tilde cuando se ve el resto perfectamente y se entiende el motivo por el que no esta.
halios
Cuando estudio Bases de Datos teníamos prohibido utilizar la Ñ o cualquier tilde, al igual que en XML para evitar rollos, algo horrible para un amante de la ortografía pero necesario para evitar embrollos.
eslax
Muy triste tiene que ser una web que no puede filtrar los campos de texto y distinguir entre null y "null" (cadena de texto). Lo de las ñ y caracteres especiales es mínimamente comprensible al haber un montón de codificaciones disponibles, pero esto es como si pongo en un campo de una web DROP TABLE xxxx y mágicamente se borran sus bases de datos, solo demuestra lo "bien programados" que están algunos sitios web.
Y se supone que el caso de esta Jennifer Null es utilizando webs serias tipo compañías aéreas o webs del Estado, cosa que agrava más el asunto.
diegoasdfg
Viviendo en Inglaterra y teniendo que rellenar miles de papeles me he dado cuenta de que a NADIE le importan ni las tildes ni las eñes. Ni a la hora de volar ni al hacer papeleo incluso en España.
d
http://www.kalzumeus.com/2010/06/17/falsehoods-programmers-believe-about-names/
catafractario
Desde luego, como te apellides Iturriberrigorrigoicoerrotaberricoechea, Barinagarrementeria, Gerenabarrena, Zengotitagoitia o Uribeetxebarria, le puedes causar un trauma neuronal al funcionario de turno o reventar la base de datos en la que te quieras incluir.
xxoacxx
tomarle importancia a estos casos que no pasan a menos que no sepas tratar variables ni valores de un formulario, es una tonteria, pero bueno. asi los articulos de xataka. por cierto soy ingeniero de sistemas y que pase eso que dice el articulo en una formulario que te pida tu nombre, es casi imposible, por no decir que nunca pasaria.
sysmaya
Ñ ñ
Tambien es error por parte de los desarrolladores de los sitios web, que impiden ingresar tildes, o EÑES.
Un poco de trabajo en la base de datos y soporte UTF-8. Y codificar correctamente el HTML de salida para visualizar correctamente esos caracteres.
En cuanto al email, mejor comerse las tildes y eñes
andresanni
Que pavada... Nunca un campo con la cadena de caracteres "Null" va a ser tomado como un campo vacío, osea igual a null.