"Tenéis grandes obras que hacer, establecer un nuevo cielo y una nueva tierra entre nosotros, y las grandes obras tienen grandes enemigos". Seguro que cuando Stephen Marshall escribió esta frase en 1641 no se imaginaba que las grandes obras serían las investigaciones en genética y los grandes enemigos, el Excel y, sí, el maldito autocorrector.
Sé que suena raro. Pero un grupo de investigadores del Instituto Baker IDI de Melbourne ha descubierto que un alto porcentaje de investigaciones sobre genética podrían tener fallos producto de las opciones por defecto de la famosa hoja de cálculo. Ya va siendo hora de que alguien le pare los pies a los autocorrectores del mundo.
Los autocorrectores vuelven a la carga
En 2004, investigadores del NIH norteamericano ya se dieron cuenta de que, en análisis que usaban el nombre de los genes (o sus identificadores), el uso de Excel podía provocar serios problemas en la investigación y en las bases de datos.

Básicamente, el programa convierte los nombres de los genes en fechas o números con coma flotante de forma automática y sin que nadie se dé cuenta. De esta forma, nombres como SEPT2 se convierten automáticamente en "2-Sep" o "02-09-2016". Lo mismo pasa con el gen MARCH1 y con más de 30 genes (algunos muy importantes).
Este problema afecta sobre todo a los archivos suplementarios. Cuando se publica un artículo, buena parte de la información se adjunta a modo de anexos donde se pueden encontrar los datos en detalle. Esos son los archivos suplementarios. Son documentos que recogen información muy importante para el desarrollo y la revisión de los descubrimientos y, por eso mismo, se usan (y se vuelven a usar) muy a menudo. Aunque, visto lo visto, se revisan poco.
Un problema más generalizado de lo que parece

Se revisaron 35175 archivos de Excel de más de 18 revistas académicas. Los investigadores fueron capaces de encontrar 3597 listas de genes de las que 987 contenían errores. Casi un 20%. Revistas como Nature, Science o PLoS no se libran de los errores de Excel. Nature, de hecho, encabeza la lista de porcentaje de artículos afectados con más de un 30 por ciento.
Aunque, por su uso extendido, Excel es el más problemático, el asunto no sólo le afecta a él. Otras hojas de cálculo como las de OpenOffice o LibreOffice también se ven afectadas. En cambio, según los investigadores, Google Sheets no daba problemas de este tipo.
Todos hemos sufrido alguna vez la inoportuna acción de un autocorrector. Normalmente no pasa nada grave más allá de la vergüenza del momento. Pero en este caso, es bastante más grave. Pese a que hace más de diez años desde que se descubrió el problema, Excel sigue convirtiendo las bases de datos en calendarios llenos de fechas. Y sin un poco de interés por parte de autores, editores y revisores, seguirá haciéndolo.
Imagen | La imagen de cabecera es una modificación de un trabajo de Pablo Muñoz Sánchez.
Ver 122 comentarios
122 comentarios
md1988
Con darle formato "texto" a las filas y columnas antes de cargar los datos se ahorraban el dolor de cabeza. No es culpa del Office.
maesus
Vaya enfoque, que los investigadores no sepan usar excel, ese es el problema.
davidverapinero
Se lo tienen bien merecido por usar el Excel para hacer bases de datos
Jaime
Soy bioinformático y sí, el excel en general es bastante cáncer en nuestro ámbito. Nos facilitaría mucho la vida si en los laboratorios tuvieran ciertas nociones de, por ejemplo, R o incluso Python. Pero bueno, tal y como tira la cosa quizás en el futuro se acabe implantando.
lex10s
Pues nada, viendo los comentarios anteriores parece que aquí todos hacen diariamente hojas de calculo con miles de datos y nunca se les olvida ni una coma.
Yo no creo que el problema sea ni de los científicos ni de Excel, simplemente errores comunes en mayor o menor medida, a mi por este tipo de cosas no me gusta utilizar los autocorrectores.
Hace tiempo que no utilizo Excel pero estarían bien (si no existen ya) una opción para poner formatos por defecto que siempre estén permanentes en los nuevos archivos.
josemicoronil
Mucho de ustedes lo fliparía con la de catedrádicos que hay trabajando en universidades que son capaces de hacer cosas impresionantes en R, Scilab, Matlab, o Maxima, pero que no son capaces de manejar correctamente un procesador de textos o de hojas de cálculo. A mi en clase me han llegado a entregar documentos de texto en los que para saltos de página, alineación de texto, y demás, han usado espacios y retornos de carro en vez de insertar un salto real, o simplemente usar las sangrías y tabulaciones.
Esto ocurre nada más y nada menos porque dichas personas no son instruidas en usar ese software, no por otro motivo, y características como la implementada en Excel de autocorrección del tipo de celda quizás no sepan ni que existe.
Doy gracias que al menos nos proporcionen cursos de LaTex para poder redactar de forma más decente documentos formales y eviten que así mucha gente presenten documentos con fallas en la representación de fórmulas matemáticas o de otro tipo de contenido no demasiado genérico.
Un saludo.
ferchodiaz
Quién se equivoque en estas cosas no merece ser llamado investigador de punta. Errores tan elementales que el más modesto auxiliar de contabilidad no cometería. Además ¿no deberían usar herramientas de base de datos más sofisticadas?
divad82
Al parecer la mayoría de los que publican respuestas aquí tiene una nula idea de lo que hace un cientifico, aqui unas cuantas aclaraciones :
1. Excel es una herramienta mediocre para el manejo de grandes volúmenes de información, desgraciadamente su implementación con Visual Basic y otras herramientas OLE la hacen un mal necesario.
2. No es tan sencillo como "darle formato" a las celdas para que deje de exhibir fechas en vez de datos, simple y sencillamente porque esos archivos de excel no son creados por personas, sino por un objeto de automatización, que ordena a excel llenar con datos una hoja de cálculo copiados de la fuente principal, por lo que la basura de Excel considera que se trata de fechas y no de datos por si sola.
3. A pesar de existir multiples manejadores de hojas de cálculo Excel ,gracias al monopolio de Microsoft es el unico que se integra con desarrollo de html, visual basic, y SQL usando el ambiente de Windows (en open source hay mejores alternativas ) por lo que es la unica respuesta viable.
4. Revisar manualmente hojas de cálculo de mas de un millon de renglones por mas de 100 columnas resultaria un dolor de cabeza, y más si consideramos que al automatizarla suponemos que excel no va a hacer las estupideces que ya vimos.
ordexo
Lo que me deja alucinado es que haya tantos investigadores que trabajen y publiquen estudios con excel, con la multitud de software específico que hay (y no solo de pago, hay mucho software open source).
Usuario desactivado
Maldita calculadora que la utilizo como base de datos y no funciona como yo desearía. Haré un estudio criticándola.
Por cierto, excel es una calculadora, no es para hacer base de datos, la palabra hoja de CÁLCULO debería daros una pista.
Y ahora voy a darme cabezazos contra la pared hasta que la puerta se abra, ¿que por qué hago eso? Es que no soy arquitecto, ¿por qué debería saber abrirla correctamente?
minsburg
Al menos en México, en pequeñas y medianas empresas, no siempre valoran el trabajo de un ingeniero en sistemas computacionales y creen que no son indispensables para su negocio porque Excel (o Access para los "avanzados"), cumplen con sus expectativas, he aqui un ejemplo de los resultados. En fin, me apunto para diseñarles un ERP a la medida con una verdadera base de datos y reportes funcionales :)
ziceck.zhuk
Bases de datos con Excel? No me han reír por favor.
efrenk
¿En serio que estos científicos no conocen LaTeX? Debería ser obligatorio, así nos aseguramos que todo el conocimiento sea transferido de manera correcta.
charlie_johnny
Yo creía que en las universidades de Ciencias Básicas era obligatorio aprender programación orientada, bases de datos y algoritmia...
O sólo es en las públicas de México en donde si es obligatorio?
chechuch
Yo he trabajado con usuarios de distintos ámbitos laborales y puedo decir que el 90% no tienen ni pijotera idea de usar Office más que darle el botón para usarlo. Y mucho menos nadie se preocupa de hacerle un mini test o algo similar antes de entrar a trabajar. Conste que ahora llevo 10 años en Banca e idem de lo mismo... así luego pasa lo que pasa. Lo que me extraña es que no se vayan más ceros de la cuenta por algún lado :)
w0lfch4m4n3
No es culpa de Office, ni de Excel, ni de Microsoft.
Es culpa del usuario qué no sabe como usar el software.
Excel desde los días de su origen permite cambiar la tipología de los datos de sus celdas.
Para "arreglar" esta incidencia basta con pasar el contenido a formato "texto" o bien introducir un apóstrofe al inicio del contenido, por ejemplo: 'SEPT2; este carácter le indica al motor que lo qué sigue ha de tratarse literalmente y no formatearse.
comandillos
Todo eso por la manía de usar Excel para TODO, y menos para este tipo de cosas. Las soluciones personalizadas para cada problema son lo ideal. Usar Excel para realizar este tipo de estudios no es justificable.
bahamuth
Existe mucha gente que es muy buena en su trabajo pero los sacas de ahí y no valen para medio. Se han dedicado a aprender de un tema en específico se hacen muy buenos pero a lo que les toca ver algo distinto se les va el profecinalismo al trasto
Por eso es bueno saber de todo un poco y por lo menos conocer las herramientas de trabajo que utilizan en el día a día
Pere Ubu
Excel y otras hojas de cálculo están para manejar números. Si lo usas con un poco de asiduidad ya sabes que si quieres que un celda sea tratada como un texto y no como un número sobre el cual la hoja de cálculo te aplique por defecto un autoformato debes definir la celda como de tipo... texto. Esto no es olvidarse una coma, ni que un científico se olvide una vez de definir una celda como de tipo texto, si esto fuera así no sería noticia, esto es noticia porque aparentemente ya hace más de diez años que los hay (y parece que no son pocos) que van manejando datos en hojas de cálculo y no se han enterado por qué se les van al carajo. También es noticia porque son científicos, si fuera el pelagatos que se ofrece voluntario para llevar la contabilidad de la asociación de vecinos pasaría, pero científicos...
obijuancojones
Alucinando con el hecho de que esten usando Excel como base de datos, ciertamente obtienes cosas mucho mas robustas con simplemente aprender un lenguaje de sentencias basico como SQL.
Imposible imaginarme lo que debio haber pasado el pobre diablo al que le pidieron que arreglara todas y cada una de las celdas defectuosas en excel , no se gran cosa de manejo de datos no estructurados pero creo que la solucion podria estar en usar una SVM que funcione de manera analoga( e ironica) a los correctores de texto ? Se podria entrnar a la maquina de vectores con todos los datos no corrompidos y ver que sucede. El coñazo sin duda tendria que ser la infraestructura que estaria ocupando el software personalizado para este caso particular XD
obijuancojones
Considero relativamente "aceptable" que un especialista en un terreno acotado no sepa gran cosa de informatica y por ende caiga en trampas como esta , lo que veo bastante mal es que no exista esa molestia de cuando menos contratar un bioinformatico que sin dudas te hace una infraestructura de ptm para trabajar en ella, mal por ellos por que al final van a terminar pagando un buen dinero por el especialista que les reestructure todo el sistema.
txincho
VAMOS!!! que mi hijo de 12 años ya le han enseñado a cambiar el formato a "TEXTO" el la escuela, ¿estamos hablando de científicos?
dosmiluno1
1º. Las revistas científicas como las citadas son casi un artículo de lujo, por el precio que cobran a los que pueden permitirse el lujo de estar suscritos (normalmente universidades, organismos y empresas del primer mundo, ya que los de países con menos recursos a menudo prescinden de estas suscripciones).
2º. Los autores de los artículos no sólo no cobran ni tienen derecho algunos sobre lo publicado sino que a veces tienen que pagar.
3º Los "referees" son los responsables de validar lo publicado lo que supone verificar todo, incluido los cálculos y programas usados aunque a menudo se quedan en la forma y en si el inglés es correcto.
Conclusión: son los editores de las revistas los responsables de la forma y el fondo, para ellos se pagan las marcas (Nature, Scientific American, etc)
mariano.vizcaino
Eso pasa por usar Excel. Yo con mi regla de cálculo jamás tengo esos problemas.
warp68
Pensaba que en investigaciones serias se usaban programas como SPSS, no Excel, con sus errorcillos de nada...
miguejimenezreyes
Mejor que se cambien a Visicalc.
rafaxataca
El problema no puede ser nunca de la herramienta sino de el que la utiliza. Existen cientos de herramientas para la investigación. El investigador tiene la obligación de conocerlas antes de usarlas para manejar datos sensibles, sacar conclusiones y encima publicar. Además, para ser investigador se espera una cierta obsesión por el detalle. No hay excusa.
Querer culpar a una conquista como la autocorrección y a una herramienta sin parangón en el mercado, es una chorrada.