ADN fabricado, primer sistema automatizado de almacenamiento de datos

El ADN fabricado ha sido calificado como un nuevo paso al nacimiento de nuevas tecnologías. El camino ha sido emprendido por investigadores de Microsoft y de la Universidad de Washington, quienes han podido demostrar que se trata del primer sistema automatizado de almacenamiento de datos.

La intención de los expertos ha sido sacar la tecnología del laboratorio de investigación y llevarla a centros de datos comerciales. El equipo, en una prueba simple de prueba de concepto, ha codificado con éxito la palabra “hola” en fragmentos de ADN fabricado y lo convirtió de nuevo a datos digitales. Para ello, se ha utilizado un sistema completamente automatizado de extremo a extremo, que se describe en un nuevo artículo publicado en Nature Scientific Reports.

“DNA puede almacenar información digital en un espacio que es un orden de magnitud más pequeño que el que usan los centros de datos en la actualidad. Es una solución prometedora para almacenar la gran cantidad de datos que el mundo genera cada día, desde registros de negocios y videos de animales lindos, hasta escaneos médicos e imágenes del espacio exterior”.

Con esto, se ha resaltado que Microsoft está explorando formas de cerrar una brecha inminente entre la cantidad de datos que estamos produciendo y que se deben preservar, además de su capacidad para almacenarlos.

Eso incluiría el desarrollo de algoritmos y tecnologías de computación molecular para codificar y recuperar datos en el ADN fabricado, que podría encajar toda la información almacenada actualmente en un centro de datos del tamaño de un almacén, en un espacio aproximadamente del tamaño de unos pocos dados de juegos de mesa.

Información en ADN fabricado

Karin Strauss, investigador principal de Microsoft, ha informado que el objetivo final de la compañía es poner en producción un sistema automatizado de almacenamiento de datos que, para el usuario final, se parece mucho a cualquier otro servicio de almacenamiento en la nube.

“Los bits se envían a un centro de datos, y se almacenan allí, y luego aparecen cuando el cliente los quiere. Para hacer eso, necesitamos demostrar que esto es práctico desde una perspectiva de automatización”.

Y es que la información se almacena en moléculas de ADN sintético creadas en un laboratorio (no en el ADN de seres humanos u otros seres vivos) y se puede cifrar antes de que se envíe al sistema. Las máquinas sofisticadas como los sintetizadores y los secuenciadores ya realizan partes claves del proceso, pero muchos de los pasos intermedios hasta ahora han requerido trabajo manual en el laboratorio de investigación.

Chris Takahashi, científico investigador principal de la Escuela de Ciencias de la Computación e Ingeniería Paul G. Allen de la Universidad de Washington, ha dicho que eso no sería viable en un entorno comercial.

“No se puede tener un grupo de personas corriendo en un centro de datos con pipetas: es muy propenso a los errores humanos, es muy costoso y la huella sería demasiado grande”.

Como una solución de almacenamiento comercial, para que la técnica tenga sentido, los costos deben disminuir tanto para la síntesis de ADN, como para el proceso de secuenciación que extrae la información almacenada.

Los investigadores han dicho que las tendencias se están moviendo rápidamente en esa dirección. Precisamente, para los expertos de Microsoft, la automatización es otra pieza clave de ese rompecabezas, ya que permitiría el almacenamiento a escala comercial y lo haría más asequible.

El ADN, en las condiciones adecuadas, puede durar mucho más que las tecnologías de almacenamiento de archivos actuales que se degradan en cuestión de décadas.

“Parte del ADN ha logrado persistir en condiciones de almacenamiento menos que ideales durante decenas de miles de años en los colmillos de mamut, y en los huesos de los humanos primitivos, y debería tener relevancia mientras la gente esté viva”.

Software para ADN fabricado

Se ha indicado que el sistema automatizado de almacenamiento de datos de ADN fabricado utiliza un software desarrollado por el equipo de Microsoft y la Universidad de Washington, que convierte los unos y los ceros de los datos digitales en los As, Ts, Cs y G que forman los componentes básicos del ADN.

“Luego utiliza un equipo de laboratorio económico y en gran medida disponible para el flujo de los líquidos y productos químicos necesarios en un sintetizador que construye fragmentos de ADN fabricados y los empuja hacia un recipiente de almacenamiento”.

Posteriormente agrega otros químicos, cuando el sistema necesita recuperar la información, para preparar adecuadamente el ADN y utiliza bombas de microfluidos para empujar los líquidos a otras partes del sistema que pueden leer las secuencias de ADN y las vuelven a convertir en información que una computadora puede entender.

El objetivo del proyecto, de acuerdo a los investigadores, no era demostrar qué tan rápido o barato podría funcionar el sistema automatizado de almacenamiento de datos, sino simplemente demostrar que la automatización es posible.

Para Bichlien Nguyen, investigador de Microsoft, tener un sistema automatizado para hacer el trabajo repetitivo les permite a los que trabajan en el laboratorio tener una visión más amplia y comenzar a armar nuevas estrategias, para innovar esencialmente mucho más rápido.

Se ha señalado que un beneficio inmediato de tener un sistema automatizado de almacenamiento en ADN es que libera a los investigadores para explorar preguntas más profundas, en lugar de pasar tiempo buscando botellas de reactivos o exprimir repetidamente gotas de líquidos en tubos de ensayo.

Es importante mencionar que el equipo del Laboratorio de Sistemas de Información Molecular ya ha demostrado que puede almacenar fotografías de gatos, grandes obras literarias, videos pop y grabaciones de archivo en ADN fabricado, y recuperar esos archivos sin errores en un entorno de investigación.

Hasta la fecha, han podido almacenar un gigabyte de datos en el ADN fabricado, superando su récord mundial anterior de 200 MB.