¡Eureka! Descifrando los códigos ómicos con StorNext en el Instituto Suizo de Bioinformática SIB
El Instituto Suizo de Bioinformática SIB se encuentra a la vanguardia de la gran revolución del ámbito científico, aplicando metodologías computacionales para las ciencias genómicas, proteómicas y bioinformáticas. El trabajo del SIB se centra cada vez más en las genómicas aplicadas para mejorar la calidad de vida.
"El SIB ha trabajado recientemente en un algoritmo para las pruebas de diagnóstico prenatal para afecciones como el síndrome de Down," explica el Catedrático Ioannis Xenarios, Director del Grupo Vital-IT. "Con una simple extracción de la sangre de la madre a las 11 semanas de gestación, podemos secuenciar el material genético del feto dentro del útero. Es menos invasivo y mucho menos arriesgado que la tradicional amniocentesis. Y demuestra como la genómica cada vez tiene más relevancia en nuestra vida diaria."
Más de 30 TB a la semana provocan retos únicos en la administración de los datos
SIB maneja seis centros de secuenciación y presta soporte a 300 equipos de investigación que generan hasta 30 TB a la semana.
"En los últimos años, la secuenciación es cada vez más rápida," explica Roberto Fabbretti, Científico Senior y Administrador TI en Vital-IT. "Esto significa que estamos desarrollando más proyectos que nunca y nuestros datos aumentan considerablemente."
Las investigaciones de larga duración requieren una custodia de los datos
"Para investigaciones en ámbitos como el cáncer o la inmunoterapia, guardamos una gran cantidad de datos secuenciados de cada paciente," explica Xenarios. "Si esta persona vuelve cada semana o cada mes, es necesario que todos los datos de las pruebas anteriores estén a disposición de los investigadores de manera rápida y eficaz, y en el menor tiempo posible. Para escalar nuestros esfuerzos bioinformáticos con el fin de ayudar a las decenas de miles de pacientes, necesitamos buscar la manera más rentable para conservar los datos genómicos en periodos de 20, 30 o 40 años, creando un informe efectivo del paciente desde antes de su nacimiento hasta su fallecimiento."
El almacenamiento de alto rendimiento a peta escala
Actualmente, Vital-IT mantiene sus infraestructuras de investigación con el almacenamiento por niveles StorNext de Quantum. Los investigadores obtienen una secuenciación y un análisis de alta velocidad mediante cuatro sistemas separados de StorNext, de casi 1 PB de almacenamiento primario y 4 PB de archivados en cinta económicos. StorNext proporciona un procesamiento de alto rendimiento empleando una IP por Infiniband, mantiene los datos activos en almacenamientos primarios para su análisis, y traslada de manera automática los archivos a un almacenamiento en cinta AEL a medida que envejecen. Más de 600 usuarios acceden a los datos de uno de los centros de datos o de manera remota mediante la interfaz CIFS.
El acceso automático mantiene los datos genómicos listos para su estudio
"Los datos que nuestros investigadores recopilan y analizan proporcionan importantes respuestas hoy en día, pero así mismo tienen el potencial de poder resultar útiles meses o años más tarde cuando nuevas aplicaciones analíticas puedan extraer información desde las mismas secuencias de datos," afirma Fabbretti. "StorNext nos permite proporcionar un archivado rentable de larga duración para todos nuestros proyectos, sin importar el tiempo que dicho proyecto pueda durar."
Los archivos almacenados permanecen donde los investigadores esperan encontrarlos dentro del sistema de archivado, por tanto pueden acceder a ellos directamente y de manera muy fácil, sin ayuda.
"Si a los investigadores se les proporcionan las herramientas más adecuadas, éstos darán un gran impulso a sus investigaciones," expone Xenarios. "El almacenamiento por niveles de StorNext nos ayuda a guardar los datos de manera rápida, trasladarlos con la misma rapidez a un archivo y mantenerlos preparados para que los bioinformáticos puedan continuar su trabajo."
Protección automatizada para uno de los Datasets más importantes del mundo
"StorNext no solo nos ayuda para asegurarnos de que almacenamos los datos rápidamente, también hace que el archivado sea un proceso automatizado y rentable que nos ayude a cumplir nuestro papel de administradores de datos," comenta Fabbretti. "Siempre realizamos dos copias de los archivos en cinta, manteniendo una disponible en el archivo y la otra en una bóveda para proporcionar una capa de protección adicional frente a cualquier fallo de hardware o daño al sitio."
"Tratamos con uno de los datasets más importantes del mundo", explica Fabbretti. "StorNext nos ofrece una capacidad de archivado de multi-petabyte, una protección de datos de larga duración y la habilidad de lanzar versiones de los archivos, lo que resulta una parte crucial de esta estrategia."
La escalabilidad mantiene al SIB preparado para lo que pueda ocurrir
"StorNext ha prestado soporte a nuestro crecimiento durante más de seis años. Sabemos que podemos añadir más disco y capacidad cuando lo necesitemos. De hecho, hemos ido más allá de los datos genómicos para almacenar y proteger los datasets de investigaciones médicas genéricas. Para nosotros es importante que StorNext pueda incorporar de manera fácil nuevos niveles como por ejemplo, cloud o almacenamiento de objetos en nuestro almacenamiento de flujo de trabajo cuando resulte necesaria dicha ampliación."