DESCUBRIMIENTO DE MÁS DE 100 000 VIRUS RNA GRACIAS A UNA NUEVA HERRAMIENTA INFORMÁTICA

Actualizado 1 de febrero, 2022

Un equipo internacional de científicos con la participación del Instituto de Biología Molecular y Celular de Plantas (IBMCP), centro mixto de la Universitat Politècnica de València (UPV) y el Consejo Superior de Investigaciones Científicas (CSIC), ha dado un paso importante hacia la comprensión de su diversidad. Es así que este equipo ha descubierto más de 130 000 nuevos virus ARN mediante una nueva herramienta informática que ha analizado 5.7 millones de muestras biológicas recogidas en todo el mundo durante los últimos 15 años. Para llevar a cabo este análisis, el equipo multidisciplinario desarrolló Serratus, una infraestructura de computación en la nube (Amazon Web Services, AWS) que, utilizando un clúster de 22 500 procesadores de computadora (CPU), permitió búsquedas masivas de secuencias virales en millones de datos de secuenciación disponibles en bases de datos públicas. Esa información es equivalente a 10.2 patabytes (1 petabyte= 10^15 bytes).

El análisis de familias virales condujo al descubrimiento de más de 30 nuevas especies de coronavirus, incluidos ejemplos en peces y anfibios cuyos coronavirus tenían un genoma segmentado en dos fragmentos, una característica que se ha descrito en otras familias de virus pero no se había detectado previamente en ningún coronavirus.

En el Instituto de Biología Molecular y Celular de Plantas, LOS científicos utilizaron la herramienta denominada Serratus para analizar el virus que causa la hepatitis D humana, un agente viral denominado Delta, de tamaño genómico mínimo y origen desconocido. Esto permitió detectar virus similares en multitud de otros animales, incluidos no solo mamíferos y otros vertebrados sino también invertebrados en muestras ambientales recolectadas de lagos y suelos de todo el mundo.

Además, muestras ambientales con virus similares a la hepatitis D revelaron la presencia de formas virales novedosas con genomas ultracompactos de tamaño diminuto (300 bases). Los hallazgos permiten avanzar en el conocimiento de la conexión evolutiva entre virus como el de la hepatitis D humana y los viroides vegetales.

Este hallazgo, publicado en la revista Nature, representa un aumento de diez veces en el número de especies de ARN viral descritas hasta la fecha.

Edgar RC, Taylor J, Lin V, Altman T et al. Petabase-scale sequence alignment catalyses viral discovery. Nature 2022; 602:142-7.