Una nueva herramienta informática saca a la luz 130.000 virus desconocidos
El análisis detallado de ciertas familias virales permitió el descubrimiento de más de 30 nuevas especies de coronavirus
Los virus son el conjunto de agentes biológicos más numeroso que se conoce. Ahora, un equipo internacional de científicos con participación española ha descubierto más de 130.000 nuevos virus de ARN a través de una nueva herramienta informática.
Con ella se analizaron 5,7 millones de muestras biológicas recogidas a lo largo del planeta durante los últimos 15 años; el hallazgo, que se publica en la revista Nature, supone un incremento de hasta 10 veces el número de especies virales de ARN descritas hasta la fecha.
Para este análisis, el equipo multidisciplinar desarrolló Serratus, una infraestructura de computación en la nube (Amazon Web Services) que, usando un clúster de 22.500 procesadores informáticos, permitió búsquedas masivas de secuencias virales en los millones de gigabytes de datos de secuenciación disponibles en bases de datos públicas.
El análisis detallado de ciertas familias virales permitió el descubrimiento de más de 30 nuevas especies de coronavirus, incluyendo interesantes ejemplos en vertebrados acuáticos como peces y anfibios cuyos coronavirus presentaron un genoma segmentado en dos fragmentos, una característica descrita en otras familias de virus pero no detectada antes en ningún miembro de los coronavirus.
En el Instituto de Biología Molecular y Celular de Plantas de Valencia (IBMCP) utilizaron Serratus para el análisis del virus causante de la hepatitis D humana, un agente viral llamado Delta, de tamaño genómico mínimo y origen desconocido.
Esto permitió al investigador del CSIC en IBMCP Marcos de la Peña Rivero detectar virus similares en multitud de otros animales, incluyendo no sólo mamíferos y otros vertebrados, sino también invertebrados.
«Sorprendentemente estos virus se encontraron también en muestras medioambientales recogidas en lagos y suelos de todo el mundo, y cuyos huéspedes serían por el momento desconocidos», detalla De la Peña.
Las muestras medioambientales con virus similares al de la hepatitis D revelaron la presencia de novedosas formas virales con genomas ultra-compactos y de tamaño ínfimo.
Tanto la base de datos de todos los virus obtenidos en este trabajo como el conjunto de las herramientas desarrolladas están disponibles de forma libre y abierta (www.serratus.io).
Esta herramienta puede ser de gran utilidad para caracterizar la diversidad planetaria de todos los virus existentes y prepararse ante posibles nuevas pandemias, cuyas devastadoras consecuencias sufrimos con enfermedades virales emergentes como la covid-19, causada por el coronavirus SARS-CoV-2, señala el CSIC en un comunicado.
El IBMCP, centro mixto del CSIC y la Universidad Politécnica de Valencia, es la única institución científica española que participa en el trabajo, donde colaboran, entre otros, el Instituto Heidelberg de Estudios Teóricos y el Instituto Max Planck de Bilogía (Alemania); el Instituto Pasteur (Francia); y la Universidad de California (Estados Unidos).