Un equipo internacional de científicos donde participa el Instituto de Biología Molecular y Celular de Plantas, centro mixto del CSIC y la Universitat Politècnica de València (UPV), ha descubierto más de 130.000 nuevos virus de RNA, como el coronavirus SARS-CoV-2 que provoca la actual pandemia, a través de una nueva herramienta informática con la que se analizaron 5,7 millones de muestras biológicas recogidas a lo largo del planeta durante los últimos 15 años.

Este hallazgo, que se publica en la revista Nature, supone un incremento de hasta diez veces el número de especies virales de RNA descritas hasta la fecha. El conocimiento de la diversidad viral permitirá revelar los orígenes de patógenos emergentes, así como mejorar la vigilancia y mitigación de nuevas pandemias, resalta el Consejo Superior de Investigaciones Científicas.

En el proyecto, el equipo desarrolló Serratus, una infraestructura de computación en la nube (Amazon Web Services) que, utilizando un clúster de 22.500 procesadores informáticos, permitió búsquedas masivas de secuencias virales en los millones de gigabytes de datos de secuenciación disponibles en bases de datos públicas.

El análisis detallado de ciertas familias virales permitió el descubrimiento de más de 30 nuevas especies de coronavirus, incluyendo interesantes ejemplos en vertebrados acuáticos como peces y anfibios cuyos coronavirus presentaron un genoma segmentado en dos fragmentos, una característica descrita en otras familias de virus pero no detectada antes en ningún miembro de los coronavirus.

Virus en mamíferos e invertebrados

En el Instituto de Biología Molecular y Celular de Plantas de València utilizaron Serratus para el análisis del virus causante de la hepatitis D humana, un agente viral llamado Delta de tamaño genómico mínimo y origen desconocido. Esto permitió a Marcos de la Peña Rivero detectar virus similares en multitud de otros animales, incluyendo no solo mamíferos y otros vertebrados sino también invertebrados.

"Sorprendentemente, estos virus se encontraron también en muestras medioambientales recogidas en lagos y suelos de todo el mundo, cuyos huéspedes serían por el momento desconocidos", destaca el investigador del CSIC.

Es más, las muestras medioambientales con virus similares al de la hepatitis D revelaron la presencia de novedosas formas virales con genomas ultra-compactos y de tamaño ínfimo -solo 300 bases, las unidades químicas que forman el material genético-. Este descubrimiento permite avanzar una conexión evolutiva cercana entre virus tan distantes como la hepatitis D humana y los agentes subvirales de plantas llamados 'viroides'.

Tanto la base de datos de todos los virus obtenidos en este trabajo como el conjunto de las herramientas desarrolladas están disponibles de forma libre y abierta (https://www.serratus.io/).

Esta herramienta puede ser de gran utilidad para caracterizar la diversidad planetaria de todos los virus existentes y prepararse ante posibles nuevas pandemias, cuyas devastadoras consecuencias sufrimos con enfermedades virales emergentes como la COVID-19, causada por el coronavirus SARS-CoV-2.

El IBMCP es la única institución científica española que participa en este trabajo, donde colaboran el Instituto Heidelberg de Estudios Teóricos y el Instituto Max Planck de Bilogía (Alemania), el Instituto Pasteur (Francia), la Universidad de San Petersburgo (Rusia), la Universidad de California, Berkeley (EEUU) y la Universidad de British Columbia (Canadá), entre otros.