Investigadores del Instituto Tecnológico de Massachusetts (MIT, Estados Unidos) han generado el mapa genético más preciso y completo del genoma del SARS-CoV-2, el virus que causa la COVID-19. En su estudio, publicado este martes en la revista ‘Nature Communications’, confirmaron varios genes codificadores de proteínas y descubrieron que otros pocos que se habían sugerido como genes no codifican ninguna proteína.
«Pudimos utilizar este potente enfoque de genómica comparativa de firmas evolutivas para descubrir el verdadero contenido funcional de codificación de proteínas de este genoma de enorme importancia», afirma Manolis Kellis, autor principal del estudio y profesor de ciencias de la computación en el Laboratorio de Ciencias de la Computación e Inteligencia Artificial del MIT.
Mutaciones
El equipo de investigación también analizó cerca de 2,000 mutaciones que han surgido en diferentes aislados de SARS-CoV-2 desde que empezó a infectar a los humanos, lo que les permitió calificar la importancia que pueden tener esas mutaciones para cambiar la capacidad del virus de evadir el sistema inmunitario o volverse más infeccioso.
El genoma del SARS-CoV-2 consta de casi 30,000 bases de ARN. Los científicos han identificado varias regiones que se sabe que codifican genes de proteínas, basándose en su similitud con genes de proteínas encontrados en virus relacionados. Se sospechaba que algunas otras regiones codificaban proteínas, pero no se habían clasificado definitivamente como genes codificadores de proteínas.
Genómica comparativa
Para determinar qué partes del genoma del SARS-CoV-2 contienen realmente genes, los investigadores realizaron un tipo de estudio conocido como genómica comparativa, en el que se comparan los genomas de virus similares. El SARS-CoV-2 pertenece a un subgénero de virus llamado Sarbecovirus, la mayoría de los cuales infectan a los murciélagos. Los investigadores realizaron su análisis con el SARS-CoV-2, el SARS-CoV (que causó el brote de SARS de 2003) y 42 cepas de sarbecovirus de murciélagos.
- Los investigadores confirmaron seis genes codificadores de proteínas en el genoma del SARS-CoV-2
- además de los cinco que están bien establecidos en todos los coronavirus.
- También determinaron que la región que codifica un gen llamado ORF3a también codifica un gen adicional, al que denominan ORF3c.
Este gen tiene bases de ARN que se solapan con el ORF3a, pero se encuentran en un marco de lectura diferente. Este gen dentro de un gen es raro en los genomas grandes, pero común en muchos virus, cuyos genomas están bajo presión selectiva para mantenerse compactos. Todavía se desconoce la función de este nuevo gen, así como de otros genes del SARS-CoV-2.
Proteínas funcionales
Los investigadores también demostraron que otras cinco regiones que se habían propuesto como posibles genes no codifican proteínas funcionales, y también descartaron la posibilidad de que haya más genes codificadores de proteínas conservadas aún por descubrir.
«Analizamos todo el genoma y estamos muy seguros de que no hay más genes conservados codificadores de proteínas. Se necesitan estudios experimentales para averiguar las funciones de los genes no caracterizados, y al determinar cuáles son reales, permitimos que otros investigadores centren su atención en esos genes en lugar de dedicar su tiempo a algo que ni siquiera se traduce en proteínas», destaca otro de los autores, Irwin Jungreis.
Rápida evolución
En este nuevo estudio, los investigadores también analizaron más de 1,800 mutaciones que han surgido en el SARS-CoV-2 desde que se identificó por primera vez. Para cada gen, compararon la rapidez con la que ese gen en particular había evolucionado en el pasado con la que lo ha hecho desde que comenzó la pandemia actual.
Descubrieron que, en la mayoría de los casos, los genes que evolucionaron rápidamente durante largos periodos antes de la pandemia actual han seguido haciéndolo, y los que tendían a evolucionar lentamente han mantenido esa tendencia. Sin embargo, los investigadores también identificaron excepciones a estos patrones, que pueden arrojar luz sobre cómo ha evolucionado el virus a medida que se ha adaptado a su nuevo huésped humano.
Sistema inmunitario
En un ejemplo, los investigadores identificaron una región de la proteína de la nucleocápside, que rodea el material genético del virus, que presentaba muchas más mutaciones de las esperadas por sus patrones históricos de evolución. Esta región de la proteína también está clasificada como objetivo de las células B humanas. Por tanto, las mutaciones en esa región pueden ayudar al virus a evadir el sistema inmunitario humano.
«La región más acelerada de todo el genoma del SARS-CoV-2 se encuentra justo en medio de esta proteína de la nucleocápside. Especulamos que las variantes que no mutan esa región son reconocidas por el sistema inmunitario humano y eliminadas, mientras que las variantes que acumulan mutaciones al azar en esa región son, de hecho, más capaces de evadir el sistema inmunitario humano y permanecer en circulación», apuntan.
- Los investigadores también analizaron las mutaciones que han surgido en variantes preocupantes, como la cepa B.1.1.7 de Inglaterra
- la cepa P.1 de Brasil y la cepa B.1.351 de Sudáfrica.
- Muchas de las mutaciones que hacen que esas variantes sean más peligrosas se encuentran en la proteína de la espiga, y ayudan al virus a propagarse más rápidamente y a evitar el sistema inmunitario.
- Sin embargo, cada una de esas variantes lleva también otras mutaciones.
«Cada una de esas variantes tiene más de 20 mutaciones más, y es importante saber cuáles de ellas pueden hacer algo y cuáles no. Así que utilizamos nuestras pruebas de genómica comparativa para obtener una primera conjetura sobre cuáles de ellas es probable que sean importantes, basándonos en cuáles estaban en posiciones conservadas», remacha Jungreis.