News

This is a translation in Catalan. You can also read the original English version.

Catalan-3rd-blog

April 07, 2021

Resultats COVID-19 HGI pel Data Freeze 5 (gener 2021)

2 de març de 2021

Escrit per Minttu Martilla, Annika Faucon, Nirmal Vadgama, Shea Andrews, Brooke Wolford i Kumar Veerapen en nom del COVID-19 HGI.

Traduit per Jordi Pérez Tur, Israel Fernández.

Nota: La COVID-19 Host Genetics Initiative (HGI) representa un consorci de més de 2000 científics de més de 54 països que treballen en col·laboració per compartir dades, idees, reclutar pacients i difondre els nostres resultats. Per obtenir informació sobre el disseny del nostre estudi, llegiu la nostra entrada inicial al bloc. La nostra investigació és iterativa i resumim els nostres nous resultats a través de publicacions al bloc i a la secció de resultats del nostre lloc web. Finalment, si algun vocabulari aquí no és familiar, envieu-nos un correu electrònic a hgi-faq@icda.bio. Estarem encantats d’actualitzar la informació per proporcionar més claredat. En les properes setmanes, es proporcionarà informació addicional que explique conceptes o terminologia. Mentrestant, mireu aquest recurs per revisar els fonaments de la genètica.

La darrera congelació de dades (versió 5) augmenta la mida de la mostra i la solidesa de les troballes genètiques

El COVID-19 HGI ha mostrat iterativament senyals genètics robustos en les nostres versions anteriors i representa l’estudi d’associació del genoma complet (GWAS) més gran de la història: tant en termes de participants a l’estudi (> 2 milions d’individus) com de nombre de col·laboradors (> 2.000 científics) ). Aquí descrivim els resultats de la nostra última versió de congelació de dades (data freeze) 5. En la nostra anterior congelació de dades (versió 4), vam informar de la identificació de variants genètiques humanes associades a COVID-19 sever (vegeu les entrades del nostre blog per a no científics sobre la versió 3 i la versió 4 de les dades). Vam identificar aquestes variants mitjançant un GWAS en més de 30.000 pacients COVID-19 (és a dir, casos) i 1,47 milions d’individus que no eren COVID-19 (és a dir, controls). A la congelació de dades 5, hem augmentat encara més la mida de la mostra fins a gairebé 50.000 casos de COVID-19 i més de 2 milions de controls combinant dades de 47 estudis de 19 països (Figura 1). En augmentar la mida de la mostra, també estem millorant la confiança de les nostres troballes. En esta congelació de dades, també vam intentar millorar la diversitat de poblacions. L’estudi de la genètica a través de poblacions de ancestres genètics diversos ens ajuda a comprendre millor les variants genètiques que afecten la gravetat del COVID-19 i el seu impacte a tot el món. Dels 47 estudis que van contribuir, 19 van incloure poblacions no europees.

Figura 1: Llista de col·laboradors de COVID-19 HGI per a la congelació de dades 5. Dels 47 estudis que van contribuir, 19 van incloure poblacions no europees. Adaptat de la presentació d’Andrea Ganna el 25 de gener de 2021.

Estructura d’estudi

Com a ocasions anteriors, es continua examinant tres resultats (Figura 2): A) Malaltia crítica amb COVID-19 (acabar amb suport respiratori o morir de COVID-19), B) Estar hospitalitzat per COVID-19 i C ) Estar infectat amb SARS-CoV-2. Aquestes anàlisis tenen com a objectiu captar les característiques genètiques associades tant a la susceptibilitat com a la gravetat al SARS-CoV-2 i al COVID-19. L'última anàlisi (Anàlisi C) tenia com a objectiu detectar variants genètiques que contribuïen a la infecció reportada de SARS-CoV-2. Esta anàlisi va incloure tots els casos, independentment de la presència o gravetat dels símptomes. Els resultats de l’anàlisi i les seves definicions de casos i controls i les mides de les mostres es mostren a la figura 2.

Figura 2: Definició de casos i controls per a cadascuna de les anàlisis en congelació de dades 5. Tingueu en compte que el SARS-CoV-2 és el virus que causa la infecció per COVID-19. Adaptat de la presentació d’Andrea Ganna el 25 de gener de 2021.

Les regions del genoma associades a COVID-19 apunten cap a la immunitat innata i la disfunció pulmonar

En recollir les dades genètiques produïdes pels nostres col·laboradors, vam realitzar GWAS segons les definicions de la figura 2. Anteriorment, a la congelació de dades 4, vam destacar nous senyals genètics en susceptibilitat i gravetat de COVID-19 en 7 regions cromosòmiques. Aquestes regions apunten cap a una etiologia en la immunitat innata i la disfunció pulmonar: en línia amb la comprensió clínica més acceptada de les infeccions per COVID-19. A la congelació de dades 5, es van identificar 15 regions significatives a tot el genoma: 1 regió cromosòmica només va tenir significació a tot el genoma en l'anàlisi de malaltia crítica (anàlisi A); 11 regions cromosòmiques tenen un efecte més alt en l'anàlisi de gravetat que en l'anàlisi d'informació de la infecció (anàlisi B); i 4 d'aquestes regions cromosòmiques són específiques de la infecció notificada per SARS-CoV-2 (anàlisi C). A la figura 3, presentem una representació gràfica d’aquests resultats com un gràfic de Miami (una versió en panells d’un gràfic de Manhattan. El seu nom es diu Miami perquè l’horitzó de Miami es reflecteix a l’aigua).

Figura 3. Gràfic de Miami dels resultats de l'associació a tot el genoma per a COVID-19. El panell superior mostra els resultats de l’estudi d’associació de genoma complet per malalts COVID-19 hospitalitzats i els controls (anàlisi A) i el panell inferior els resultats de la infecció i controls de SARS-CoV-2 (anàlisi C).

El paper de la diversitat.

Entenem que amb molts estudis genètics, la diversitat en la recollida de mostres és una de les preocupacions principals (elaborat aquí). Per eixe motiu, nosaltres preteníem millorar la diversitat de la nostra col·lecció de mostres a mesura que creixia el nostre estudi (figura 4). El nostre esforç de recollida de mostres orientat ens ha portat a identificar nous factors genètics associats a COVID-19 (els nostres resultats anteriors es discuteixen a les publicacions del bloc a la versió 3 i versió 4). Amb la identificació concomitant de factors de risc genètics mitjançant els nostres mètodes analítics, podem observar variants genètiques dins o prop dels gens. Fins ara, la majoria dels gens que vam identificar apunten cap a un augment del risc en mecanismes cel·lulars, la regulació immune i la funció cardíaca. La identificació d’aquests factors de risc pot conduir en última instància a orientar els tractaments cap alguns dels gens identificats.

Figura 4. Visió general dels estudis que contribueixen al COVID-19-Host Genetics Initiative i composició pels principals grups d’ascendència al metaanàlisis. En la congelació de dades 5, 19 estudis van contribuir amb poblacions no europees: 7 afroamericans, 5 americans barrejats, 4 asiàtics orientals, 2 asiàtics del sud i 1 àrab. Els diamants mostren la mida efectiva de la mostra (mida de la mostra que tindrà un efecte estadísticament significatiu en termes científics) rebuda de diferents ubicacions geogràfiques.

Hem trobat 9 regions cromosòmiques noves associades a COVID-19. A l'anàlisi A, per a malaltia crítica, inclouen regions cromosòmiques properes a dos gens: LZTFL1 al cromosoma 3 i TAC4 al cromosoma 17. La proteïna LZTFL1 regula el tràfic de proteïnes a la membrana ciliar. Els cilis són estructures semblants als cabells que s’estenen des del cos cel·lular. Es troben a les vies respiratòries, als pulmons i a molts altres òrgans. LZTFL1 també participa en les respostes immunes. La proteïna TAC4 funciona per regular la pressió arterial i el sistema immunitari.

Per a l’anàlisi B, en pacients hospitalitzats amb COVID-19, hem trobat associacions en variants properes a 4 gens. En primer lloc, vam identificar una regió cromosòmica a THBS3 en el cromosoma 1. Aquest gen codifica la proteïna THBS3 que s’expressa al cor i que es regula a l'alça durant les malalties cardíaques. En segon lloc, es va identificar una regió cromosòmica a SCN1A al cromosoma 2. S'ha demostrat que les variacions del gen SCN1A causen epilèpsia i convulsions. En tercer lloc, vam identificar una regió cromosòmica a TMEM65 al cromosoma 8. Aquest gen codifica la proteïna TMEM65 que té un paper en el desenvolupament cardíac, la regulació de la conducció i la funció cardíaca. També pot tenir un paper en el metabolisme energètic cel·lular. Cal destacar que la variant identificada a la nostra anàlisi per a TMEM65 té una freqüència del 12% a l’Àsia Oriental i de l’1% a la població europea. Les freqüències d’al·lels descriuen la quantitat de variació d’un determinat gen o regió genòmica. Finalment, vam identificar una regió cromosòmica a KANSL1 al cromosoma 17. S'ha suggerit que la proteïna codificada per aquest gen, KANSL1, té un paper en els processos neuronals.

Finalment, a l’anàlisi C, per a les infeccions reportades per SARS-CoV-2, es van trobar 3 associacions noves a les regions properes als gens, ZBTB11 al cromosoma 3, DNAH5 al cromosoma 5 i PPP1R15A al cromosoma 19. En primer lloc, vam identificar una regió per el gen ZBTB11al cromosoma 3. Aquest gen codifica la proteïna ZBTB11 que s'ha demostrat que regula el desenvolupament de les cèl·lules immunes. En segon lloc, es va identificar una regió cromosòmica a DNAH5 al cromosoma 5. S’ha demostrat que les variacions genètiques de DNAH5 causen discinesia ciliar primària, moviment defectuós dels cilis, que provoca infeccions toràciques recurrents, símptomes de l’oïda / nas / gola, bronquitis i infertilitat. Finalment, vam identificar una regió cromosòmica propera a PPP1R15A al cromosoma 19. Aquest gen codifica per a la proteïna PPP1R15A que s’ha demostrat que media la detenció del creixement i la mort cel·lular en resposta a danys en l’ADN, senyals de creixement negatius i una estructura proteica incorrecta.

Segons els nostres anàlisis, els gens que afecten el sistema immunitari tenen un paper important en el COVID-19. També hem trobat implicats gens coneguts per afectar la funció pulmonar i cardíaca i els processos neuronals. Ja s’havia descrit que les malalties cardíaques eren un factor de susceptibilitat front al COVID-19 i igualment, s’han descrit símptomes neuronals com a part de la COVID-19.

Correlació no significa causalitat

Els factors de risc identificats en estudis d’associació poden no assenyalar una base causal de la susceptibilitat o gravetat del COVID-19. Com a tal, vam emprar un mètode anomenat aleatorització mendeliana (RM) que utilitza informació genòmica per inferir associacions causals. L’RM és un mètode que utilitza variants genètiques conegudes per influir en una exposició determinada (per exemple, l’IMC) per examinar l’efecte causal d’una exposició sobre els resultats de la malaltia. Per a una visió més detallada, vam descriure l’RM en una publicació recent del bloc (dirigida a una audiència científica). A través dels tres fenotips de COVID-19, vam identificar associacions causals estadísticament significatives entre els tres resultats de COVID-19 i 6 trets (de 38 trets seleccionats que vam provar, figura 4). Vam trobar que un índex de massa corporal (IMC) predit genèticament es va associar amb un major risc d’infecció per SARS-CoV-2 i hospitalització per COVID-19. Aquest resultat corrobora els resultats dels estudis observacionals, que han informat d’un augment del risc de resultats greus de COVID-19 associats amb un augment de l’IMC. A més, el tabaquisme predit genèticament es va associar amb un major risc d’hospitalització per COVID-19.

Figura 5: Correlacions genètiques i estimacions causals d’aleatorització mendeliana entre 43 trets i gravetat del COVID-19 i infecció reportada pel SARS-CoV-2. Els trets s’enumeren a l’eix X i els fenotips COVID-19 a l’eix Y. El blau representa correlacions genètiques negatives i estimacions causals de l’aleatorització mendeliana (MR) de protecció i el vermell representa correlacions genètiques positives i estimacions de causalitat de risc de MR. Els quadrats més grans corresponen a una correlació més significativa. Les estimacions causals que superen un llindar de significació estadística es marquen amb asterisc.

Un esforç de col·laboració global per entendre la genètica de l’hoste COVID-19

En l'actual crisi mundial de la pandèmia COVID-19, aquests resultats demostren el poder d'un esforç global de 47 contribuents diversos. En total, vam identificar 15 regions genòmiques associades a la susceptibilitat i gravetat del COVID-19. Per interrogar encara més la causalitat d’aquestes regions, hem utilitzat inferència estadística (és a dir, aleatorització mendeliana) per identificar 8 trets amb causalitat estadísticament significativa amb aquests senyals GWAS COVID-19. Actualment, estem ultimant els nostres resultats en un article científic. Mentre continuem combatent la pandèmia mundial COVID-19, el COVID-19 HGI produirà resultats genètics de manera iterativa. Treballant junts, podem generar troballes robustes necessàries per entendre millor els factors biològics i la presentació clínica del COVID-19.

Agraïments

Gràcies al Dr. Andrea Ganna, pels seus comentaris reflexius.