News

This is a translation in Japanese. You can also read the original English version.

Japanese-3rd-blog

April 07, 2021

COVID-19 HGI データフリーズバージョン5(2021年1月)時点での解析結果

英語版 2021/3/2

日本語翻訳 2021/3/17

著者:Minttu Martilla, Annika Faucon, Nirmal Vadgama, Shea Andrews, Brooke Wolford, and Kumar Veerapen (COVID-19 HGI を代表して)

日本語版翻訳者:王 青波、金井 仁弘、谷川 洋介、中西 智子

COVID-19ホストジェネティクスイニシアティブ(COVID-19 HGI)は、54カ国からの2000人以上の科学者からなるコンソーシアムで、互いに協力しながら、データやアイデアの共有、患者さんのリクルート、結果の共有を行っています。 私たちの研究デザインについては、最初のブログ記事をお読みください。私たちの研究はアップデートを繰り返しながら行われており、新しい結果はブログ記事やウェブサイトの結果ページにて要点をまとめています。最後に、この記事に書かれている専門用語で、よくわからない単語があれば、メール (hgi-faq@icda.bio) でご連絡ください――よりわかりやすい文章にするため、ここに書かれた情報をアップデートさせていただきます。今後、概念や用語を説明する追加情報を提供する予定です。それまでの間は、遺伝学の基礎をまとめた、こちらのリソース(訳注:リンク先は英語となります)をご参照ください。

データフリーズバージョン5に基づく、本研究についての論文草稿は、プレプリントサーバーmedRXiv にて公開されています

最新のデータ・フリーズ・バージョン5では、サンプルサイズが拡大し、報告された遺伝的発見の信頼性がさらに向上しました

私たち、COVID-19ホストジェネティクスイニシアティブ(COVID-19 HGI)では、これまでのリリースにおいて信頼性の高い遺伝的シグナルを報告してきました。また、私たちの研究は、これまで解析されたスタディ参加者数(200万人以上)と共同研究者(2,000人以上)の両面において、史上最大のゲノムワイド関連解析(genome-wide association study, GWAS [リンク先の図解は英語となります])となっています。今回のブログ記事では、最新の結果であるデータ・フリーズ・バージョン5の結果について説明します。私たちの前回のデータ・フリーズ・バージョン4では、COVID-19の重症化に相関を示すヒトゲノム上の遺伝的変異の同定について報告しました(前回までの結果であるデータ・フリーズ・バージョン3およびバージョン4に関して執筆された一般の方向けのブログ記事もあわせてご覧ください)。私たちの研究では、3万人以上のCOVID-19患者(すなわち症例)と147万人以上の患者ではない方々(すなわち対照例)を対象としたGWASにより、これらの遺伝的変異を同定しました。今回のデータ・フリーズ・バージョン5では、19カ国の47件の研究から得られたデータを組み合わせることで、サンプルサイズをさらに拡大し、約5万人のCOVID-19症例と200万人以上の対照例をもとに解析を行いました(図1)。サンプルサイズの増加にともない、私たちの統計的なデータ解析結果の信頼性もさらに向上しています。後述するように、今回のデータ・フリーズ・バージョン5では解析に用いられるサンプル集団の多様性を高めるように務めました。様々な遺伝的祖先に由来する多様な集団を解析することで、COVID-19の重症度に影響を与える遺伝的変異や、その世界的な影響をより深く理解することに役立ちます。今回の解析に参加・貢献した47件のスタディのうち、19件は非ヨーロッパ系の集団が含まれていました。

Figure 1: List of COVID-19 HGI contributors for data freeze release 5

図1:最新のデータ・フリーズ・バージョン5に参加・貢献した47件スタディの一覧。今回の解析に参加・貢献した47件のスタディ(これは、COVID-19 HGIに登録されたN=143件のスタディの約35%にあたります)のうち、19件は非ヨーロッパ系の集団が含まれていました。合計で210万件以上の遺伝的情報をもつサンプルが解析され、その中には49,562 件のCOVID-19 陽性の症例が含まれていました。図では、参加したスタディを、バイオバンク(Biobank)、臨床研究(Clinical studies)、そして消費者直販型(direct-to-consumer, 医療機関を介さずに提供される検査のこと)の遺伝的検査サービス会社(DTC companies)の3つのグループに分類し、スタディの名前と実施された国の略称を示しています。Dr. Andrea Gannaの発表 (2021年1月25日)をもとに改変。

COVID-19 HGI における研究デザイン

これまでに報告したデータ・フリーズと同様、私たちは次に挙げる3つの臨床的な結果に着目してCOVID-19の症例を定義し、それぞれについて解析を実施しました(図2):A) COVID-19の重症例(人工呼吸器などによる呼吸器系のサポートが必要になった、あるいはCOVID-19により死亡した),B) COVID-19により入院した症例、C) SARS-CoV-2への感染が確認された症例。これら3つの解析を行うことで、SARS-CoV-2とCOVID-19に対する感受性と重症度の両方について、相関をしめす遺伝的変異を同定することを目指しています。とくに、最後に述べた解析(解析C [Analysis C])では、SARS-CoV-2への感染報告に寄与する、遺伝的変異を検出することを目的としているため、症状の有無や重症度にかかわらず、すべての症例を解析対象に含めました。図2に、3つの解析それぞれに用いられた症例と対照群の定義とサンプル数を示します。

Figure 2: Definition of cases and controls for each of the analysis in data freeze 5.

図2:最新のデータ・フリーズ・バージョン5において実施された3つの解析それぞれについての症例と対照例の定義。今回のリリースに含まれる3つの解析(解析A, B, C, 図中の3つ列にそれぞれ対応)について、症例(cases, 上段)と対照例(controls, 下段)の定義と,症例数と対照例数(N)を示した。Dr. Andrea Gannaの発表 (2021年1月25日)をもとに改変。

COVID-19に関連する領域は自然免疫と肺機能不全との関係を示唆しました

共同研究者らによるゲノムデータの収集の後、我々は図2に示された症例と対照例の定義にしたがって、GWASを実施しました。以前のデータ・フリーズ ・バージョン4では、COVID-19への感染しやすさや重症度に関連する7つの染色体領域での関連を報告しました。これらの領域は、COVID-19の病因として自然免疫や肺機能不全との関わりを示唆しており、主要な臨床的見解と一致しています。今回のデータ・フリーズ・バージョン5では、我々は15の統計的有意な染色体領域を同定しました。このうち、1領域は、COVID-19の最重症例とのみ有意な関連を示しました(解析A)。10領域は重症度との関連が、感染しやすさとの関連よりも強い効果を示しました(解析B)。そして、4領域は感染しやすさとの関連のみが認められました(解析C)。図3では、これらの結果をマイアミ・プロット (Miami plot) として図示しています(マンハッタン・プロットを上下に並べた図で、マイアミの建物の輪郭が水面に反射する様子から名付けられました)。

Figure 3. Miami plot of genome-wide association results for COVID-19.

図3. COVID-19 GWAS結果のマイアミ・プロット. 上部パネルは、COVID-19による入院例と対照例のGWAS結果(解析B)を、下部パネルは報告されたSARS-CoV-2感染例と対照例のGWAS結果(解析B)を示しています。

サンプル多様性の果たす役割

多くの遺伝学研究において、収集するサンプルの多様性が課題となっています (より詳しくはこちらを参照)。それに従い我々も、研究規模が大きくなるにつれて収集するサンプルにおける多様性を高めることを目指しました(図4)。より多くのサンプルを集める中で、COVID-19に相関する新たな遺伝的要素を同定することが出来ました(今までの結果は第3回及び第4回データリリースの記事を参照)。我々の解析手法を用いてCOVID-19の遺伝的リスク要因を同定する一連の流れの中で、遺伝子上または近傍に位置する遺伝的変異を観測することが出来ました。現段階では、我々が同定した遺伝子の殆どが、細胞機能、免疫制御、そして心機能における異常のリスク上昇を示唆しています。これらのリスク要因を同定することで、最終的は同定された遺伝子をターゲットとする治療を可能にすることが期待されます。

Figure 4. Overview of the studies contributing to the COVID-19 host genetics initiative and composition by major ancestry groups in meta-analyses.

図4. COVID-19ホストジェネティクスイニシアティブ(COVID-19 HGI)に貢献している研究の概観、及び、メタアナリシスにおける主な遺伝的祖先集団の比較. データフリーズ5においては、ヨーロッパ人以外の集団から19の研究グループが貢献しました。その内訳は、アフリカンアメリカン:7:5、遺伝的に複数の祖先を持つアメリカ人の集団:5、東アジア人集団:4、南アジア人集団:2、及びアラビア人集団:1となっています。 ダイヤモンド型はそれぞれの地域における有効サンプルサイズ(近親関係の影響などを補正した、統計処理を行う際の実質的に有効なサンプルサイズ)を示す。

今回同定された、COVID-19リスクと相関する新たに9つのゲノム領域に関して

重症患者を解析した解析Aでは、二つの遺伝子の近傍領域が同定されました: 3番染色体に位置するLZTFL1及び、17番染色体に位置するTAC4です。LZTFL1タンパク質は、線毛表面へのタンパク質の輸送を制御しています。線毛とは、細胞表面にのびる毛のような構造であり、気道、肺やその他多くの器官で存在します。また、LZTFL1は免疫反応にも関わっています。TAC4タンパク質は、血圧や免疫系を制御する機能があります。

入院患者を解析した解析Bでは、四つの遺伝子領域が同定されました。一つ目は、1番染色体に位置するTHBS3上のゲノム領域です。この遺伝子は、心臓で発現し、心疾患に伴い発現量が増加するTHBS3タンパク質をコードしています。二つ目は、2番染色体に位置するSCN1A上のゲノム領域です。SCN1A遺伝子上のゲノム変異はてんかんや痙攣発作を起こす原因となることが知られています。三つ目に、我々は TMEM65上のゲノム領域を同定しました。この遺伝子は心臓の発達、心臓伝導系や心機能の制御などに役割を持つTMEM65遺伝子をコードすることが知られています。また、細胞エネルギー代謝に関連する機能ももつかも知れないとされています。注目すべきことに、我々が今回同定したTMEM65上のゲノム変異は、東アジア人集団では12%の頻度を持つのに対してヨーロッパ人集団では頻度は1%です。四つ目は、17番染色体に位置するKANSL1上のゲノム領域です。この遺伝子によりコードされるKANSL1タンパク質は、脳神経機能に関連する役割を持っていることが示唆されています。

最後に、SARS-CoV-2感染報告の有無を解析した解析Cでは、3番染色体に位置するZBTB11、5番染色体に位置するDNAH5、そして19番染色体に位置するPPP1R15A遺伝子上や近傍領域三ヶ所で相関が見られました。一つ目は、3番染色体に位置するZBTB11近傍のゲノム領域です。この遺伝子は免疫細胞の発達を制御すると示されているZBTB11タンパク質をコードします。二つ目は、5番染色体に位置するDNAH5上のゲノム領域です。DNAH5上のゲノム変異は、原発性線毛運動不全症、再発性胸部感染症につながる線毛の運動機能不全、耳鼻咽頭の症状、気管支炎や不妊の原因となりうることが示されています。三つ目に、19番染色体に位置するPPP1R15A遺伝子上のゲノム領域です。この遺伝子はDNA損傷応答としての細胞増殖停止や細胞死、負の成長シグナル、そしてタンパク質構造の異常に関わる機能を持つことが示されているPPP1R15Aタンパク質をコードします。

我々の一連の解析では、免疫系に影響する複数の遺伝子がCOVID-19に関して重要な役割を持つことが示唆されました。心肺機能や脳神経プロセスに関わる遺伝子も発見に含まれました。心疾患は、COVID-19感染、及びCOVID-19の引き起こす症状の一つとされる脳神経系の症状のリスク要因として過去に報告されています。

相関と因果の違い

観察研究で特定された危険因子は、COVID-19の感受性または重症度との相関があるだけで因果関係を認めない可能性があります。そのため、ゲノム情報を使用して因果関係を推測するメンデルランダム化(Mendelian randomization: MR)と呼ばれる手法を採用しました。 MRは、特定の曝露(BMIなど)に影響を与えることが知られている遺伝的変異を使用して、結果に対する曝露の因果関係を調べる方法です。詳細については、最近のブログ投稿(科学者向け)を参照ください。今回調べた38個のうち6つの因子が、統計的に有意に3つのCOVID-19の病態の原因になると推定しました。遺伝的に予測された肥満(高いBMI)は、SARS-CoV-2の感染およびCOVID-19による入院のリスクの増加に関連してることがわかり、これは 観察研究による知見を裏付けることになりました。さらに、遺伝的に予測された喫煙は、COVID-19による入院のリスクの増加に関連していました。

Figure 5: Genetic correlations and Mendelian randomization causal estimates between 43 traits and COVID-19 severity and SARS-CoV-2 reported infection.

図5:38個の因子とCOVID-19の重症度およびSARS-CoV-2感染との間の遺伝的相関およびメンデルランダム化による因果推定。X軸に38個の因子が、Y軸に3つのCOVID-19の表現型が記載されています。青は負の遺伝的相関と保護的因果推定を表し、赤は正の遺伝的相関とリスク因果推定を表します。正方形の大きさは統計学的有意性に対応します。統計的有意性の閾値を超える結果には、アスタリスクが付いています。

COVID-19発症に関わる遺伝的特徴の解明を目指した国際協力

COVID-19パンデミックによる世界的な危機において、本研究は、世界各国の合計47コホートの貢献によって成し得た成果です。本研究ではCOVID-19の感受性と重症度に関連する15のゲノム領域を同定しました。統計的推論(メンデルランダム化解析など)を利用して、8つの形質がCOVID-19の感受性と重症度の原因となっていることが推定できました。現在、この結果を学術論文に投稿中です。COVID-19の世界的大流行を乗り越えていく中で、COVID-19HGIは繰り返し最新の遺伝的知見を生み出します。COVID-19の生物学的要因と臨床症状をよりよく理解するために、国際協力をすることでより確固たる結果を生み出すことを目指します。

謝辞

本文について有益な助言をいただいたAndrea Ganna先生 (PhD)に深謝を申し上げます。