AlphaFoldに続き、DeepMindが新たな「大技」を披露:AlphaGenomeが疾患の根源に迫る

Googleは本日、2つの主要なブレークスルーを同時に発表しました。一つはClaude CodeとCursorに対抗するオープンソースプログラミングツール「Gemini CLI」、もう一つは遺伝子変異を正確に予測するために特化された「AlphaGenome」です。

Google DeepMindは、AlphaGenomeという新しい人工知能(AI)モデルの発表を行いました。このモデルは、DNA配列の微細な変化が複雑な遺伝子制御プロセスにどのように影響するかを予測することで、ゲノムをより深く、より正確に理解することを目指しており、疾患研究、遺伝子治療、そして基礎生命科学に新たな可能性を切り開きます。現在、AlphaGenomeはAPIを通じて非営利の研究分野に公開されています。

画像

ゲノムは、生物の成長、発達、機能、繁殖を指示する究極の「細胞取扱説明書」です。このDNAで構成された「説明書」の中の微細な変化、すなわち遺伝子変異は、私たちの環境への反応に深く影響を及ぼし、特定の疾患への感受性を決定することさえあります。しかし、ゲノムの指示が分子レベルでどのように読み取られるかの全過程、そして微細なDNA変異がどのような連鎖反応を引き起こすかは、今日に至るまで生物学における最大の謎の一つです。

この課題を克服するため、Google DeepMindは新しいAIツールであるAlphaGenomeを導入しました。これは、ヒトDNA配列における単一の変異や突然変異が、広範な遺伝子制御生物学的プロセスにどのように影響するかを、より包括的かつ正確に予測できます。この突破は、モデルアーキテクチャの技術進歩によるもので、超長DNA配列を処理し、高解像度の予測を出力することを可能にしました。

DeepMindは、AlphaGenomeが科学界にとって重要なリソースとなり、科学者がゲノム機能、疾患生物学をよりよく理解し、最終的に新たな生物学的発見や新治療法の開発を推進すると信じています。

AlphaGenomeの動作原理

AlphaGenomeの核となるワークフローは、最長100万塩基対のDNA配列を入力として受け取り、その制御活性を表す数千の分子特性を予測することです。同時に、変異配列と元の配列の予測結果を比較することで、特定の遺伝子変異や突然変異がもたらす影響を評価することもできます。

その予測する特性は非常に広範であり、以下を含みます。

  • 異なる細胞や組織における遺伝子の開始および終了位置。
  • RNAのスプライシング方法。
  • RNAの生成量。
  • DNA塩基のアクセス可能性、空間的近接性、および特定のタンパク質との結合。

これらの機能を実現するため、AlphaGenomeはENCODEGTEx4D NucleomeFANTOM5などの大規模な公共データベースからの膨大な実験データで訓練されました。これらのデータは、数百種類の人およびマウスの細胞と組織における重要な遺伝子制御パターンをカバーしています。

技術アーキテクチャに関しては、AlphaGenomeは畳み込み層を利用してゲノム配列中の短いパターンを初期的に検出し、その後Transformerモデルを用いて配列上のすべての位置からの情報を統合し、最終的に一連の出力層を通じてこれらのパターンを異なる分子特性に対する具体的な予測に変換します。

特筆すべきは、このモデルがDeepMindの以前のゲノム学モデルであるEnformerに基づいて構築されており、タンパク質コード領域(ゲノムのわずか2%を占める)の変異の影響解釈に特化したAlphaMissenseと完全に補完し合うことです。一方、AlphaGenomeはゲノムの98%を占める広大な非コード領域の解釈に焦点を当てており、これらの領域は遺伝子活動の制御に不可欠であり、疾患関連の変異を多数含んでいます。

AlphaGenomeの4つのユニークな利点

既存のDNA配列モデルと比較して、AlphaGenomeはいくつかの顕著な特徴を示します。

  1. 長配列コンテキストと高解像度: モデルは最大100万DNA塩基対の配列を分析し、単一塩基の解像度で予測できます。これは遠隔の遺伝子制御要素や微細な生物学的詳細を捉える上で極めて重要です。これまでのモデルが配列長と解像度の間でトレードオフを強いられていたのと異なり、AlphaGenomeは訓練コストを大幅に増やすことなく(訓練時間はわずか4時間、計算予算は元のEnformerモデルの半分)、両者を統一しました。
  2. 包括的な多モーダル予測: 長配列の高解像度予測を可能にすることで、AlphaGenomeは最も多様な分子特性を同時に予測でき、科学者に対して遺伝子制御の複雑なステップに関するより包括的な情報を提供します。
  3. 効率的な変異スコアリング: モデルは、遺伝子変異が関連するすべての分子特性に与える影響を1秒以内に効率的に評価できます。これは、変異前後の予測差異を比較することによって実現され、異なる特性に対する効率的な差異要約方法を提供します。
  4. 新しいスプライス点モデリング: 多くの希少遺伝病(脊髄性筋萎縮症など)はRNAスプライシングエラーによって引き起こされます。AlphaGenomeは、DNA配列から直接スプライス点の位置と発現レベルを明確にモデル化できる初の試みであり、遺伝子変異がRNAスプライシングにどのように影響するかについてより深い洞察を提供します。

複数のベンチマークテストにおいて、AlphaGenomeは業界最高水準(State-of-the-art)の性能を示しました。DNA配列機能の予測であろうと、変異影響の評価であろうと、ほとんどの評価で現在の最適な専用モデルを上回るか同等の性能を発揮し、その強力な汎用性を十分に示しています。

画像

図:AlphaGenomeが、特定のDNA配列タスクと変異効果タスクにおいて、既存の最良手法と比較して達成した性能向上率。

研究の可能性

AlphaGenomeの汎用性は、強力な研究ツールとなり、複数の分野で重要な役割を果たすことが期待されます。

疾患の理解: 遺伝子変異の機能的影響をより正確に予測することで、研究者が疾患の潜在的な原因を特定し、特定の形質に関連する変異をよりよく説明し、さらには新しい治療標的を発見するのに役立ちます。特に、効果が大きい希少なメンデル遺伝病の研究に適しています。

合成生物学: その予測能力は、特定の制御機能を持つ合成DNAの設計を指導するために利用できます。例えば、神経細胞でのみ特定の遺伝子を活性化し、筋肉細胞では沈黙を保つDNA配列を設計するなど。

基礎研究: ゲノムに対する私たちの理解を加速させ、重要な機能要素のマップ作成を助け、特定の細胞タイプ機能の制御におけるそれらの正確な役割を定義するのに役立ちます。

現在の限界

AlphaGenomeは重要な一歩ではありますが、DeepMindもその限界を認めています。例えば、10万塩基対を超える超長距離の制御要素を正確に捕捉することは依然として課題です。さらに、このモデルは現在、個人のゲノム予測のために設計または検証されておらず、遺伝子変異が複雑な形質や疾患にどのようにつながるかを完全に描写することもできません(これらは通常、より広範な生物学的プロセスや環境要因を含みます)。

オープンコミュニティ

科学の進歩を推進するため、AlphaGenomeは現在、AlphaGenome APIを通じて世界中の研究者に非営利利用のために提供されています。DeepMindは、学術界、産業界、政府組織の研究者がこのモデルを試用し、コミュニティフォーラムを通じて潜在的な使用事例を共有し、質問を提起し、フィードバックを提供することを心から歓迎しています。

DeepMindは、より広範な科学界との協力により、DNA配列内の複雑な細胞プロセスに関する理解を共同で深め、ゲノム科学と医療の画期的な新発見を推進したいと考えています。

論文:https://deepmind.google/discover/blog/alphagenome-ai-for-better-understanding-the-genome/

AlphaGenome API 使用:https://deepmind.google/discover/blog/alphagenome-ai-for-better-understanding-the-genome/

参考:https://deepmind.google/discover/blog/alphagenome-ai-for-better-understanding-the-genome/

メインタグ:ゲノム科学

サブタグ:人工知能バイオインフォマティクス遺伝子治療疾患研究


前の記事:『失控』著者による最新予言:今後25年間の10のキーワード

次の記事:マイクロサービスはすべて間違っていた!Googleが新手法を提案、コストを直接9分の1に削減!

短いURLをシェア