ゲノムAI「Evo 2」と心臓特異的 SAE で心筋症の遺伝子変異を高精度に解析 ― 弊社共同創業者・大塚直人共同第一著者の研究論文がbioRxivに公開

株式会社GENSHI AI（本社：東京都千代田区、代表取締役：長嶋大地、以下「GENSHI AI」）の共同創業者・副社長である大塚直人が共同第一著者を務める研究論文「Evo 2 Predicts Cardiomyopathy-Associated Variants and Elucidates Their Underlying Mechanisms」が、2026年5月17日にプレプリントサーバ bioRxiv にて公開されました。本研究は、最先端のゲノムAI「Evo 2」を循環器領域に本格的に応用したものです。研究の過程で、大塚らは心臓に発現する遺伝子に特化した解析モジュール「Evo 2_heart SAE（心臓特異的 SAE）」を新たに開発し、汎用版では捉えきれなかった心筋タンパク質の複雑な構造を読み取れるようにしました。

背景：「病気の原因かどうかわからない変異」をどう判断するか

心筋症（心臓の筋肉が弱る・厚くなるなどの病気）の患者さんの遺伝子検査では、多くの「変異（DNA配列の違い）」が見つかります。しかしその中には、病気の原因なのか、ただの個人差なのか、はっきりわからないものが数多く含まれています。これらは「VUS（病的意義不明のバリアント）」と呼ばれ、臨床医が「治療方針を決められない」「家族にどう説明すべきかわからない」と頭を悩ませる大きな課題となっています。

近年、DNAそのものを大量に学習したAI（ゲノム基盤モデル）が登場し、生物学・医学の領域で注目を集めています。今回の研究で使われた「Evo 2」もその一つで、長いDNA配列の文脈からその変異の意味を読み取れるとされています。本研究は、Evo 2 が「心臓の病気の遺伝子診断」にどこまで役立つかを、循環器領域で初めて本格的に検証しました。

何がわかったか

1. AIが「病気の原因になる変異かどうか」を非常に高い精度で判定できた

遺伝子変異データベース「ClinVar」から、心筋症に関わる24遺伝子・3万件以上の単一塩基変異を集めて Evo 2 に判定させたところ、追加学習なし（ゼロショット）の状態でAUROC 0.983（1.0が完璧）という高い精度で「病気の原因になる変異」と「ならない変異」を見分けることができました。教師あり学習を行った既存ツールに引けを取らない性能を、Evo 2 はそのまま示しました。

2. AIが「心臓の筋肉タンパク質の構造」を自力で理解していた

研究グループは、Evo 2 が DNA をどのように「理解」しているかを覗き込むため、スパースオートエンコーダ（SAE）と呼ばれる解析手法を用いました。すると、AIは特別に教えていないにもかかわらず、ラミン A/C や DES などに見られる「コイルドコイル構造」（細長いらせんが束になった部分）に強く反応する内部特徴を持っていることがわかりました。実際、この部分を壊すと拡張型心筋症を起こすことが知られている変異（LMNA c.644T>C など）に対しては、特徴の活性が大きく低下することも確認されました。

3. 大塚らが「心臓特異的 SAE」を新たに開発、より複雑な構造の読み取りに成功

一方で、もとの Evo 2 が持つ約3万種類の内部特徴では、「アクチン結合領域」のようなより複雑で組織特異的な構造を捉えることができませんでした。そこで大塚らは、人体で心臓に強く発現している1,046個の遺伝子だけを使って AI を再学習させ、心臓に特化した解析モジュール「Evo 2_heart SAE（心臓特異的 SAE）」を新たに構築しました。

この心臓特異的 SAE は、もとの汎用版では見えなかったアクチン結合領域を識別する特徴を新たに獲得し、その領域に変異があると活性が大きく変化することも示されました（フィラミンC のミスメンス変異 FLNC c.752T>C など）。本研究の方法論的なハイライトであり、循環器領域だけでなく、肝臓・腎臓・脳など他臓器の特異的構造解析にも応用できる可能性のあるアプローチです。

4. 「遺伝子のスイッチ」を、DNAの並びだけから推定できた

心臓の発生・維持に重要な「転写因子（遺伝子のスイッチを入れるタンパク質）」のひとつに TBX5 があります。研究グループは、Evo 2 と SAE を組み合わせることで、TBX5 が実際に結合する DNA 領域に強く反応する内部特徴を見つけました。重要なのは、この特徴が TBX5 結合の目印となる 8 文字の配列だけでなく、その周辺の文脈もあわせて反応していたことです。実際の TBX5 結合には配列そのものに加えて「周りの文脈」が効くと近年指摘されており、その生物学的事実をAIが暗黙のうちに学習していたことを示します（心臓特異的 SAE では、この検出はさらに改善しました）。

さらに研究グループは、Evo 2 の内部表現を入力とする専用の機械学習モデル（5層ニューラルネット）を別途構築し、TBX5 の結合を AUROC 0.995 という極めて高い精度で予測することにも成功しました。このモデルは、心筋症との関連が報告されている既知の DNA 一文字違い（rs875908、心筋ミオシン重鎖 MYH7 の上流 3,000bp に位置）が TBX5 の結合に与える影響も正しく捉えました。

意義と今後

本研究は、ゲノムAIが循環器領域の遺伝子診断を支援できる可能性を示すとともに、「臓器に特化させた解析モジュール」が複雑な組織特異的構造の理解に有効であることを実証しました。将来的には、医師が「この変異は病気の原因かどうか」を判断する際の補助ツールとしての臨床応用に加え、他臓器でも同様のアプローチが展開できる可能性があります。

GENSHI AI は、共同創業者・大塚を中心に、ゲノム基盤モデルをはじめとする最先端 AI の医療応用研究を進めるとともに、研究成果を医療現場で活用できる形へと展開してまいります。

論文情報

タイトル: Evo 2 Predicts Cardiomyopathy-Associated Variants and Elucidates Their Underlying Mechanisms
著者: Atsumasa Kurozumi ^*, Naoto Otsuka ^*, Masamichi Ito, Toshinaru Kawakami, Takayuki Isagawa, Satoshi Kodera, Norihiko Takeda
* 共同第一著者（These two authors contributed equally to this work）
掲載: bioRxiv（プレプリント、2026年5月17日公開）
DOI: 10.64898/2026.05.15.725304 ↗
URL: biorxiv.org で論文を読む ↗
ライセンス: CC-BY 4.0 International
助成: 戦略的イノベーション創造プログラム（SIP）統合型ヘルスケアシステム（JPJ012425）

※ 本論文はプレプリントであり、査読は完了していません。