T細胞受容体とペプチドの結合を深層学習で紐解く 【TCR-抗原の法則】
この記事のタイトルとURLをコピーする

T細胞受容体 (TCR) と抗原ペプチドの結合は獲得免疫において重要なステップであり、これまで数多くの免疫学者による実験が行われてきました。機械学習技術の台頭とともに、その結合の予測にも使われるようになってきました。この記事では、特に深層学習による抗原ペプチド結合予測手法を俯瞰します。

深層学習でT細胞受容体と抗原ペプチドの結合を予測する

機械学習では特徴量をさまざまな知見をもとに主導で設計する必要がありますが、深層学習ではその特徴量抽出すら自動化することが可能です。

レパトア解析の例として、アテンションメカニズムと呼ばれる深層学習の仕組みを活用したDeepRCがあり、これはレパトアの各アミノ酸配列をベクトルに符号化し、アテンション機構によりその重要性を分析した後に、結合する・しないという分類を符号化されたベクトルの加重平均をもとに行う方法です(arXiv 2020)。

これ以外にも、深層学習はT細胞と抗原のペア(Front. Immunol.,2020; Mol. Syst. Biol. 2020)、あるいはT細胞と抗原とMHCという3つの親和性予測に広く使われるようになってきました(Nat. Mach. Intell. 2021)。TCR-pMHC結合予測は、免疫情報学において今も昔も最も活発に研究されているトピックの一つで、TCRと抗原タンパク質の配列情報から、その抗原がTCRに認識されるかどうかを予測するというものです。

古くから研究されているからこそさまざまな手法があり、少なくとも現段階では、深層学習を使う手法は専門家が手動で設計する特徴量を使う方法に明らかに凌駕するとは言えません。例えば、手動で得られた特徴量を使う方法(PNAS 2014)と深層学習による方法の比較が行われ(Phys. Rev. E 2020)、古典的な手法が勝っています。このような手法を系統的に比較するといういくつもの研究からも、平均すれば深層学習手法は既存の方法より解釈可能性の観点からも見劣りします。

しかしだからこそ、今後さらに発展的な深層学習の研究がこの分野で起こる可能性を秘めているとも言えます。例えば、soNNia(PNAS 2021)というモデルでは手動による特徴量と深層学習モデルを組み合わせていますし、TCR-pMHC相互作用予測についても深層学習と従来の機械学習法の組み合わせが試みられています(Cell Rep. 2021)。

また、TCRを文字列生成タスクのように扱うVAE(Variational Auto Encoder)ベースの生成モデルも提案されました(eLife 2019)。DeepTCRという方法は、VAEに基づく生成モデルから得られる特徴量を用いて分類問題を解くアプローチを取っています (Nat. Commun., 2021)。

表現学習に基づく埋め込み手法

自然言語処理にAIが活用されるにつれ、同様のコンセプトがこの領域にも入ってきました。これ以前にもタンパク質言語モデルというのはあったのですが、より免疫に特化した言語モデルが開発されています。例えばBERTMHC (Bioinformatics 2021) は、事前学習済みモデルを利用することで、ペプチド-MHC(クラスII)結合予測タスクの性能が実際に向上することを示しています。ImmunoBERT(arXiv 2021)は、ペプチド-MHC(クラスI)結合予測タスクに迫っています。このような事前学習済みモデルを使って、従来の方法と比較して高い性能が達成できるという報告もあります(bioRxiv 2022)。

NGSデータが世の中にたくさん公開することで、レパトアシークエンス解析データを使った独自の事前学習を行う論文も出始めています (Patterns 2022)。

自然言語では例えばGPTなどの生成モデルもありますが、これと同じコンセプトで抗体生成モデル(IgLM)の事前学習という報告もあります(bioRxiv 2021)。直接的な実証実験はこれからですが、自然言語の生成モデルをレパトアデータに適用できるのであれば、新しい抗体をも設計できるということになります。

今後のさらなる研究が待たれます。

まとめに代えて

この記事では、TCRとペプチド結合への深層学習適用の現状を俯瞰しました。

免疫学は非常に緻密ですが、えてしてとても難解です。それをとてもわかり易く説明した入門書です。

免疫に関するデータはたくさん公開されているので自宅でも研究ができますが、その前には免疫学のしっかりとした概念を勉強しておく必要があります。免疫の研究者なら名前を知らない人はいないのが、こちらの専門書です。

T細胞研究については、このような関連記事があるので合わせてご覧ください。

今日も【生命医学をハックする】をお読みいただきありがとうございました。当サイトの記事をもとに加筆した月2回のニュースレターも好評配信中ですので、よろしければこちらも合わせてどうぞ

この記事のタイトルとURLをコピーする
生命医学の知識や進歩を無料のニュースレターで

がんをはじめとする病気やよくある症状などの医学知識、再生医療などの生命科学研究は、研究手法が大きく前進したこととコンピューターの発達なども相まって、かつてないほどの勢いで知識の整備が進んでいます。

生命医学をハックするでは、主として医師や医学生命科学研究者ではない方や、未来を担う学生さんに向けた情報発信をしています (より専門的な内容はnoteで発信中)。

月に1回のペースで、サイトの更新情報や、それらをまとめた解説記事をニュースレターとして発行しています。メールアドレスの登録は無料で、もちろんいつでも解除することができます。

サイト名の「ハックする」には、分かってきたことを駆使し、それを応用して、病気の治療や研究などにさらに活用していこうという意味があります。

生命医学について徐々に解き明かされてきた人類の英知を受け取ってみませんか?

こちらの記事もいかがですか?
ブログランキング参加中 (クリックしていただけると励みになります)