シークエンス技術の発達によりさまざまな生物種のゲノムを迅速に読むことができるようになりましたが、次の大きな課題の1つはゲノムの機能を解き明かすことです。そんな中、ゲノム情報から新たな有用物質を見つけ出す試みも盛んに行われています。この記事では、代表的なツールと実例を紹介します。
ゲノムマイニングのツール
自然界の生物は、ポリケチド、非リボソームペプチド、テルペンといったさまざまな特殊な化合物を産生しています。こういったSM (specialized metabolites) の研究から、これらの産生を担う遺伝子は、クラスター(BGC, Biosynthetic gene clusters)としてゲノム内に存在していることが明らかになりました。
クラスターを構成しているのであれば、DNA配列データから見つけやすいのではないか? ということで、さまざまな取組が行われています。
このBGC探索を自動化するために、いくつかのグループが共同で開発した BGC 予測・アノテーションツールが antiSMASHです (antiSMASH: rapid identification, annotation and analysis of secondary metabolite biosynthesis gene clusters in bacterial and fungal genome sequences. Nucleic Acids Res. 2011) 。
2011年の開発以降も、継続的にアップデートされており、現在はそのバージョン5が公開されています (antiSMASH 5.0: updates to the secondary metabolite genome mining pipeline. Nucleic Acids Res. 2019) 。
また、antiSMASHの研究を拡張しマルチゲノムBGC比較を可能にするために、オーソログBGCをクラスタリングしたり配列類似性ネットワークとして可視化することができるようになったBiG-SCAPEというツールも開発されています (A computational framework to explore large-scale biosynthetic diversity. Nat Chem Biol. 2020)。
ゲノム配列データから52種類の異なるBGCを同定できる。PKSおよびNRPS基質特異性の予測、およびキュレーションされた既知のBGCのMIBiGデータベース (遺伝子クラスターのデータベース) との比較が可能。web版およびローカル版インストールが可能。
BiG-SCAPE:
AntiSMASHによって予測されたBGCをドメインに着目したPfamモデルと比較したマルチゲノム比較。遺伝子の内容とシンテニーの観点からBGC間の類似性を可視化できる。ローカルインストールのみ。
PRISM:
ゲノム配列データから22種類の異なるBGCを同定。分類されたBGCについて、PKSとNRPSの基質特異性の予測とグラフベースの構造予測を掲載している。オンライン版のみ。
ゲノムマイニングの実例
バイオインフォマティクス的に同定され、かつ関心のある BGC を選択した後、遺伝子クローニングとその発現、および化合物の生産を確認するためのメタボロミクス解析が行われています。これらの検証研究の多くは、出芽酵母など遺伝学操作がやりやすい宿主で行われてきました。
そのような例としては、ブラシリキノンBGCの同定 (Identification and Mobilization of a Cryptic Antibiotic Biosynthesis Gene Locus from a Human-Pathogenic Nocardia Isolate. ACS Chem. Biol. 2020)や、ミスラマイシンAおよびプリパスタチン産生の改善 (Increased heterologous production of the antitumoral polyketide mithramycin A by engineered Streptomyces lividans TK24 strains. Appl. Microbiol Biotechnol. 2018; Clone of plipastatin biosynthetic gene cluster by transformation-associated recombination technique and high efficient expression in model organism Bacillus subtilis. J. Biotechnol. 2018) などが挙げられます。
どのような生物種のゲノムから遺伝子クラスターを探索してもいいのですが、歴史的に海綿動物は生理活性代謝物の供給源としてよく知られています。
例えば、抗がん剤や翻訳阻害剤として働くパテアミン (Inhibition of eukaryotic translation initiation by the marine natural product pateamine A. Mol. Cell 2005)、抗ウイルス剤のマイカラミド (An antiviral compound from a New Zealand sponge of the genus Mycale. J. Am. Chem. Soc. 1988)、微小管安定化剤のペロルシド (Peloruside A: a potent cytotoxic macrolide isolated from the New Zealand marine sponge mycale sp. J. Org. Chem. 2000) などは海綿動物から見つかった化合物です。
土壌中にいる微生物も、貴重な化合物を生成しています。この分野では日本人の先生方も多大な貢献をしていて、例えば土壌細菌Penicillium citrinumから見つかったコレステロールを下げるスタチンは世界中の患者さんに使われています。
ちょっと変わったところでは、昆虫のマイクロバイオームについても探索され、新たな化合物が見つかっています (The antimicrobial potential of Streptomyces from insect microbiomes. Nat. Commun. 2019)。
もちろん、ヒトの腸内細菌からも新たな化合物が発見されています。例えば、メタゲノム解析から得られたリードからBGC候補を同定する方法が開発され、これを使って3203のメタゲノムヒトマイクロバイオームデータセットに適用し、ウェクスルビシンとメタマイシンという2つのBGCを同定し、これが実際に機能しているということが報告されています (A metagenomic strategy for harnessing the chemical repertoire of the human microbiome. Science 2019)。
まとめに代えて
この記事ではゲノムマイニングで有用な化合物を探し出すことができるツールと、その実例をいくつか紹介しました。
「ゲノム解析は「私」の世界をどう変えるのか?」という本にも書かれているように、ゲノム解析の普及でさまざまな常識が変わりつつありますが、このような有用な化合物探索も例外ではありません。
また、最後に紹介したScience論文のように、メタゲノムデータもパブリックにあり、その解析の仕方も例えば「NGSアプリケーション 今すぐ始める! メタゲノム解析」のような本にまとまっています。
メタゲノム解析 + ゲノムマイニングツールの組み合わせで候補となるBGCを見つけ出し、あとはそれをクローニングし、ちょっとしたその検証実験でもしかしたら1つの発見になるかもしれません。
まだまだいろいろな発見が期待される分野ですね。
今日も【生命医学をハックする】 (@biomedicalhacks) をお読みいただきありがとうございました。当サイトの記事をもとに加筆した月2回のニュースレターも好評配信中ですので、よろしければこちらも合わせてどうぞ