生命科学において、タンパク質は重大な役割を果たしています。細胞のしごとのうち、ほとんどのものはタンパク質が担っています。ある特定のタンパク質を標的にした創薬も行われています。
この記事では、タンパク質の構造を調べる時に必要になる一連のツールについて、タンパク質研究にあまり馴染みがない学生さん・研究者の方に向けてまとめました。
タンパク構造のデータベース
タンパク質構造についてのデータベースとして、最も有名なものはPDBです。
RCSB(Research Collaboratory for Structural Bioinformatics)という国際組織が1971年以降公開していて、主にX線結晶構造解析の結果得られた構造情報が登録されています。
日本語による解説動画もありどんなことができるのか分かります (やや古い動画なので、今では少し見た目が変わってしまったところもあります)。
日本では大阪大学蛋白研にミラーサイトPDBjがあり、PDBと同じ情報を日本語で閲覧することができます。
PDBに登録されたNMR構造をクラスタリングし、代表構造とサブファミリーに分類して公開しているのがOLDERADOデータベースです。
EMDBは、タンパク質の電子顕微鏡情報をまとめたデータバンクです。低温電子顕微鏡 (cryo-EM) で得られた立体構造は、EMDBとPDBに一括で登録できます。
この電子顕微鏡データを、専門外の方が日本語で気軽に眺めることを目指したのが、PDBjが運営するEM Navigatorです。
タンパク質の機能を予測・解析するのに、タンパク質の構造の分類は重要です。このため、タンパク質の主鎖の折りたたみパターン (フォールド) で分類するということがなされています。
SCOP (Structural Classification of Proteins)はイギリスのMRC Laboratory of Molecular Biology and Centre for Protein Engineeringという研究機関が1994年から公開しているデータベースで、スーパーファミリー・ファミリー・フォールドの各レベルにおける分類が行われています。
SCOPと並んで代表的な立体構造分類法なのがCATHで、既知のタンパク質立体構造を半自動的に分類しています。
Webで可視化するツール
このようにして、すでに構造が解き明かされたタンパク質を見つけることができます。
その構造をより見やすくするツールをここから紹介していきます。
NGL Viewerは、大きな分子複合体をインタラクティブに表示することができます。
このウェブツールは、グラフィックインターフェースを使って分子を可視化でき、小分子の結合次数の表示、静電マップの表示、X線電子密度マップの表示、タンパク質-リガンド相互作用の表示、分子動力学シミュレーションの表示などができます。
NGL Viewerは、pdb、mol2、groなどの一般的な構造ファイル形式をサポートしているので、これらのファイルを読み込むことも可能です。
WebGLおよびVR (バーチャル・リアリティ) 技術の進歩に伴い、AutodeskがAutodesk Molecule Viewerを作成し、VRでタンパク質の世界を探索できるツールも作られました (Accessible virtual reality of biomolecular structural models using the Autodesk Molecule Viewer. Nat Methods. 2017)。
Protein-Ligand Interaction Profiler (PLIP)(PLIP: fully automated protein-ligand interaction profiler. Nucleic Acids Res. 2015) は、クラウドコンピューティングを使ってタンパク質-リガンド複合体の非共有結合による相互作用を解析するWebベースのツールです。
PLIPを使用すると、Protein Data Bank(PDB)から構造を取得したり、ローカルPDBファイルを使って、その複合体に見られるすべての非共有結合による相互作用を一覧表示できます。
Bio3D-Webは、調べたいタンパク質ファミリーにおける、タンパク質構造の同定と比較分析のためのツール群を用意しています。配列や構造の保存といった比較的容易な解析から発展的なものまで、種々用意されています。
Autodesk Bionano Molecular Design Toolkit (ABMDT)は、統合分子シミュレーションプラットフォームです。web版とコード版があり、web版はHTML5, JavaScript (d3.jsと3Dmol.js) などで動いています。
CyrusはRosettaという商業ソフトの分子モデリングおよび設計ツールキットで、主にタンパク質設計用のRosettaパッケージを使用したクラウドコンピューティングに使用されています。
MDシミュレーションはCADDで重要な役割を果たしています。AmberToolsの最新バージョンでは、Webブラウザを使用したリアルタイムのMDシミュレーションが可能で、これらのツールは、Jupyter notebookに統合されています。
インストール型のタンパク可視化ツール
ウェブツールだけでなく、インストール型になりますが、タンパク質研究で最もよく使われているツールはPyMOL、VMD、UCSF Chimeraです。それぞれのツールは、さまざまなタスクに合わせて最適化されています。
PythonベースのPyMOLは、詳細な画像を作成することができ、PyMOL Wikiコミュニティーから提供されているPythonスクリプトを使用したカスタムスクリプトを作成するのも容易です。
VMD (Visual Molecular Dynamics) は分子動力学のために設計されていて、様々なシミュレーションや解析をするために使用されています。
UCSF Chimeraは分子構造と関連データをインタラクティブに可視化したり、さまざまな拡張が可能なプログラムです。
これらのツールはオフラインで使用するだけでなく、WebGL (Web Graphics Libraryという、3Dグラフィクスをwebに表示するためのjavascriptベースのAPIで、標準的なブラウザには実装されているためプラグインなどなしで利用できる)とHTML5といったウェブ技術を使ってブラウザ上で高分子が可視化できるようになっています。
タンパク質構造についてさらに知りたい場合は、実験からデータ解析までわかりやすく書かれている入門書がオススメです。
まとめ
最後に今回の内容をまとめます。
- タンパク質立体構造のデータベースがあり、情報が蓄積している
- Webベースのツールでは、インストール不要で構造を可視化できる
- PyMOL, UCSC Chimeraなどのインストール型ツールを使えばさらに自由に解析可能
今日も【医学・生命科学・合成生物学のポータルサイト】生命医学をハックするをお読みいただきありがとうございました。