がんゲノムのデータベースと解析ツール 【コマンド不要】

少し前はある程度バイオインフォマティクスの経験がある人でないと敷居が高かった、がんのドライ解析ですが、今は使いやすいウェブベースのツールがたくさん登場したことでコマンドに馴染みがない実験系の研究者でも簡単にデータ分析ができるようになりました。

この記事では、ウェブで完結するがんデータベースとツールについて紹介します。

がんゲノムのデータベース

ICGC Data Portal

ICGC Data Portalは国際がんゲノムコンソーシアム (The International Cancer Genome Consortium, ICGC) が運営しています。

各国の研究プロジェクトを調整することで作成された、50のがんについてゲノム異常のカタログです。

症例や遺伝子、変異の条件などを指定した情報の取得も簡単で、例えばメラノーマでBrafに変異を持つ患者さんのRNA-seqデータというようなことも容易に検索できます。

TCGA Data Portal

TCGA Data PortalはTCGA (The Cancer Genome Atlas) が提供するがんゲノムの包括的なデータベースで、そのデータを一括ダウンロードすることも可能です。

GDC

GDC (Genomic Data Commons) はがん患者のゲノムデータや臨床データを保存・解析・共有するためのプラットフォームで、アメリカのNational Cancer Institute (NCI) が運営しています。データの共有を促進して、がんの診断と治療に対する精密医療のアプローチを促進することを目的としています。

COSMIC

COSMIC (Catalogue Of Somatic Mutations in Cancer) は、イギリスのSanger研究所が提供するがんゲノムの包括的なデータベースです。

COSMICでは、expert curation data と systematic screen data という2タイプのデータがあります。

Expert curation dataは 、専門の編集者 (キュレーター) が論文の情報をもとに手動で入力したデータで、特に既知のがん遺伝子についての情報をまとめた Cancer Gene Census (CGC) プロジェクトの結果が収録されています。

Systematic screen dataというのは、大規模スクリーニングのデータを報告した論文からアップロードされたデータや、上で紹介したICGCといった他のデータベースからインポートしたデータで、新たながん遺伝子の発見に役立つかもしれません。

COSMICに収録されている変異情報を、その遺伝子がコードするタンパク質の立体構造上に重ねて閲覧できるCOSMIC-3Dというツールもあります。

CCLE

CCLE (Cancer Cell Line Encyclopedia)はアメリカのBroad研究所が管理している、がん細胞株とその薬剤感受性についてのデータベースです。

約1500種類のがん細胞株の遺伝子発現や変異、スプライシング・DNAメチル化異常、マイクロRNA発現などのデータもまとまっています。

Genomics of Drug Sensitivity in Cancer

Genomics of Drug Sensitivity in CancerはイギリスのSanger研究所が提供している、がん細胞株の薬剤感受性データベースです。

ウェブで簡単に薬剤感受性と遺伝子変異などとの相関をグラフにすることができます。

depmap

depmap (the Cancer Dependency Map) は、アメリカのBroad InstituteとイギリスのWellcome Sanger Instituteが提供しているツールです。

RNAiやCRISPRスクリーニングで、合成致死になるような組み合わせを探すことを目的にいろいろながん細胞のデータやスクリーニング結果を提供しています。

ゲノムや薬剤感受性の情報もその中に含まれています。

がんゲノムの解析ツール

Broad GDAC FIREHOSE

Broad GDAC FIREHOSEはアメリカのBroad研究所が提供しているポータルサイトで、TCGAのデータをMutSigGISTIC2.0などよく使われているツールで解析できます。

cBioPortal for Cancer Genomics

cBioPortal for Cancer GenomicsはアメリカのSlogan Ketteringがん研究所が提供している解析ツールです。

TCGAやICGC, CCLEといった公共データを統合し、遺伝子単位でさまざまな解析を行うことができます。

UCSC Xena

UCSC Xena (旧UCSC Cancer Genomics Browser)はUCSCが提供するオミクスデータの可視化ツールです。

TCGAなどの大規模プロジェクトで集約された、さまざまな癌腫における組織における遺伝子変異や遺伝子発現、コピー数、メチル化、ATAC-seqなどの複数の条件を使って、簡単にヒートマップを書くことが可能です。

Regulome Explorer

Regulome ExplorerはInstutite for Systems Biologyが提供しているオミクスデータの視覚化ツールです。

TCGAのデータを読み込み、Circularプロットやネットワークを簡単に書くことが可能です。

200410 1

Oncomine

Oncomineは、Thermo Fisher Scientific社が提供するツールです。登録する必要がありますが、無料で使うことができます。

関連図書とまとめ

この記事に関連した内容を紹介している本はこちらです。

今日も【生命医学をハックする】 (@biomedicalhacks) をお読みいただきありがとうございました。