がん研究に有用なゲノムやプロテオームリソース【TCGAだけではない】にも紹介していますが、がんゲノムや遺伝子発現データなど多様なデータが取得可能になりました。それらを手軽に扱えるウェブツールもいろいろ登場したので、本記事で紹介します。
がんデータセットのインタラクティブな解析を可能にするウェブアプリケーション
cBioportalは、TCGAやGENIEなどの大規模プロジェクトによる344のがんオミックスデータコホートやさまざまなデータセット (Cancer Discov. 2012)にアクセスできます。インタラクティブな解析・可視化モジュールもあるので、さまざまな種類のデータと臨床転帰の関連性を見出すことが可能です。
UCSC XenaはTCGA、ICGC、GTEXなどの大規模プロジェクトによる139のオミックスデータコホートにアクセスできるようになっています (Nat. Biotechnol. 2020)。こちらも複雑なコードを書かなくてもデータの探索が可能で、UCSC Xenaの使い方 【がんデータ解析をウェブブラウザのみで行えるツール】という関連記事で紹介しています。
TIDEは、腫瘍の免疫回避を研究するために設計された188 の腫瘍コホートにおける約33,000 サンプル、12の免疫療法臨床試験からの 998 腫瘍、および8つのCRISPRスクリーニングデータをまとめたものです。インタラクティブなデータ解析・可視化モジュールがあり、がんの免疫回避制御因子の同定や治療前のトランスクリプトームプロファイルからの免疫チェックポイント阻害反応予測、公的コホートにおける新規免疫療法バイオマーカー探索などが可能です (Nat. Med. 2018)。
PRECOGはGEOおよびArrayExpressから収集した166の遺伝子発現データセットをまとめていて、特筆すべきは生存期間のデータがあるデータに絞っているため遺伝子発現と生存との関連を調べたいときに有用です (Nat. Med. 2015)。
RABITは18種類のがん種における150の転写因子と、TCGAの7484腫瘍サンプルにおける686のChIP-seqデータを提供しています。多様な細胞におけるChIP-seqデータを統合し、遺伝子発現パターンを形成する転写因子について迫ることができます (PNAS 2015)。
TISCHは79個の公開シングルセルRNA-seqデータセット (合計2,045,746細胞) における多様ながん細胞集団における遺伝子発現レベルを示しています (Nucleic Acids Res. 2021)。
DepMapは、1086細胞株のゲノムワイドCRISPRスクリーニングデータおよび710細胞株のRNAiスクリーニングデータにアクセス可能であり、また各細胞における薬剤感受性のデータとも連動しているのでがん細胞株に対する遺伝子perturbationの影響を調べることができます。さらに、細胞株によっては遺伝子発現、コピー数変化、DNA変異といったデータも取得できます。
Tresは、19種類のがんを含む168の腫瘍サンプルから得られた36の単一細胞RNA-seqデータセット、そして免疫療法研究から得られた8つのT細胞トランスクリプトミクスデータセットがまとまっています。固形がんの1細胞トランスクリプトームデータを使って、免疫抑制シグナルに関わるT細胞のシグネチャーが同定されています (Nat. Med. 2022)。これを使うことで、免疫チェックポイント阻害や細胞移植におけるT細胞の臨床効果を予測することができます。
まとめに代えて
この記事では、がん研究に関するリソースについて紹介しました。
がんの研究は医療とも密接に結びついています。がん医療をわかりやすくイラストつきで解説してくれているのがこちらの本です。
がんの生物学について、腫瘍抑制遺伝子の発見などで高名なワインバーグ先生がまとめた網羅的な教科書もオススメです。
がん研究については、このような関連記事があるので合わせてご覧ください。
今日も【生命医学をハックする】をお読みいただきありがとうございました。当サイトの記事をもとに加筆した月2回のニュースレターも好評配信中ですので、よろしければこちらも合わせてどうぞ