エンハンサー解析に使えるデータベース 【ウェブツール7つ】
執筆者
【生命医学をハックする】運営者 (@biomedicalhacks)。生命科学研究者、医師・医学博士。プロフィールはこちら

遺伝子の発現量を調節する要素はプロモーターだけでなくヒストン修飾などのエピジェネティクスを含めた様々ありますが、その1つにエンハンサーが含まれています。

この記事では、エンハンサーに取り組む生命科学系の学生さんに向けて無料で使える代表的なデータベースを紹介します。

エンハンサーとは

エンハンサーは遺伝子の転写量を増加 (enhance) させる作用があるDNA領域のことで、プロモーターからの距離や位置・方向に関係なく働きます

例えて言うならば、プロモーターは遺伝子発現のON/OFFを切り替えるスイッチで、エンハンサーはその量をコントロールします。

例えば細胞の種類によって働く遺伝子が違うのはなぜなのか?などにもう少し詳しく書かれています。

1980年にはもうエンハンサーの存在が知られていましたが、その後の解析からゲノムは核内で複雑な3D構造をとっていて、一見エンハンサーとプロモーターの距離があっても立体構造の観点からはかなり近い場所にあるため、ずっと遠くのエンハンサーが遺伝子発現に影響を持つことがあると分かってきました。

近年の大規模データの蓄積やバイオインフォマティクスの方法の改良によって、一昔前は難しかったエンハンサーの同定も比較的できるようになっています。

エンハンサーデータベース

EnhancerAtlas

EnhancerAtlasは、H3K27acやCAGEなど12の大規模シークエンスデータ解析手法から得られたデータセットを解析し、正常細胞やがん細胞、そして分化段階にある細胞まで、それぞれの細胞におけるエンハンサーを同定したデータベースです。

HACER

HACER (Human Active Enhancers to interpret Regulatory variants)はエンハンサー領域におけるSNP等の影響を評価するために作られたデータベースです。

SNPをもとにしたエンハンサー検索ができるのが他のデータベースにはない特徴です。

ENdb

ENdb (ENhancer database)は、他の多くがハイスループット実験から得られたデータを使っているのとは対照的なデータベースです。

つまり、RNAiやノックダウン、ウェスタンブロット、ルシフェラーゼアッセイなどの、ロースループットな実験 (ヒトおよびマウス細胞)から得られたエンハンサーについての情報を文献からマニュアルで収集し、それをデータベースにしています。

ハイスループットなデータと比べ、偽陽性が少ないデータベースです。

スーパーエンハンサーデータベース

スーパーエンハンサーとは,エンハンサーがそれに結合する転写因子や様々なコファクターとともに形成する転写活性の高い大きな複合体のことです。

Richard Youngによって提唱されて以来、まだスーパーエンハンサーの厳密な定義は専門家の間でも定まっていないものの、データベースがいくつか作られてきました。

SEdb

SEdb (super-enhancer database)はヒトのスーパーエンハンサーのデータベースです。

NCBIに登録された(H3K27ac)ChIP-seqデータから手動でデータを集めています。
上で紹介したENdbと同じ研究機関が運営しています。

SEA

SEA (Super-Enhancer Archive)はヒトだけでなく多数のモデル生物のスーパーエンハンサーのデータが収録されています。

コンピューターアルゴリズムにより収録されたものだけでなく、一部は手動でデータ登録されています。

人の疾患に関わるエンハンサーのデータベース

エンハンサーはヒトの病気とも関わっています。

HEDD

HEDD (Human Enhancer Disease Database)は、ENCODEやFANTOM, RoadMapといった大規模な国際プロジェクトのデータから得られたエンハンサー-遺伝子間と遺伝子-疾患間の関係性をスコア化し、疾患に関わるエンハンサーを収録したデータベースです。

ゲノムの位置だけでなく、関わる病気や、データソース (ENCODE/FANTOM/RoadMap) で検索できます。

DiseaseEnhancer

DiseaseEnhancer はエンハンサーとヒトの病気に関わる情報を文献からマニュアルで集めたウェブツールです。

調べたい染色体やその位置を入力すると、その範囲にあるエンハンサーや標的遺伝子、関与する具体的な病気の情報が表示できます。

関連サイト・図書

この記事に関連した内容を紹介しているサイトや本はこちらです。

細胞の種類によって働く遺伝子が違うのはなぜなのか?

まとめ

最後に今回の内容をまとめます。

  • エンハンサーは距離・位置・方向に依存しない
  • エンハンサーは大規模シークエンスデータから見つけられる
  • 病気と関わるエンハンサーのデータベースもある

今日も【医学・生命科学・合成生物学のポータルサイト】生命医学をハックするをお読みいただきありがとうございました。

生命医学の知識や進歩を無料のニュースレターで

がんをはじめとする病気やよくある症状などの医学知識、再生医療などの生命科学研究は、研究手法が大きく前進したこととコンピューターの発達なども相まって、かつてないほどの勢いで知識の整備が進んでいます。

生命医学をハックするでは、主として医師や医学生命科学研究者ではない方や、未来を担う学生さんに向けた情報発信をしています。

2週間に1回のペースで、サイトの更新情報や、それらをまとめた解説記事をニュースレターとして発行しています。メールアドレスの登録は無料で、もちろんいつでも解除することができます。

サイト名の「ハックする」には、分かってきたことを駆使し、それを応用して、病気の治療や研究などにさらに活用していこうという意味があります。

生命医学について徐々に解き明かされてきた人類の英知を受け取ってみませんか?

この記事が気に入ったら
フォローしよう

最新情報をお届けします

Twitterでも情報発信中

こちらの記事もいかがですか?
ブログランキング参加中 (クリックしていただけると励みになります)