KEGG の概要
1. KEGG のデータベース群
KEGG はシステム情報、ゲノム情報、ケミカル情報に大別された 16 の 主要データベースから構成される「生命システム情報統合データベース」です。ゲノム情報とケミカル情報は生命の基本部品である DNA・RNA・タンパク質と低分子化合物・糖鎖・脂質等の分子構造情報、システム情報は基本部品から構成される生命システム、すなわち細胞・個体などの高次機能情報です。KEGG はゲノムと高次生命システムをつなぐ知識のレファレンスとして広く利用されています。
| カテゴリ |
データベース |
内容 |
システム 情報 |
KEGG PATHWAY |
代謝、様々な細胞プロセス、ヒト疾患などに関する分子ネットワークの知識を表現したパスウェイマップ; 文献等から手作業で作成 |
| KEGG BRITE |
生命システムの様々な側面に関する機能分類とオントロジー; 文献等から手作業で作成 |
| KEGG MODULE |
パスウェイやコンプレックスの機能単位; 手作業で定義 |
| KEGG DISEASE |
病因遺伝子・分子のリスト; 文献等から手作業で入力 |
| KEGG DRUG |
日米欧で承認された医薬品の化学構造と関連情報; 文献等から手作業で入力 |
| KEGG EDRUG |
生薬、精油など有用天然物の化学成分と関連情報; 文献等から手作業で入力 |
ゲノム 情報 |
KEGG ORTHOLOGY |
KO オーソロググループ; PATHWAY と BRITE に基づき定義 |
| KEGG GENOME |
ゲノムマップと生物種に関する情報; RefSeq 等の公共データベースより作成 |
| KEGG GENES |
全塩基配列が決定されたゲノムの遺伝子カタログと手作業アノテーション; RefSeq 等の公共データベースより作成 |
| KEGG SSDB |
ゲノム比較による遺伝子間の配列類似とベストヒット関係; GENES の計算処理で自動生成 |
| KEGG DGENES |
ドラフトゲノムの遺伝子カタログと自動アノテーション; ウェブのリソースより作成 |
| KEGG EGENES |
ESTのコンセンサスコンティグとして作られた遺伝子カタログと自動アノテーション; dbEST より作成 |
| KEGG MGENES |
メタゲノムの遺伝子カタログと自動アノテーション; NCBI のリソースより作成 |
ケミカル 情報 |
KEGG COMPOUND |
代謝物質、環境物質など低分子化合物; 文献等から手作業で入力 |
| KEGG GLYCAN |
糖鎖; 文献等から手作業で入力 |
| KEGG REACTION |
生体内化学反応; ENZYME と PATHWAY から手作業で入力 |
| KEGG RPAIR |
化学反応に伴う化学構造変化パターン; REACTION から手作業で入力 |
| KEGG RCLASS |
メインペアの化学構造変化パターンで定義した化学反応クラス; RPAIR から自動変換後、アノテーションを付加 |
| KEGG ENZYME |
酵素; ExplorEnz から自動変換後、アノテーションを付加 |
2. KEGG オブジェクト
KEGG は生命システムのコンピュータ表現です。分子レベルから高次システムレベルまで様々な KEGG オブジェクトとそれらの関係で、すなわち KEGG オブジェクトをノード(部品)とし、関係をエッジ(配線)とした、数学的には「グラフ」とよばれる概念で統一的に表現されています。各 KEGG オブジェクト(データベースエントリー)には以下に示すような識別子がつけられています。
| リリース |
データベース |
オブジェクト識別子 |
| 1995 | KEGG PATHWAY | map number |
| KEGG GENES | locus_tag / GeneID |
| KEGG ENZYME | EC number |
| KEGG COMPOUND | C number |
| 2000 | KEGG GENOME | organism code / T number |
| 2001 | KEGG REACTION | R number |
| 2002 | KEGG ORTHOLOGY | K number |
| 2003 | KEGG GLYCAN | G number |
| 2004 | KEGG RPAIR | RP number |
| 2005 | KEGG BRITE | br number |
| KEGG DRUG | D number |
| 2007 | KEGG MODULE | M number |
| 2008 | KEGG DISEASE | H number |
| 2010 | KEGG EDRUG | E number |
| KEGG RCLASS | RC number |
KEGG オブジェクトは既存の主要なライフサイエンスデータベースのエントリーとも相互に関連づけられています。また、KEGG オブジェクト識別子は Google 等のウェブ検索でも見いだされインターネットの一部となっています。
| グラフ |
ノード |
エッジ |
検索・解析 |
| KEGG |
KEGG オブジェクト |
生物学的な関係 |
KEGG |
| 統合データベース |
データベースエントリー |
クロスレファレンス情報 |
DBGET, Entrez, SRS ほか |
| インターネット |
ウェブページ |
ハイパーリンク |
Google などの検索エンジン |
3. ネットワーク階層
KEGG で最もユニークなデータベースは分子間相互作用・反応ネットワークを蓄積した PATHWAY データベースで、パスウェイ(経路)やコンプレックス(複合体)といった知識が、パスウェイマップというグラフィカルな形で表現されています。KEGG PATHWAY は現在のところ3つの階層に分類され、上の2つの階層は以下のようになっています。
| 第1階層 |
第2階層 |
| 代謝 |
糖質代謝
エネルギー代謝
脂質代謝
ヌクレオチド代謝
アミノ酸代謝
その他のアミノ酸代謝
糖鎖の合成と代謝
補酵素・ビタミン代謝
テルペノイドとポリケチドの代謝
その他の二次代謝物質の合成
非生体物質の分解と代謝 |
| 遺伝情報処理 |
転写
翻訳
フォールディング、局在化と分解
複製と修復 |
| 環境情報処理 |
膜輸送
シグナル伝達
シグナリング分子とその相互作用 |
| 細胞プロセス |
輸送と分解
細胞運動
細胞増殖と細胞死
細胞間コミュニケーション |
| 生体システム |
免疫系
循環器系
内分泌系
排出系
神経系
感覚系
発生
環境適応 |
| ヒト疾患 |
がん
免疫系疾患
神経変性疾患
循環器疾患
代謝疾患
感染症 |
4. ネットワーク再構築
KEGG ではゲノムからパスウェイを再構築するために、当初は EC 番号(酵素番号)を用いていましたが、その後代謝系以外の様々なパスウェイに対応するために、また EC 番号の不備を補うために、ortholog ID と呼ぶ識別子を導入しました。2つの異なる生物種の遺伝子が KEGG のパスウェイの同じノードにマップされたとき、両者をオーソログと定義します。これをタンパク質ファミリーのような BRITE の機能階層の中で同一グループをオーソログと定義することにも拡張したのが、KO (KEGG Orthology) です。
| 時期 |
識別子 |
マッピング |
割当単位 |
| 1995-1999 |
EC 番号 |
代謝パスウェイ |
ドメイン |
| 2000-2002 |
Ortholog ID |
代謝・制御パスウェイ |
ドメイン |
| 2003- |
KO |
パスウェイおよび BRITE 機能階層 |
遺伝子 |
現在の KO システムでは、その識別子(K 番号)は上記ネットワーク階層の第4レベルに、また BRITE の機能階層の最下層レベルに記述されています。
5. BRITE の機能階層
BRITE データベースは階層型テキストファイルと2項関係ファイルとよぶファイルの集合で、KEGG パスウェイマップでは表現できない機能情報を、語彙の階層としてコンピュータ化しています。Gene Ontology (GO) と比較すると、遺伝子・タンパク質以外の情報を蓄積していること、異なる階層(オントロジー)間が K 番号(KO グループ)、C 番号(化合物)、その他のオブジェクト間のリンクとして関連づけられていることが大きな特色です。
| 大分類 |
中分類 |
| 遺伝子・タンパク質 |
ネットワーク階層
タンパク質ファミリー |
| 化合物・反応 |
化合物
化学反応
化合物とタンパク質の相互作用 |
| 薬・病気 |
薬
病気 |
| 細胞・個体 |
生物種 |
参考文献
- Kanehisa, M.; Toward pathway engineering: a new database of genetic and molecular pathways. Science & Technology Japan, No. 59, pp. 34-38 (1996).
[pdf]
- Kanehisa, M.; A database for post-genome analysis. Trends Genet. 13, 375-376 (1997).
[pubmed]
- Ogata, H., Goto, S., Sato, K., Fujibuchi, W., Bono, H., and Kanehisa, M.; KEGG: Kyoto Encyclopedia of Genes and Genomes. Nucleic Acids Res. 27, 29-34 (1999).
[pubmed]
[pdf]
- Kanehisa, M. and Goto, S.; KEGG: Kyoto Encyclopedia of Genes and Genomes. Nucleic Acids Res. 28, 27-30 (2000).
[pubmed]
[pdf]
- Kanehisa, M., Goto, S., Kawashima, S., and Nakaya, A.; The KEGG databases at GenomeNet. Nucleic Acids Res. 30, 42-46 (2002).
[pubmed]
[pdf]
- Kanehisa, M., Goto, S., Kawashima, S., Okuno, Y., and Hattori, M.; The KEGG resources for deciphering the genome. Nucleic Acids Res. 32, D277-D280 (2004).
[pubmed]
[pdf]
- Kanehisa, M., Goto, S., Hattori, M., Aoki-Kinoshita, K.F., Itoh, M., Kawashima, S., Katayama, T., Araki, M., and Hirakawa, M.; From genomics to chemical genomics: new developments in KEGG. Nucleic Acids Res. 34, D354-357 (2006).
[pubmed]
[pdf]
- Kanehisa, M., Araki, M., Goto, S., Hattori, M., Hirakawa, M., Itoh, M., Katayama, T., Kawashima, S., Okuda, S., Tokimatsu, T., and Yamanishi, Y.; KEGG for linking genomes to life and the environment. Nucleic Acids Res. 36, D480-D484 (2008).
[pubmed]
[pdf]
- Kanehisa, M., Goto, S., Furumichi, M., Tanabe, M., and Hirakawa, M.; KEGG for representation and analysis of molecular networks involving diseases and drugs. Nucleic Acids Res. 38, D355-D360 (2010).
[pubmed]
[pdf]
Last updated: July 1, 2010
|