» English

KEGG の概要

1. ゲノムから生命システムへ

KEGG はゲノムや分子レベルの情報から細胞、個体、エコシステムといった生命システムの機能や有用性を理解するためのリソースです。生命システムのコンピュータ表現として、遺伝子やタンパク質(ゲノム情報)と化合物など(ケミカル情報)の分子部品の情報を、分子間の相互作用・反応・関係ネットワーク(システム情報)の知識で統合した生命システム情報統合データベースです。さらに生体システムのゆらぎとして疾患・医薬品情報(ヘルス情報)も統合されています。

KEGG overview

KEGG は 1995年より金久ラボラトリーズで開発されており、今ではゲノムと高次生命システムをつなぐ知識のレファレンスとして、とくにシークエンシングやその他のハイスループット実験技術がもたらす大量データの統合処理・解釈に広く利用されています。

2. KEGG データベース

KEGG は以下の 16のデータベースから構成される統合データベースです。これらはシステム情報、ゲノム情報、ケミカル情報、ヘルス情報に大別され、さらに各ウェブページでは 5つのカラーコードで区別されています。

カテゴリ データベース 内容 カラー
システム情報 KEGG PATHWAY KEGG パスウェイマップ kegg3
KEGG BRITE BRITE 機能階層・テーブル
KEGG MODULE KEGG モジュール
ゲノム情報 KEGG ORTHOLOGY (KO) 機能オーソログ kegg4
KEGG GENOME 全ゲノム配列既知の KEGG 生物種 kegg1
KEGG GENES 遺伝子・タンパク質
KEGG SSDB GENES の配列類似情報
ケミカル情報 KEGG COMPOUND 化合物 kegg2
KEGG GLYCAN 糖鎖
KEGG REACTION 生体内化学反応
KEGG RCLASS 反応クラス
KEGG ENZYME 酵素
ヘルス情報 KEGG DISEASE ヒト疾患 (日本語) kegg5
KEGG DRUG 医薬品 (日本語)
KEGG DGROUP 医薬品グループ (日本語)
KEGG ENVIRON 生薬・天然物など (日本語)
ケミカル情報カテゴリの総称は KEGG LIGAND
ヘルス情報カテゴリと医薬品添付文書の統合リソースは KEGG MEDICUS (日本語)

これらのデータベースには生命システムのコンピュータ表現として様々なデータオブジェクトが含まれています。各データベースのエントリは KEGG オブジェクトと呼ばれ、データベースごとに定められたプリフィックスと5桁の数字からなる KEGG オブジェクト識別子がエントリ名となっています (KEGG Objects 参照)。

リリース データベース オブジェクト識別子 注記
1995KEGG PATHWAYmap number
KEGG GENESlocus_tag / GeneID
KEGG ENZYMEEC number
KEGG COMPOUNDC number
1998KEGG REACTIONR number
2000KEGG GENOMEorganism code / T number
2002KEGG ORTHOLOGY  K numberOrtholog IDs in 2000
2003KEGG GLYCANG number
2004KEGG RPAIRRP numberDiscontinued in 2016
2005KEGG BRITEbr number
KEGG DRUGD number
2006KEGG MODULEM number
2008KEGG DISEASEH number
2010KEGG ENVIRONE numberFirst called EDRUG
KEGG RCLASSRC number
2014KEGG DGROUPDG number

3. KEGG 分子ネットワーク

KEGG で最もユニークなデータベースは高次生命システム機能に関する知識を分子間相互作用・反応・関係ネットワークとして表現したシステム情報の部分です。ここでは文献等から集約した知識を以下の表現でコンピュータ化しています。
  • パスウェイマップ - KEGG PATHWAY (Pathway maps 参照)
  • BRITE 階層・テーブル - KEGG BRITE (Brite hierarchies 参照)
  • メンバーシップ (論理式) - KGG MODULE
  • メンバーシップ (単純リスト) - KEGG DISEASE
これらのデータベースは高次生命システム機能解読のためのレファレンス知識ベースで、KEGG マッピングと呼ぶ手続き (KEGG mapping 参照) により、ゲノム解読やハイスループット実験データの解釈を可能にします。

このようなマッピングの概念は 1995年に KEGG プロジェクトが開始されたときに初めて導入され実用化されました。当初は EC 番号を用いてゲノムから代謝パスウェイ再構築を行っていましたが、その後代謝系以外の様々なパスウェイに対応するために、また EC 番号の不備を補うために、ortholog ID と呼ぶ識別子が導入されました。現在はこれをさらに見直し拡張した KO (KEGG Orthology) システムを用いてゲノムアノテーションと KEGG 分子ネットワークへのマッピングが行われています。

時期 識別子 知識ベース 割当単位
1995-1999 EC 番号 代謝パスウェイ ドメイン
2000-2002 Ortholog ID 代謝・制御パスウェイ ドメイン
2003- KO パスウェイおよび BRITE 機能階層 遺伝子

別の見方をすると、KO は分子ネットワーク上でのオーソログとして定義され、個々の遺伝子情報を一般化したものです。KEGG にはこれ以外にも同様の一般化が、特殊な分子ネットワークについて行われています。

ネットワークタイプ クラス インスタンス
すべてのタイプ KO (遺伝子オーソログ) 遺伝子 in KEGG GENES
生体内化学反応 RC (反応クラス) 反応 in KEGG REACTION
医薬品相互作用 DG (医薬品グループ) 医薬品 in KEGG DRUG

参考文献

  1. Kanehisa, M.; Toward pathway engineering: a new database of genetic and molecular pathways. Science & Technology Japan, No. 59, pp. 34-38 (1996). [pdf]
  2. Kanehisa, M.; A database for post-genome analysis. Trends Genet. 13, 375-376 (1997). [pubmed] [doi]
  3. Ogata, H., Goto, S., Sato, K., Fujibuchi, W., Bono, H., and Kanehisa, M.; KEGG: Kyoto Encyclopedia of Genes and Genomes. Nucleic Acids Res. 27, 29-34 (1999). [pubmed] [doi]
  4. Kanehisa, M. and Goto, S.; KEGG: Kyoto Encyclopedia of Genes and Genomes. Nucleic Acids Res. 28, 27-30 (2000). [pubmed] [doi]
  5. Kanehisa, M., Goto, S., Kawashima, S., and Nakaya, A.; The KEGG databases at GenomeNet. Nucleic Acids Res. 30, 42-46 (2002). [pubmed] [doi]
  6. Kanehisa, M., Goto, S., Kawashima, S., Okuno, Y., and Hattori, M.; The KEGG resources for deciphering the genome. Nucleic Acids Res. 32, D277-D280 (2004). [pubmed] [doi]
  7. Kanehisa, M., Goto, S., Hattori, M., Aoki-Kinoshita, K.F., Itoh, M., Kawashima, S., Katayama, T., Araki, M., and Hirakawa, M.; From genomics to chemical genomics: new developments in KEGG. Nucleic Acids Res. 34, D354-357 (2006). [pubmed] [doi]
  8. Kanehisa, M., Araki, M., Goto, S., Hattori, M., Hirakawa, M., Itoh, M., Katayama, T., Kawashima, S., Okuda, S., Tokimatsu, T., and Yamanishi, Y.; KEGG for linking genomes to life and the environment. Nucleic Acids Res. 36, D480-D484 (2008). [pubmed] [doi]
  9. Kanehisa, M., Goto, S., Furumichi, M., Tanabe, M., and Hirakawa, M.; KEGG for representation and analysis of molecular networks involving diseases and drugs. Nucleic Acids Res. 38, D355-D360 (2010). [pubmed] [doi]
  10. Kanehisa, M., Goto, S., Sato, Y., Furumichi, M., and Tanabe, M.; KEGG for integration and interpretation of large-scale molecular datasets. Nucleic Acids Res. 40, D109-D114 (2012). [pubmed] [doi]
  11. Kanehisa, M., Goto, S., Sato, Y., Kawashima, M., Furumichi, M., and Tanabe, M.; Data, information, knowledge and principle: back to metabolism in KEGG. Nucleic Acids Res. 42, D199–D205 (2014). [pubmed] [doi]
  12. Kanehisa, M., Sato, Y., Kawashima, M., Furumichi, M., and Tanabe, M.; KEGG as a reference resource for gene and protein annotation. Nucleic Acids Res. 44, D457-D462 (2016). [pubmed] [doi]
  13. Kanehisa, Furumichi, M., Tanabe, M., Sato, Y., and Morishima, K.; KEGG: new perspectives on genomes, pathways, diseases and drugs. Nucleic Acids Res. 45, D353-D361 (2017). [pubmed] [doi]

Last updated: June 26, 2017