N2D (Neutralized and 2-Dimensional compound database)

About the Database

The N2D database manages the compound information that are retrieved from the compound databases and processed as below.

  • The charged molecule was neutralized by adding or removing the equivalent number of hydrogens to or from the formula.
  • As a signature of the uniqueness of the connectivity of the atoms, the first block (14 letters) of the InChIKey was associated to the compound information.
  • When multiple components are included in a record, the largest molecule is selected.

Followings are the features of the N2D database.

  • The compounds registered as charged molecules (e.g. [M]+) in the databases can be correctly searched with a normal adduct setting (e.g. [M+H]+).
  • Redundancy between the databases were removed and the compounds having the same atom-connectivity is compiled in one candidate in the results.
  • Therefore, the N2D search excludes miss hits to salts and charged molecules, and allows to obtain more concise and interpretable results.

データベースの概要

代表的なデータベースに登録されている化合物を、以下の様に処理したデータが格納されています。

  • チャージを持った分子は、水素を強制的に加減して中性化する。
  • 立体情報のないユニークな元素結合を表すものとして、InChIKeyの1ブロック目(14文字)を付与する。
  • 塩などの複数要素として登録されているものは、その中で一番分子量の大きい分子だけを使う。

これによって次の利点が得られます。

  • 通常のアダクト設定(例:[M+H]+)で、チャージ分子(例:[M]+)としてデータベースに登録されている化合物を正しく検索できます。
  • 元素結合が同一なものを複数の化合物データベース間でまとめ、化合物の重複を除去した結果を返してくれます。
  • その結果、チャージ分子や塩などへの誤ヒットがなく、候補数の少ない検索結果が得られます。

How to Use

The following databases can be searched.

Signature Database Name
KG KEGG
KN KNApSAcK
FL FlavonoidViewer
HM HMDB
LM LipidMAPS
UN UNPD
PC PubChem

In addition to the common parameters of the MFSearcher, "db" option is used to define the databases used in the N2D search. When multiple databases are used, the signatures are concatenated with comma.

Ex) ...&db=FL,KN

The "search" method in combination with "formula", "inchikey" and "id" options is used to search the records with the same connectivity of atoms. The first block (14 letters) of input for "inchikey" is used for the search.

Ex)
.../n2d/search?formula=C5H9NO4&db=FL,KN
.../n2d/search?inchikey=WHUUTDBJXJRKMK&db=FL,KN
.../n2d/search?id=KN:C00001358&db=FL,KN

Results

Field Description
id A set information of database name and compound id is described as "Signature:Compound ID". When multiple compounds of the same connectivity were there, the sets were concatenated by comma.
Square brackets "[ ]" with some letters can be inserted in front of the compound id. The letters inside show the state of the compound registered in the original database as follows.

Number The charge of the molecule.
f Multiple components were registered in the record (ex, salts).
r The compound was a radical.
description The shortest description among the searched databases is shown as a representative.

使い方

以下のデータベースが使用できます。

識別子 データベース名
KG KEGG
KN KNApSAcK
FL FlavonoidViewer
HM HMDB
LM LipidMAPS
UN UNPD
PC PubChem

通常のパラメーター設定に加えて、dbパラメーターに、検索対象とするデータベースの識別子を記載します。複数のデータベースを指定する場合は、カンマで区切ります。

例)...&db=FL,KN

"search"メソッドを、"formula"、"inchikey"、"id"オプションと一緒に使うことで、該当するレコードと同じinchikey-skeletonを持つものを検索できます。inchikeyには、InChIKeyまたはInChIKey skeletonを入力しますが、入力した文字列のうち、最初のブロック(14文字)だけが検索に使われます。

Ex)
.../n2d/search?formula=C5H9NO4&db=FL,KN
.../n2d/search?inchikey=WHUUTDBJXJRKMK&db=FL,KN
.../n2d/search?id=KN:C00001358&db=FL,KN

検索結果

説明
id ヒットした化合物のIDとデータベース名が、「データベース識別子:データベース中の化合物ID」として記載されます。元素結合が同じものが複数ある場合は、カンマで繋がれます。
化合物IDの前に[]で示された文字は、もとのデータベース中で次のように登録されていたことを示します。

数字 チャージを持っていた。数字はその価数を示します。
f 塩などの複合体として登録されていたことを示す。
r ラジカルとして登録されていた。
description 各データベースの中で一番文字列の短いものが、代表として一つ示されます。

Output Example

出力例

/mfsearcher/n2d/range?lowerMs=286.04&upperMs=286.05&db=FL
/mfsearcher/n2d/range?lowerMs=286.04&upperMs=286.05&db=FL,KG,KN,HM,LM

Compare the results to those of the normal searching to FlavonoidViewer

/mfsearcher/flavonoidviewer/range?lowerMs=286.04&upperMs=286.05

These are the examples of the search method.
/mfsearcher/n2d/search?formula=C5H9NO4&db=KG,KN,HM
/mfsearcher/n2d/search?inchikey=WHUUTDBJXJRKMK&db=KG,KN,HM
/mfsearcher/n2d/search?id=KN:C00001358&db=KG,KN,HM

# db-name molecular-formula dbe formula-weight id description inchikey-skeleton
N2D C15H10O6 0.0 286.0477380528 FL:FL5FA8NS0001,KN:C00004562,KG:C10036,LM:LMPK12111622 Datiscetin WCNLFPKXBGWWDS
N2D C15H10O6 0.0 286.0477380528 KN:C00038111 1,3,8-Trihydroxy-2-methoxyanthraquinone ITLMMMUIWDPRJK
N2D C15H10O6 0.0 286.0477380528 FL:FL3FALNS0002,KN:C00003859,HM:HMDB30543,LM:LMPK12110941 Norartocarpetin ZSYPIPFQOQGYHH
N2D C15H10O6 0.0 286.0477380528 FL:FL1AACNS0001,KN:C00008027,KG:C08576,HM:HMDB34150,LM:LMPK12130041 Cernuine WBEFUVAYFSOUEA
N2D C15H10O6 0.0 286.0477380528 KN:[1]C00020650 Melacacinidin JWCBMQQZRJYFKV
N2D C15H10O6 0.0 286.0477380528 FL:FL5F3ANS0001,KN:C00004575,LM:LMPK12111601 3,7,8,4'-Tetrahydroxyflavone YXNPLJZTPMOXKR
N2D C15H10O6 0.0 286.0477380528 FL:FL3FEANS0002,KN:C00003834,KG:C10184,LM:LMPK12111160 Scutellarein JVXZRQGOGOXCEC
N2D C15H10O6 0.0 286.0477380528 KN:C00018258,KN:C00024007 Cynodontin;1,4,5,8-Tetrahydroxy-2-methylanthraquinone;2,5,7-trihydroxyemodin NFQXCHAJWVRYND
N2D C15H10O6 0.0 286.0477380528 KN:C00038303,KG:C17786 6-Demethoxycapillarisin UBSCDKPKWHYZNX
N2D C15H10O6 0.0 286.0477380528 FL:FL5F1CNS0001,KN:C00004579,KG:C10041,LM:LMPK12111566 3,3',4',7-Tetrahydroxyflavone XHEFDIBZLJXQHF
N2D C15H10O6 0.0 286.0477380528 FL:FL5FF9NS0001,KN:C00004551,LM:LMPK12113088 8-Hydroxygalangin WQUAABPUMMPCJB
N2D C15H10O6 0.0 286.0477380528 KN:C00045734 Catenarin VWDXGKUTGQJJHJ
N2D C15H10O6 0.0 286.0477380528 KN:C00038520 Asphodelin A OZOZCKVLUMXFGS
N2D C15H10O6 0.0 286.0477380528 FL:FL3FA8NS0013,KN:C00013561,LM:LMPK12110137 5,7,2',3'-Tetrahydroxyflavone STAGATUVRDVEAT
db-name N2D
dbe 0 (not caclulated)
id DB signatures (KG, KN, FL, HM, LM, UN, PC) : [*fr] Compound IDs
description The shortest description among the databases

Search Limit: 100

The maximum record number that returns for a single query for each database is 100 as default. The number can be set to a smaller one by setting the "limit" parameter.

When the number of search results exceeds the maximum number, the value of "is-limited" will be set to "true". It means that not all of the search results were written in the returned text, so please be careful to discuss about the results.

The "is-limited" value is written in the returned text when the "output" parameter has been set to "txth" or "xml".

検索件数の上限:100

各データベースに対して一度の検索で返されるデータ数の上限はデフォルトで100件です。件数の上限はlimitパラメーターでこれよりも小さくすることができます。

検索結果が上限数を超えた場合は、outputパラメーターでtxthまたはxmlを指定していた場合、is-limitedの値がtrueとなります。これは、本来検索されるべきデータがまだ残っていることを意味していますので、ご注意ください。

Updating Schedule

Not planned.

データベースの更新予定

予定はありません


Back To Home: Please see here for the details of how to use MFSearcher

ホームへ: MFSearcherの使い方の詳細は、こちらをご参照ください