ExactMassDB Searching

About the Database

ExactMassDB stores all the possible elemental compositions with the kinds and maximum numbers of atoms (shown below) that satisfy the Senor and the Lewis valence rules.

Last updated.

データベースの概要

ExactMassDBには、下表の元素およびその上限数で構成され得る仮想的な化合物のうち、Senior側およびLweis則に基づいて価数の過不足がないものが全て搭載されています。そして、その組成式を、精密質量から検索できるようにしてあります。

レコード数・最終更新日

Atom maximum number
C 100
H 200
O 50
N 10
P 10
S 10

Our previous survey demonstrated that 95.65% of the compounds in the Dictionary of Natural Products , 186,788 compounds in the range 50-1500 Da) consist of C, H, O, N, P and S within the ranges C: 1-95, H: 1-182, N: 0-10, O: 1-45, P: 0-6 and S: 0-5 (Iijima et al., 2008). Thus we chose the atom kinds and numbers listed above for construction of ExactMassDB. It was estimated that 99.5% of the compounds consisting of C, H, O, N, P and S in KEGG and 99.1% in KNApSAcK were within the criteria. The database would cover most of the natural compounds.

以前調査した結果では、Dictionary of Natural Productsに含まれるC, H, O, N, P, Sで構成される化合物(186,788化合物、50-1500 Da)のうち、95.65%が、C: 1-95, H: 1-182, N: 0-10, O: 1-45, P: 0-6, S: 0-5の範囲で構成されることが分かりました(Iijima et al., 2008)。そこで、ExactMassDBデータベースの構築には、これよりも広い原子数設定をしました(上記)。この原子数の範囲は、C, H, O, N, P, Sから構成されるKEGG登録化合物の99.5%、 KNApSAcK登録化合物の99.1%をカバーしていたので、ExactMassDB-HR2は、ほとんどの天然物の組成式を網羅していると考えられます。

Search Limit: 100

The maximum record number that returns for a single query is 100 as default. The number can be set to a smaller one by setting the "limit" parameter.

When the number of search results exceeds the maximum number, the value of "is-limited" will be set to "true". It means that not all of the search results were written in the returned text, so please be careful to discuss about the results.

The "is-limited" value is written in the returned text when the "output" parameter has been set to "txth" or "xml".

検索件数の上限:100

一度の検索で返されるデータ数の上限はデフォルトで100件です。件数の上限はlimitパラメーターでこれよりも小さくすることができます。

検索結果が上限数を超えた場合は、outputパラメーターでtxthまたはxmlを指定していた場合、is-limitedの値がtrueとなります。これは、本来検索されるべきデータがまだ残っていることを意味していますので、ご注意ください。

Output Example

Here is a part of results when "txth" is selected for the "output" parameter.

出力例

outputパラメーターでtxthを指定した結果の抜粋です。

Search Test

# db-name molecular-formula dbe formula-weight id description
ExactMassDB C16H11O2N10P3S1 21.0 500.0000046695
ExactMassDB C32H1N6P1       37.0 500.0000320763
ExactMassDB C6H37O5P9S1      2.0 500.0000372918
ExactMassDB C19H17O10P1S2   13.0 500.0000767653
ExactMassDB C1H12O19N10S1    1.0 500.0000892805
ExactMassDB C7H31O3N4P7S2    5.0 500.0000988854
ExactMassDB C4H21O10N8P1S4   0.0 500.0001109521
ExactMassDB C23H21O1P5S1    21.0 500.0001262922
db-name ExactMassDB
id blank
description blank

Updating

Not planned.

データベースの更新予定

予定はありません

Download

The elemental compositions and their exact mass values registered in the ExactMassDB.

ex.tar.gz.aa (1.00 GB)
ex.tar.gz.ab (1.00 GB)
ex.tar.gz.ac (1.00 GB)
ex.tar.gz.ad (886 MB)

Download the four files above, and concatenate them with cat command below.

$ cat ex.tar.gz.* > ex.tar.gz

Then untar with tar command.

$ tar zxf ex.tar.gz
$ tar zxf ExactMassDB.tar.gz

# records: 417,844,582
File size: ExactMassDB.txt 15.6 GB (after decompression)

The java software used to create the data shown above.

CreateExactMassDB_1.0.zip (7 KB)

ダウンロード

ExactMassDBに登録した組成式とその精密質量値のデータです。

ex.tar.gz.aa (1.00 GB)
ex.tar.gz.ab (1.00 GB)
ex.tar.gz.ac (1.00 GB)
ex.tar.gz.ad (886 MB)

上記四つのデータを全てダウンロードした後、catコマンドで結合してください。

$ cat ex.tar.gz.* > ex.tar.gz

その後、tarコマンドで解凍してください。

$ tar zxf ex.tar.gz
$ tar zxf ExactMassDB.tar.gz

組成式数: 417,844,582
展開後サイズ: ExactMassDB.txt 15.6 GB

上記データを作成するのに用いたJavaソフトウェアです。

CreateExactMassDB_1.0.zip (7 KB)

 

Back To Home: Please see here for the details of how to use MFSearcher

ホームへ: MFSearcherの使い方の詳細は、こちらをご参照ください