Table 1

Content of the three NUCOCOG databases


NUCOCOG
arNUCOCOG
NUCOCOG_2

domain sequences
144,320
81,616
204,890
Nucleotides
142,675,176
72,324,636
195,633,198
stop codons
94
62
115
a. a. a.: B
41
-
41
a. a. a.: U
24
27
42
a. a. a.: X
1,243
89
1,288
a. a. a.: Z
12
-
12
a. n.: b
9
-
9
a. n.: d
9
-
9
a. n.: h
4
-
4
a. n.: k
189
-
189
a. n.: m
163
3
164
a. n.: n
195
110
301
a. n.: r
328
1
328
a. n.: s
258
-
258
a. n.: v
7
-
7
a. n.: w
113
-
113
a. n.: y
660
3
660

The abbreviations used are a. a. a. for ambiguous amino acids and a. n. for ambiguous nucleotides.

Meereis and Kaufmann BMC Bioinformatics 2008 9:479   doi:10.1186/1471-2105-9-479