KEGG T01001: 57215

Homo sapiens (human): 57215

Entry

57215             CDS       T01001

Symbol

THAP11, CTG-B43a, CTG-B45d, HRIHFB2206, MAHCL, RONIN, SCA51

Name

(RefSeq) THAP domain-containing protein 11

K23211

THAP domain-containing protein 11

Organism

hsa Homo sapiens (human)

Pathway

hsa04980

Cobalamin transport and metabolism

Network

nt06538 Cobalamin transport and metabolism

Element

N01810

Regulation of MMACHC expression

Disease

H00063

Spinocerebellar ataxia (SCA)

H02221

Methylmalonic aciduria and homocystinuria

Brite

KEGG Orthology (KO) [BR:hsa00001]
09150 Organismal Systems
  09154 Digestive system
   04980 Cobalamin transport and metabolism
    57215 (THAP11)
09180 Brite Hierarchies
  09182 Protein families: genetic information processing
   03000 Transcription factors [BR:hsa03000]
    57215 (THAP11)
   03036 Chromosome and associated proteins [BR:hsa03036]
    57215 (THAP11)
Transcription factors [BR:hsa03000]
Eukaryotic type
  Zinc finger
   Cys2CysHis zinc factors
    57215 (THAP11)
Chromosome and associated proteins [BR:hsa03036]
Eukaryotic type
  Gene silencing
   Transposable elements
    57215 (THAP11)

SSDB

Motif

Pfam:

THAP DDHD Spt20_SEP VPS13_N CPSF100_C SLC52_ribofla_tr Chimallin_Phikzvirus PAT1 DUF5349 Phage_T7_kinase WD40_2 eIF-3_zeta DUF702 EOS1 Presenilin Ig-CFAP74_2

Other DBs

NCBI-GeneID:

NCBI-ProteinID:

OMIM:

HGNC:

Ensembl:

UniProt:

Structure

LinkDB

Position

16:67842320..67844195

AA seq 314 aa
MPGFTCCVPGCYNNSHRDKALHFYTFPKDAELRRLWLKNVSRAGVSGCFSTFQPTTGHRL
CSVHFQGGRKTYTVRVPTIFPLRGVNERKVARRPAGAAAARRRQQQQQQQQQQQQQQQQQ
QQQQQQQQQQQQSSPSASTAQTAQLQPNLVSASAAVLLTLQATVDSSQAPGSVQPAPITP
TGEDVKPIDLTVQVEFAAAEGAAAAAAASELQAATAGLEAAECPMGPQLVVVGEEGFPDT
GSDHSYSLSSGTTEEELLRKLNEQRDILALMEVKMKEMKGSIRHLRLTEAKLREELREKD
RLLAMAVIRKKHGM

NT seq 945 nt +upstreamnt +downstreamnt
atgcctggctttacgtgctgcgtgccaggctgctacaacaactcgcaccgggacaaggcg
ctgcacttctacacgtttccaaaggacgctgagttgcggcgcctctggctcaagaacgtg
tcgcgtgccggcgtcagtgggtgcttctccaccttccagcccaccacaggccaccgtctc
tgcagcgttcacttccagggcggccgcaagacctacacggtacgcgtccccaccatcttc
ccgctgcgcggcgtcaatgagcgcaaagtagcgcgcagacccgctggggccgcggccgcc
cgccgcaggcagcagcagcaacagcagcagcagcagcaacagcagcaacagcagcagcag
cagcaacagcagcagcagcagcagcagcagcagcagtcctcaccctctgcctccactgcc
cagactgcccagctgcagccgaacctggtatctgcttccgcggccgtgcttctcaccctt
caggccactgtagacagcagtcaggctccgggatccgtacagccggcgcccatcactccc
actggagaagacgtgaagcccatcgatctcacagtgcaagtggagtttgcagccgcagag
ggcgcagccgctgcggccgccgcgtcggagttacaggctgctaccgcagggctggaggct
gccgagtgccctatgggcccccagttggtggtggtaggggaagagggcttccctgatact
ggctccgaccattcgtactccttgtcgtcaggcaccacggaggaggagctcctgcgcaag
ctgaatgagcagcgggacatcctggctctgatggaagtgaagatgaaagagatgaaaggc
agcattcgccacctgcgtctcactgaggccaagctgcgcgaagaactgcgtgagaaggat
cggctgcttgccatggctgtcatccgcaagaagcacggaatgtga

Homo sapiens (human): 3054

Entry

3054              CDS       T01001

Symbol

HCFC1, CFF, HCF, HCF-1, HCF1, HFC1, MAHCX, MRX3, PPP1R89, VCAF, XLID3

Name

(RefSeq) host cell factor 1 isoform 2

K14966

host cell factor 1

Organism

hsa Homo sapiens (human)

Pathway

hsa03083

Polycomb repressive complex

hsa04980

Cobalamin transport and metabolism

hsa05168

Herpes simplex virus 1 infection

Network

nt06168  Herpes simplex virus 1 (HSV-1)
nt06523  Epigenetic regulation by Polycomb complexes
nt06538  Cobalamin transport and metabolism

Element

N00588

HSV VP16 to Oct-1-mediated transcription

N01585

Deubiquitination of H2AK119

N01810

Regulation of MMACHC expression

Disease

H00480

X-linked intellectual developmental disorder

H02222

Methylmalonic acidemia and hyperhomocysteinemia, cblX type

Brite

KEGG Orthology (KO) [BR:hsa00001]
09120 Genetic Information Processing
  09126 Chromosome
   03083 Polycomb repressive complex
    3054 (HCFC1)
09150 Organismal Systems
  09154 Digestive system
   04980 Cobalamin transport and metabolism
    3054 (HCFC1)
09160 Human Diseases
  09172 Infectious disease: viral
   05168 Herpes simplex virus 1 infection
    3054 (HCFC1)
09180 Brite Hierarchies
  09181 Protein families: metabolism
   01009 Protein phosphatases and associated proteins [BR:hsa01009]
    3054 (HCFC1)
  09182 Protein families: genetic information processing
   03036 Chromosome and associated proteins [BR:hsa03036]
    3054 (HCFC1)
   03029 Mitochondrial biogenesis [BR:hsa03029]
    3054 (HCFC1)
Protein phosphatases and associated proteins [BR:hsa01009]
Protein serine/threonine phosphatases
  Phosphoprotein phosphatases (PPPs)
   Protein phosphatase-1
    PP1-interacting proteins (PIPs)
     3054 (HCFC1)
Chromosome and associated proteins [BR:hsa03036]
Eukaryotic type
  Histone modification proteins
   HAT complexes
    NSL complex
     3054 (HCFC1)
   HMT complexes
    COMPASS/SET1 complex
     3054 (HCFC1)
    MLL-HCF complex
     3054 (HCFC1)
   Polycomb repressive complex (PRC) and associated proteins
    PR-DUB complex
     3054 (HCFC1)
Mitochondrial biogenesis [BR:hsa03029]
Mitochondrial quality control factors
  Regulator of mitochondrial biogenesis
   Other regulator of mitochondrial biogenesis
    3054 (HCFC1)

SSDB

Motif

Pfam:

Kelch_HCF Kelch_KLHDC2_KLHL20_DRC7 Beta-prop_FBX42 Beta-prop_ATRN-LZTR1 Kelch_1 Kelch_2 fn3 Kelch_FKB95

Other DBs

NCBI-GeneID:

NCBI-ProteinID:

OMIM:

HGNC:

Ensembl:

UniProt:

Structure

LinkDB

Position

X:complement(153947557..153971818)

AA seq 2035 aa
MASAVSPANLPAVLLQPRWKRVVGWSGPVPRPRHGHRAVAIKELIVVFGGGNEGIVDELH
VYNTATNQWFIPAVRGDIPPGCAAYGFVCDGTRLLVFGGMVEYGKYSNDLYELQASRWEW
KRLKAKTPKNGPPPCPRLGHSFSLVGNKCYLFGGLANDSEDPKNNIPRYLNDLYILELRP
GSGVVAWDIPITYGVLPPPRESHTAVVYTEKDNKKSKLVIYGGMSGCRLGDLWTLDIDTL
TWNKPSLSGVAPLPRSLHSATTIGNKMYVFGGWVPLVMDDVKVATHEKEWKCTNTLACLN
LDTMAWETILMDTLEDNIPRARAGHCAVAINTRLYIWSGRDGYRKAWNNQVCCKDLWYLE
TEKPPPPARVQLVRANTNSLEVSWGAVATADSYLLQLQKYDIPATAATATSPTPNPVPSV
PANPPKSPAPAAAAPAVQPLTQVGITLLPQAAPAPPTTTTIQVLPTVPGSSISVPTAART
QGVPAVLKVTGPQATTGTPLVTMRPASQAGKAPVTVTSLPAGVRMVVPTQSAQGTVIGSS
PQMSGMAALAAAAAATQKIPPSSAPTVLSVPAGTTIVKTMAVTPGTTTLPATVKVASSPV
MVSNPATRMLKTAAAQVGTSVSSATNTSTRPIITVHKSGTVTVAQQAQVVTTVVGGVTKT
ITLVKSPISVPGGSALISNLGKVMSVVQTKPVQTSAVTGQASTGPVTQIIQTKGPLPAGT
ILKLVTSADGKPTTIITTTQASGAGTKPTILGISSVSPSTTKPGTTTIIKTIPMSAIITQ
AGATGVTSSPGIKSPITIITTKVMTSGTGAPAKIITAVPKIATGHGQQGVTQVVLKGAPG
QPGTILRTVPMGGVRLVTPVTVSAVKPAVTTLVVKGTTGVTTLGTVTGTVSTSLAGAGGH
STSASLATPITTLGTIATLSSQVINPTAITVSAAQTTLTAAGGLTTPTITMQPVSQPTQV
TLITAPSGVEAQPVHDLPVSILASPTTEQPTATVTIADSGQGDVQPGTVTLVCSNPPCET
HETGTTNTATTTVVANLGGHPQPTQVQFVCDRQEAAASLVTSTVGQQNGSVVRVCSNPPC
ETHETGTTNTATTATSNMAGQHGCSNPPCETHETGTTNTATTAMSSVGANHQRDARRACA
AGTPAVIRISVATGALEAAQGSKSQCQTRQTSATSTTMTVMATGAPCSAGPLLGPSMARE
PGGRSPAFVQLAPLSSKVRLSSPSIKDLPAGRHSHAVSTAAMTRSSVGAGEPRMAPVCES
LQGGSPSTTVTVTALEALLCPSATVTQVCSNPPCETHETGTTNTATTSNAGSAQRVCSNP
PCETHETGTTHTATTATSNGGTGQPEGGQQPPAGRPCETHQTTSTGTTMSVSVGALLPDA
TSSHRTVESGLEVAAAPSVTPQAGTALLAPFPTQRVCSNPPCETHETGTTHTATTVTSNM
SSNQDPPPAASDQGEVESTQGDSVNITSSSAITTTVSSTLTRAVTTVTQSTPVPGPSVPP
PEELQVSPGPRQQLPPRQLLQSASTALMGESAEVLSASQTPELPAAVDLSSTGEPSSGQE
SAGSAVVATVVVQPPPPTQSEVDQLSLPQELMAEAQAGTTTLMVTGLTPEELAVTAAAEA
AAQAAATEEAQALAIQAVLQAAQQAVMGTGEPMDTSEAAATVTQAELGHLSAEGQEGQAT
TIPIVLTQQELAALVQQQQLQEAQAQQQHHHLPTEALAPADSLNDPAIESNCLNELAGTV
PSTVALLPSTATESLAPSNTFVAPQPVVVASPAKLQAAATLTEVANGIESLGVKPDLPPP
PSKAPMKKENQWFDVGVIKGTNVMVTHYFLPPDDAVPSDDDLGTVPDYNQLKKQELQPGT
AYKFRVAGINACGRGPFSEISAFKTCLPGFPGAPCAIKISKSPDGAHLTWEPPSVTSGKI
IEYSVYLAIQSSQAGGELKSSTPAQLAFMRVYCGPSPSCLVQSSSLSNAHIDYTTKPAII
FRIAARNEKGYGPATQVRWLQETSKDSSGTKPANKRPMSSPEMKSAPKKSKADGQ

NT seq 6108 nt +upstreamnt +downstreamnt
atggcttcggccgtgtcgcccgccaacttgccagcggtgcttctgcagccccgctggaag
cgagtggtgggctggtcgggtccggtgccacggccccgccacggccaccgcgccgtggcc
atcaaggagctcatcgtggtgtttggcggcggcaacgagggaatagtggacgaactgcac
gtgtacaacacggcaaccaaccagtggttcatcccagccgtgaggggggacattccccct
gggtgtgcagcctatggcttcgtgtgtgacgggactcgcctcctggtgtttggtgggatg
gtggagtatgggaaatacagcaatgacctctacgaactccaggcgagccggtgggagtgg
aagagactcaaagcaaagacgcccaaaaacgggccccctccgtgtcctcgactcgggcac
agcttctcccttgtgggcaacaaatgctacctgtttgggggtctggccaatgatagcgag
gacccaaagaacaacattccaaggtacctgaatgacttatatatcctggaattacggcca
ggctctggagtggtagcctgggacattcccatcacttacggggtcctaccaccaccccgg
gagtcacatactgccgtggtctacaccgaaaaagacaataagaagtccaagctggtgatc
tacggcgggatgagtggctgcaggctgggggacctgtggaccctagatattgacaccctg
acgtggaataagcccagtctcagcggggtggcgcctcttcctcgcagtctccactcggca
accaccatcggaaataaaatgtacgtgtttggtggctgggtgcctctcgtcatggatgac
gtcaaagtggccacacacgagaaggagtggaagtgtaccaacacgctggcttgtctcaac
ctggataccatggcctgggagaccatcctgatggatacactggaggacaacatcccccgt
gctcgggctggccactgcgcagtcgccatcaacacccgcctgtacatttggagtgggcgt
gacggctaccgcaaggcctggaacaaccaggtctgctgcaaggacctctggtacctagag
acagaaaagccaccacccccagcccgagtacaactggtacgcgccaacaccaactccctg
gaggtgagctggggggcagtggcaacagccgacagctaccttctccagctccagaaatat
gacattcctgccacggctgctactgccacctcccctacacccaatccggtcccatctgtg
cctgccaaccctcccaagagccctgccccagcagcagccgcacctgctgtgcagccgctg
acccaagtaggcatcacgctcctgccccaggctgcccccgcacccccgaccaccaccacc
atccaggtcttgccaacggtgcctggcagctccatttctgtgcccaccgcagccaggact
caaggtgtccctgctgttctcaaagtgaccggtcctcaggctacaacaggaactccattg
gtcaccatgcgacctgccagccaggctgggaaagcccctgtcaccgtgacctcccttccc
gccggagtgcggatggttgtgccaacacagagtgcccagggaacggtgattggcagtagc
ccacagatgagtgggatggccgcactggccgctgcggccgctgccacccagaagatcccc
ccttcctcggcacccacggtgctgagtgtcccagcgggtaccaccatcgtgaagaccatg
gctgtgacacctggcactaccaccctcccagccactgtgaaggtggcctcctcgccagtc
atggtgagcaaccctgccactcgcatgctgaagactgcagccgcccaggtggggacatcg
gtttcctccgccaccaacacgtctacccgccctatcatcacagtgcacaagtcaggcact
gtgacagtggcccagcaagcccaggtggtgaccacagttgtgggcggggtcaccaagacc
atcaccctggtgaagagccccatctctgtcccaggaggcagtgctctgatttccaatctg
ggcaaagtgatgtcggtggtccagaccaaaccagttcagacttcagcagtcacaggccag
gcgtccacgggtcctgtgactcagatcatccagaccaaagggcccctgccagcgggaaca
atcctgaagctggtgacctcagcagatggcaagcccaccaccatcatcactaccacgcag
gccagtggggcggggaccaagcccaccatcctgggcatcagcagcgtctcccccagtacc
accaagcccggcacgaccaccatcatcaaaaccatccccatgtcggccatcatcacccag
gcgggcgccacgggtgtgaccagcagtcctggcatcaagtcccccatcaccatcatcacc
accaaggtgatgacttcaggaactggagcacctgcgaaaatcatcactgctgtccccaaa
attgccactggccacgggcagcagggagtgacccaggtggtgcttaagggggccccggga
cagccaggcaccatcctccgcactgtgcccatggggggtgttcgcctggtcacacccgtc
accgtctccgccgtcaagccagccgtcaccacgttggttgtgaaaggcaccacaggtgtc
acgaccctaggcacagtgacaggcaccgtctccaccagccttgccggggcggggggccac
agcactagtgcttccctggccacgcccatcaccaccttgggcaccattgccaccctctca
agccaggtgatcaaccccactgccatcactgtgtcggccgcacagaccacgctgacagcg
gcaggcgggctcacaaccccaaccatcaccatgcagcccgtgtcccagcccacccaggta
actctgatcacggcacctagtggggtggaggcccagcctgtgcatgacctccctgtgtcc
attctggcctccccgactacagaacagcccaccgccacagttaccatcgccgactcaggc
cagggtgatgtgcagcctggcactgtcaccttggtgtgctccaacccaccctgtgagacc
cacgagactggcaccaccaacacggccaccactactgttgtggctaaccttgggggacac
ccccagcccacccaagtgcagttcgtctgtgacagacaggaggcagctgcttctcttgtg
acctcgactgtgggccagcagaatggtagcgtggtccgagtctgttcgaacccgccctgc
gagacccacgagacgggcaccaccaacaccgccaccaccgccacctccaacatggccggg
cagcatggctgctcaaacccaccctgcgagacccacgagacgggcaccaccaacactgcc
actacagccatgtcgagcgtcggcgccaaccaccagcgagatgcccgtcgggcctgtgca
gctggcacccctgccgtgatccggatcagtgtggccactggggcgctggaggcagcccag
ggctctaagtcccagtgccaaacccgccagaccagcgcgaccagcaccaccatgactgtg
atggccaccggggccccgtgctcggccggcccactccttgggccgagcatggcacgggag
cccgggggccgcagccctgcttttgtgcagttggcccctctgagcagcaaagtcaggctg
agcagcccaagcattaaggaccttcctgcggggcgccacagccatgcggtcagcaccgct
gccatgacccgttccagcgtgggtgctggggagccccgcatggcacctgtgtgcgagagc
ctccagggtggctcgcccagcaccacagtgactgtgacagccctggaggcactgctgtgc
ccctcggccaccgtgacccaagtctgctccaacccaccatgtgagacccacgagacaggc
accaccaacaccgccactacctcgaatgcaggcagcgcccagagggtgtgctccaacccg
ccatgcgagacccacgagacgggcaccacccacacggccaccaccgctacttcaaacggg
ggcacgggccagcccgagggtgggcagcagccccctgctggtcgcccctgtgagacacac
cagaccacttccactggcaccaccatgtcggtcagcgtgggtgccctgcttcccgacgcc
acttcttcccacaggaccgtggagtctggcctagaggtggcggcggcacccagcgtcacc
ccccaggctggcaccgcgctgctggctcctttcccaacacagagggtgtgctccaacccc
ccctgtgagacccacgagacgggcaccactcacacggccaccactgtcacttccaacatg
agttcaaaccaagaccccccacctgctgccagcgatcagggagaggtggagagcacccag
ggcgacagcgtgaacatcaccagctccagtgccatcacgacaaccgtgtcctccacactg
acgcgggctgtgaccaccgtgacgcagtccacaccggtcccgggcccctctgtgccgccc
ccagaggaactccaggtgtcgccaggtcctcgccagcagctgccgccacggcagcttctg
cagtcggcttccacagccctgatgggggagtccgccgaggtcctgtcagcctcccagacc
cctgagctcccggccgccgtggatctgagcagcacaggggagccatcttcgggccaggag
tctgccggctctgcggtggtggccactgtggtggtccagccacccccacccacacagtcc
gaagtagaccagttatcacttccccaagagctaatggccgaggcccaagctggcaccacc
accctcatggtaacggggctcacccccgaggagctggcagtgacggctgctgcagaagca
gctgcccaggccgcagccacggaggaagcccaggccctggccatccaggcggtgctccag
gccgcgcagcaggccgtcatgggcaccggcgagcccatggacacctccgaggcagcagca
accgtgactcaggcggagctggggcacctgtcggccgagggtcaggagggccaggccacc
accatacccattgtgctgacacagcaggagctggctgccctggtgcagcagcagcagctg
caggaggcccaggcccagcagcagcatcaccacctccccactgaggccctggcccctgcc
gacagtctcaacgacccagccattgagagcaattgcctcaatgagctggccggcacggtc
cccagcactgtggcgctgctgccctcaacggccactgagagcctggctccatccaacaca
tttgtggccccccagccggttgtggtggccagcccagccaagctgcaggctgcagctacc
ctgaccgaagtggccaatggcatcgagtccctgggtgtgaagccagacctgccgccccca
cccagcaaagcccccatgaagaaggaaaaccagtggtttgatgtgggagtcattaagggc
accaatgtaatggtgacacactatttcctgccaccagatgatgctgtcccatcagacgat
gatttgggcaccgtccctgactataaccagctgaagaagcaggagctgcagccaggcaca
gcctataagtttcgtgttgccggaatcaatgcctgtggccgggggcccttcagcgaaatc
tcagcctttaagacgtgcctgcctggtttcccaggggccccttgtgccattaaaatcagc
aaaagtccggatggtgctcacctcacctgggagccaccctctgtgacctccggcaagatt
atcgagtactccgtgtacctggccatccagagctcacaggctgggggcgagctcaagagc
tccaccccggcccagctggccttcatgcgggtgtactgcgggcccagcccctcctgcctg
gtgcagtcctccagcctttccaacgcccacatcgactacaccaccaagcccgccatcatc
ttccgcatcgccgcccgcaatgagaagggctatggcccggccacacaagtgaggtggctg
caggaaaccagtaaagacagctctggcaccaagccagccaacaagcggcccatgtcctct
ccagaaatgaaatctgctccaaagaaatctaaggccgatggtcagtga

Homo sapiens (human): 7702

Entry

7702              CDS       T01001

Symbol

ZNF143, SBF, STAF, pHZ-1

Name

(RefSeq) zinc finger protein 143 isoform 1

K20828

zinc finger protein 143/76

Organism

hsa Homo sapiens (human)

Pathway

hsa04980

Cobalamin transport and metabolism

Network

nt06538 Cobalamin transport and metabolism

Element

N01810

Regulation of MMACHC expression

Brite

KEGG Orthology (KO) [BR:hsa00001]
09150 Organismal Systems
  09154 Digestive system
   04980 Cobalamin transport and metabolism
    7702 (ZNF143)
09180 Brite Hierarchies
  09182 Protein families: genetic information processing
   03021 Transcription machinery [BR:hsa03021]
    7702 (ZNF143)
Transcription machinery [BR:hsa03021]
Eukaryotic type
  RNA polymerase III system
   Other transcription-related factors
    Others
     7702 (ZNF143)

SSDB

Motif

Pfam:

zf-H2C2_2 zf-C2H2 zf-C2H2_4 zf-C2H2_15 TFIIIA_zf-C2H2 zf-C2H2_8 zf-C2H2_aberr zf_C2H2-Disco zf_C2H2_17_2 Zap1_zf1 C2H2_ASCIZ zf-TRAF zf-C2H2_ZN142 Teflon_C FOXP-CC Zn_ribbon_CLPX_N zf_C2H2_ZNF292 MitoNEET_N

Other DBs

NCBI-GeneID:

NCBI-ProteinID:

OMIM:

HGNC:

Ensembl:

UniProt:

LinkDB

Position

11:9461012..9528524

AA seq 638 aa
MLLAQINRDSQGMTEFPGGGMEAQHVTLCLTEAVTVADGDNLENMEGVSLQAVTLADGST
AYIQHNSKDAKLIDGQVIQLEDGSAAYVQHVPIPKSTGDSLRLEDGQAVQLEDGTTAFIH
HTSKDSYDQSALQAVQLEDGTTAYIHHAVQVPQSDTILAIQADGTVAGLHTGDATIDPDT
ISALEQYAAKVSIDGSESVAGTGMIGENEQEKKMQIVLQGHATRVTAKSQQSGEKAFRCE
YDGCGKLYTTAHHLKVHERSHTGDRPYQCEHAGCGKAFATGYGLKSHVRTHTGEKPYRCS
EDNCTKSFKTSGDLQKHIRTHTGERPFKCPFEGCGRSFTTSNIRKVHVRTHTGERPYYCT
EPGCGRAFASATNYKNHVRIHTGEKPYVCTVPGCDKRFTEYSSLYKHHVVHTHSKPYNCN
HCGKTYKQISTLAMHKRTAHNDTEPIEEEQEAFFEPPPGQGEDVLKGSQITYVTGVEGDD
VVSTQVATVTQSGLSQQVTLISQDGTQHVNISQADMQAIGNTITMVTQDGTPITVPAHDA
VISSAGTHSVAMVTAEGTEGEQVAIVAQDLAAFHTASSEMGHQQHSHHLVTTETRPLTLV
ATSNGTQIAVQLGEQPSLEEAIRIASRIQQGETPGLDD

NT seq 1917 nt +upstreamnt +downstreamnt
atgttgttagcccaaataaatcgagattctcagggaatgacagagtttcctggaggaggg
atggaggcgcaacatgttacgctgtgcttgacagaggcagtcaccgtggcagatggtgac
aacttagaaaatatggaaggcgtaagcttgcaagcagtaacacttgcagatggttctact
gcttacatacaacacaattctaaagatgcaaaactcatagatggccaggtcattcagttg
gaagatggttctgcggcctatgttcaacatgtacccatacctaaaagtacaggggacagt
ttgcgtctagaggatggtcaagcagtacagttagaagatggtaccacagcatttattcac
cacacctccaaagatagttatgaccagagtgcattacaggcggttcagctggaagatggt
accacagcttatatccaccatgcagtgcaagtcccgcagtctgacaccatcttggcaatt
caggctgatgggacagtggcaggtctgcacactggggatgctacaattgaccctgacacc
atcagtgctttggaacagtatgcagcaaaggtgtccattgatggaagtgaaagtgtagca
ggtactggaatgattggagaaaatgagcaagagaaaaaaatgcagattgttttacaagga
catgctacaagagtaactgctaaatctcaacagagtggagagaaggcatttcgatgtgaa
tatgatggatgtggaaaattatatacaacagctcatcatctcaaggtccatgagaggtca
cacacaggagatcggccttatcagtgtgagcatgcaggctgtgggaaggcatttgcaaca
ggttatggattaaaaagtcacgtcagaactcatacaggagaaaagccatatcggtgttcg
gaagataattgtactaaatctttcaaaacttcaggagatctacagaaacacatcagaact
catacaggagaaaggccctttaagtgtcccttcgaaggctgcggtcggtcctttacaaca
tcaaatatcagaaaagtgcacgttaggacacacacaggagaaagaccttattactgcaca
gagccaggatgtgggagggcatttgccagtgcaacaaattataaaaaccatgtgaggata
cacacaggagaaaagccatatgtttgtacagttcctgggtgtgacaaaaggtttacagaa
tattccagtttgtacaaacatcatgttgtccacactcattccaaaccttacaactgtaac
cactgtgggaagacatacaagcagatctccacgctggccatgcacaaacggacagcccac
aacgacactgagcccatcgaggaggagcaggaagccttctttgagccgcccccaggtcaa
ggtgaagatgttcttaaagggtcccagattacgtatgttacaggtgtagaaggggacgac
gttgtttctacacaagtagccacagtaacccaatctggactgagtcaacaagttacactc
atatcccaggatgggactcagcatgtcaacatatctcaagctgacatgcaggccattggc
aacaccatcacaatggtaacgcaggatggcacgcccatcacagtccccgcccatgatgca
gtcatctcctcagcaggaacgcactctgttgctatggttactgctgagggtacagaaggg
gaacaggttgcaattgtagctcaagacttggcagcattccatactgcctcatcagaaatg
gggcaccagcagcatagccatcacttagtaaccacagaaaccagacctctgaccttagta
gcaacatccaatggcacccagattgcagttcagcttggagaacagccatctctggaagaa
gccatcagaatagcgtctagaatccaacaaggagaaacgccagggttggatgattaa

DBGET integrated database retrieval system