Lag0041347.1 (mRNA) Sponge gourd (AG‐4) v1

Overview
NameLag0041347.1
TypemRNA
OrganismLuffa acutangula (Sponge gourd (AG‐4) v1)
DescriptionDrug/metabolite transporter
Locationchr13: 16168173 .. 16188303 (+)
Sequence length1629
RNA-Seq ExpressionLag0041347.1
SyntenyLag0041347.1
Sequences
The following sequences are available for this feature:

Gene sequence (with intron)

Legend: exonCDSpolypeptide
Hold the cursor over a type above to highlight its positions in the sequence below.
ATGGGAGCGCCATTTCAATGGAGCTCATCTCTTCACGCTGCTCCGATCAAGCTCAAATCGCCCATTTTCCTACCCTCGCCATCCAATTTCATCTACTATTATTGTAAACGATCTCGTGTCAATGATTCGTCAACTCGTCGTGGCGCTGTTTGTGCTCAGAACTCCAATTTGCCGCGGCCTAAATCCACGTCCACCAACTCCGATGCTCCGAGTTCGAAATTGGTCGTTCTCGGTGATTGCCAAGGGAACGAGGTTGTTCGAGTTTCTTCGACTCCGATTCGACGGCGTAAAAGTGTGATTCTGTCTATAGTGTCTTTGTTTGATAAACGTTCTCTTTGGCGAAGGATCTTTTTTGCCTCCAAGAAAGTTAGGAGTATCATTCTGCTCAATGTCGTCACGATTGTTTACGGTGAGCTTCTGTTTAACCCCCCCCACTCTTCTATTAGGTCAGTTGTTGATGTTGTCGAGCAAATATGTAAGATATATCTATGCTGAAGCGGAATTCGTACACGGCTATTCTTGAATTATTTCATTAAAACGATTCAGCTTTTTTCCTGATTCTCCGGGGAGACGAGACTTTGTACTACTTTTCATACTATTTCTGCTGTTTGCTTTGAATTTACACATAGTAAGAAGAGTCCACTAATTTAAGCTATTCCCGCGGAATGTTATCTCAAAGTTGGGATCCATTTTTCTTTGGCAATCAACTCTCTCATGTATTTGGACTGGAATTTTGTTGTGTGCTTTATTCTTGATAGTTGCAATGCAACCATGATATTCTCCTATCACCTATCATATTAGGTCCATGCTTTGTTGGCCAACATTGTCAACATGGCATCTCTGTAGAGTGTCGTGATGTATACTATTCTTATAAGTTTGTGAAATTCTTGTGAAATATTAATCTCTTAGGTAAATTACTTTGTACTTTCAGTTATCTTAATGAAAGCTGGTTTCTTCTTAAAAGAAAAAGAAGACAATTTTATTCCTACTAATAAAAATGTTTGCTACAAAAGTCTTGAAGTTTCCTTCTTTTTCTATGATAAGAAATTCCTTCAGTTCTTCAACTAAAATACCATTCCATATTTTCAAATCTTGGCTGCTGTAGCTAGCAGTATTCCAGTTGTGAAAGAGGTTGAAGAATTAGTGGATCCAGCAACCTTCAATGCCGTGCGATTTGCCATGACTGCTATTCCATTTGTTCCACTTGTATTGTATGAATGGGATGATGTTGAGACCCGTAATGCTGGAATAGAGTTGGGTTTCTGGGTTAGTCTAGGGTACCTGATGCAGGCATTTGGACTTCTTACATCTGATGCTGGGCGTGCATCCTTCATATCAATGCTCACGGTGAGATTCTGAATTATATGTAAGGTATACATGGTGTAGTAAATTTTCTTGACATAATATTCTGTATTAAGGTACTTGTGTATCAATAATCAGGTACTTGTAGTTCCTTTTCTTGATGGACTTTTAGGGGCTGTAGTTCCTGCTCGTACCTGGTTTGGAGCTCTCATGTCTGTCATTGGAGTTGCAATGCTGGAATCCAGTGGATCCCCTCCATGTGTATGTTTAGTCTCAAAATTATTTGATTACCAAGTAATGAAACTTGTAATAATTGGTAGAATCTAATCAGACATTTTTAACAATTTCTGAATGCTCTAAAATTGAGATTTTGATATATGGTATAGATAGCCATTCAACTAATTCGTATGATCTAATTCAGGTGGGAGATCTTTTGAACTTCTTGAGTGCAATATTTTTTGGTGTGCATATGCTTCGAACAGAGCATATTTCAAGACGTACAGACAAGGATAAATTCTTACCACTCCTTGCTTATGAGGTTAATATTTTCTCATATATAGTAGATACTGGGGGGCAGAAATGTTAGTTTTGGTGCACAGTTTGAATGATTTTAATTACTTCTTCAGGTTTGCGTTGTTTCTATTCTATCGATGGTATGGTATTTTATTTGGAGATGGATTGATGGAACTGAAACAATTAGCGAGTCATGGAATTGGAAAACATATTTAGATTGGGTGTTCATGTTTCCTTGGGTACCTGCTTTGTACACAGGCTTATTGTCCACTGGTTTTTGCCTGTGGCTAGAGGTATGCCTTCTCATTTTGTCTCTCTATATAACATTTTTATTAGAGTTTTGCTTTTCGTTTGAGTTGCTATTCAATTTTACTGATCCTCTGTCTTGAGCGTTTTTGCTTTTCTTGTTGTATTCCTTTTGTAACTTAATTGAAATTTACTGTGCTGCAATTTGTAATGCTTATATAGAAAAATAGAATGAGAAAAGCTATTATCAAAAAAAAAAAAAAAAAAAGAAAAAAGAAAAAAGAAAAAAAGAAAAATAGAATGAGAGAAGCTAATTGTATTTAAGCATACATTTTTCTGTGAACTTCTTGCTCATGGCTGCACATATTTATGAATAAAGTTTGATGTGAAAAACCCTAGAGAATTATTATTAGCAATCCTTTGGGTATATGAGAACCCCTAATTCATAAACTCTAAAACCCCCAAATCAATTTGGTTTCATTCAATCCTAAATGTTGGATTAGAAACAGATTGCCTTAAGATCAAATGTTTGAGATAAAGAACAAGTTCCCTAACTCAAGAGTCAAACACTCCACAAACAGGATGAAAAGTCCTACTTGAAAGTTCTTTGGCATGCAACTCAAGACCATAATTGCCATGTATGAAGAAGCTCTTAGTTATCTTGAAAGAAAATCTCTAGGCTACTAAATTTTATTAATCATCAAATTGTCAATAAAACATCCTAATGACACGACTATACATAGCTTCCCAACTGTATGTATATATCCCTTACAATGTAGGATTAGAGTTTCCTAATTCAAATACCTAATGATTGGCCCACATGGGCCAACAAAGTCTAAAGTAAACTAAATAACACTGAGGTCCACAAAGGCCCAAAGTTTATAAAATAAAGTACAATCCCTATTTGACGATCATAGTTAAAAGACATTAATGCCCCTACCAAATACATCAAACTAGGGGTAAAATAGTAAATTGGAATGGTCGTGATAATTGTGTATCCTGATAGACCTCCTATCAAATATGTGTATAGCAGAAGACGTAAGAAAAGTAAGGGTGGGGACCAGTAGTATTCTGTTAAGTAGTTGGAGTCTGTTATGGGTAGTTTTAGATACCTATATAGTTAGGAGTCTGTAGATGGAGAAGATACCTTTTGGCTAGTCAGTTGTAGTGGGTCAAGGTGGAGAGATTAGGAAGCTCTCGAACTCTTTCCAGGGTTGTAATCGATACTTGTTCATAAATAATATCGAGATTCTATCATTTTGGTATCAAAGCAAATTTTTTTTCCTTTCCTGATTTCCAATGGCGACTTGTATGGAATCATGAATGGAAGCTCTTGAGACAAATTTGGCTTTACAGATGAAGGATATAACTGCGATACAAAGTTCCATGGGGAATTTTACGGAAATGGCTTTACAAATGAAGGAAGGTTTTTTGGCGATGATGACTTAGATCGAAAGTTTGAAGTCCGAGAAAGGTGTTTCTAAGAAAAAGCAGGCGAAGAAATTTGACGAAGCAGCAAGTGCGGTGGTTCCAGTTGAGGTTGCGACCGTCGATCCGCAGGCTCAATTAACCAAAGCATTGGCTCCTGTGTTTGATCTTCGACTACGGAAACTCGAGATTCCAGTGTTTTCTGGAGCGAATCCGTATGAATGGCTTCACCAGGTGGAAAGGTATTTTGTGGTTAATCGGCTGACCGATTCTGAGAAAGTTGAATCGGCGGTACTCTGTTTGGATGGTGTAGCTTTGAAGTGGCATTATTATGAAAAGCGTCGACGTCCAATCGACTGTTGGGAAGAGTTTTGTCGGTTGCTTCTTAAACGTTTCTTGCCGACAAAGGAAGGTAGCCTTCACGAAAGGTTCTTTGCCCTTAAACAAGAGTCTACTGTTGCTGAGTATCGGGAGAAGTTCGAAGACTATGTTGCACCTTTGGATAACTTGGACAATGCTACTCTTGAAGGCAAGTTCGTAGATGGGTTGAAAGAAGATATCAAGATCAAGCTAAGAGTGGCTAGACCTATTGGGCTTGATATGACTATGGAGACGACCCAAAAATTAGAGGATGAGCTTCTTCATTTTGAGGAAAAATATTTTGGGGCTCCCTTCAATCCTAAATCTTCGGCCTAAGCAAGTACAACTGTGCAGTCTAAGTCCGCTACTTACGGGGCAGGGTCTATAGCCCAAACAATTTCTGTTAACCCGAGCAAATTAGGCTTCATTTTTCGAAAGGAGTTTGCTATGAAACATTCTGAAGTTCATTTAAGAGATTGACAGACTCAGAACTTCAAATCAAAAGAGAAAAGGTGCTCTGCTTTCATTGTGAAGAGAAATTTTTTCATGGTCACCGGTGTAAGAAGAAGGAGCTTCAAGTAATGGTGGTTCAAGATGAAGAAACAGTCTTTGATGAGCAAGTAGAAGATGTTGCCATGCAGTCTGCAGAGTTGGCTGATGACAACATTCTGCCTACAGATGATCAAGAGAAGGTTGAGGAAGTTGCTTTGCATTCTATGACCAGTGTGGGCTCACCGAAGACTATTAAACTAAAGGGGTTGATCGATGCTACGGAGGTGATCGTCCTTGTTGACAGTGGTGCAATCCATAATTTCATTGCCTTAAAGTTGGTACAAGATTTAAAGTTGCTGATGAGTGATACAGATGGGTATGAAATTTATTTTGGGTACTGGTTTGTTGGTTAGAGGTGCCCAAATTTGTAAAGATGTTGTGCTTTCTTTGGGTTCGGTGACCATTGTTTAGGATTTTCTGCCCATTGCTTTGGGTACAGCGGACGTGATTTTGGGTGTAAAATGGCTTGAAACTTTGGGAGACGTTACATCCAATCATCAGATCTTACTATTGAGCTTTACGTTGGATGGTTCTAAGGTTGTCCTTCACGGGGATCCATTGTTAGTACGATCTCAGGTCACGTTGAAGTCTTTGACGAAAACTCTGAAGTTAGAGAAGCATGGTTTTCTAGTTGAGTTTAGTGCCTTGGAAAAACTCGCCTATGACATGGTTAGACTGTGGGATGATGTCCCTTTGGTGATTTGTTCGGTATTGGAGAGTCATGTTTCGGTTTTCCAACCTTTGCCTGGACTCCCTTCGAATCGTGAGTTGGATCATGCGATAGAATTGTTTCCTAGTACAACCCGGTTAATGTTCCACCATTTAGATATCCTCAGTTCCAAAAAGACGAGATTGAAAAGTTAGTTGAAGAGATGTTACAAGCTGGGATTATATAGCCAAGCTGAAGTGCGTTTTCAAGTCCTGTCTTGCTGGTAAAGAAGAAGGATGGAAGTTGGCACTTTTGTATAGACTATCGAGCGCTCAACAAGGTCACTGTTCCAGATAAGTTTCCCATTCCTTTAGTCGATGAATTGTTAGATGAATTATTTGGGGTTGTGATTTTTTCTAAAATTGACCTCAAATCGGGTTATCATCAAATACGGTTAAGGGATGAGGATGTACACAAGTCGACATTCTGCACACATGAGGGTCACTATGAGTTTTTAGTAATGGCCTTTAGTCTTAGAAATGCCCTGTCCACTTTTCAGGCTATCATGAATAGAATTTTGCGTCCTTTTTTGTGGAAATTTGTGTTGGTGTTCATGGATGACATTCTGGTTTATAGTCGAACTATTGCGGAGCATGCTGAGCATTTGCATTCAGTCTTAATTGTTTTAAAGAACAATTAGTTGGTTGCTAACAAGAAGTGTAGATTTGCGTTGAAACAAATTGAGTATTTGGGTCATATAGTGTTCAGGAAGAAGGGAGTTTCTGTTGATCCTTCCAAGTTGCTTGCTATGGAGCAATGGCCTGTCCCTAGGAACATCAAAGAGTTGAGGGCTTCTTGGGGTTGACTGGCTATTACCGGAAGTTTGTGGTGAATTATGGAACAATAGCGCATCATTTGACCCAACAGTTGAGGAAAGATAGTTTTGCGTGGAATAATGACGCTATGGATGCATTTCAACAACTAAAGAATGCCATGATGACTGTTCCTGTTTGGGGTTGCCTGATTTTACCAAGTTATTCGTCATTGAAGCTGATGCTTCGGGTGTGGGTGTTGGGGCAGTCCTTGTTGGGTTTTATGCCCTAAAACTCGTAGATAGTAAATGTAACACTTGACTTGCTTTAATGAAGTATTATTTCTATATATATTTGTTTTGCCTATATATAACCACAAATCCAATAAACTAAGAACCTCTAGCTATATTATGTATACTTGAAGTTTGTGTATGACATAAATATGGATCAAGTTCAAGTAAATAGCCTAAATGATTAGTACATGGATAAGACTGGGTACCTTAATCCTGGGGACACTATTGGTGCGGCTCGCTTTGTTTTCTAAAGACAAACGATGTGATCCTAATTGTTCATGTATAAGACATGTGAGTGAGGGCGTCCTATGCAATGAGTTTGCATAGAGATCAGACCAGGAGATAAGTCACTTTCATTTTACAACACCGTTTACTGCTGAAACTGAATATCTCATACAAAATGACCTAGGTAACTTGATCTTAATCCTGAGCTAACTATGAACTCCTGTTTATTTAGGATTGTCCTTTGATTTGCATAGGTGAGAGTGACCAATCATCGCCGACTCAATAAGCCTACCATTTTGGGGATGAGACTGAATAGATAGCTGGGGACATAGCTTTGCAAGATGGAATTCACTGCTATCCGTTTTAGGGTTAGTAAGAAGGTTGTTCCCTTAAGTACTGACTTTGAGTCTTGAACAAGGGCCCTGCCCTCTCATAACCTTGAGAGGAACTTGGTTCAGTGATTGTATCACGAACTAATTGTTCATTAGAGGATCAGTGGAACTTAAGGATCAAGATGTAGCTATAGGGGTAAAACAAACATTTGACCCAACTCTAGTTACGAACAACCGATGAAGGGTCGACTTATTAATCATGGTTATTTCGAGTGGACAAGAAATATATCTACAATGAGGGGAGTGCCACTACAGGCTATAGTGGAGTGTCCGGAAGCTAACGAACGTTGAATAACTAGGTTAATGAGTTTAATCGGTTATACTCGTATTGTTGGAGCCCATGATCTGTAGGTCCATTAGGTCCCTCTACTAGCTCAATAGGAATAAAACTTGGAACAATATGATAGGCTAATATTTGAAATGTTCAAATTCGGAATAGGATACAAAAGTCGGTTATATACGATATTTAACGACATATTGGTTTAATTTCGAATTAAACGTAAAATGAGAGTTGGTTATATTTAAATCTGATTTAAATATTAAACATGTGAATAGAGATTCGTGTTCGAGAAATTTTGTTTGGAGAAAAGCTGGGATTGAGCAAATAATATTAATTTAATATAAGATATTAAATTAATTAATTTTATTATTATTTTAATTAAATAATATTTTATTTAAATTAAAATAAAATAAAATTAAAATTAGAAAGTGGGAATTTTCAGATTATTTAAATTAAAAACAAAATTAGAATTTTGAATTTTGGAAATTAAAAATGCCTAATTTTTGAAGGTGGTGGGTTTTGACTAAGCTCTTAGCTCAAGCCCTTCTTAAGACACCTAATTAATCTCCTATTTGGTGTCAAACTCGGTTGAATCTTTTTTGCATGTTTTCTTCTATATATACATGCTTGAATGGTGAAGAAATATGGATGATCAATATTGAAATGCTGCTGAAATTCTCCCAAACTCTCACAACTCTCAAACCCATTGTTCAAGCTTGAACTTCAAGTTTTCCTTTCCAATTCCTATCAATTAAGGATCCCACAATCCGTTCCAAGGCCTGAGGATAGTAGAGAAGATCCAAGTGGTTGTCCAAGATCCATTGGTGTGAATATTAAAGCCTCAGATTACACGAATTGGGAGCTACAAGAGGTAGGTGCATCTTTGCTTTGTTTTTCCTCATATGAACAGCATGTGTTCTTGGATCAAATTGATGAAATTGTGTGCCGAAGATCCAAAATTGCTTCCGCATGTTTGATATTAACTCCTACAGTCCTTATGCAAGAGGGGCATCCTATTGCATTTTTTAGTCATGCCTTATCTCCTTTACACAGGAACAAAGCGGTATTCGAGCGTGAGTTGATGGCTATTGTAATGGCTGTCCAAAAATGGCGCCCTTATTTGCTAGGACGAAAATTCTTAGTTCGTACGAATCAAAGTAGTCTCAAGTTTATTCTAGAAGAACAGAGACTAGTAGCTAGAGAATATCAGAAGCTGTTAACAAAGTTGATGGCTTATGACTTTGATATAGTTTACAAGCCGAGGGTTGAAAACAAAGTGGCTGATGCGTTATGAAGACTTCCTAATGCAGTAGAATTTGCGACTGTTAGTGTAGTCGAGGGGCTTAATACTGGGCTTATTTTTGATCAGCAAATGGAATTTGTGAAACTCAGCTTGATTAGAAACAAAATGTTGAAGGGAGAAGAGTTTCCCACGGGTTATTCATTGAAGGGGTTTGTTTTGTATTACATAGGACGGATTGTCCTTCCGGAAGATTCACCAACTATTCCCTTGTTGTTAGAGGCATTTCATTCTTCGCTTGTTGGGGACATGGTGGGGTTCTTCGTACTTATCAAAGGTTGGCACGAGAAGTATATTGGGTTGGTATGAAAGCAAGGGTCAAGCTGTTTATTGTTGAATGCACAGTTTGTCAGCAAGCCAAATATTTGGCGTTAGCCCTTGCTGGTTTGTTACAACCTTTGCCTATTCTGGACAATATATGGGAAGATGTGTCGATGGACTTTGTGTTTGGGTTGCCTAGAGCAGAGACTTTTGATTCGGTGTTGGTTGTGGTTGATAGATTGTCAAAATATGCCCATTTTATTCCTTTGAAACATCCATTTTCTGTAGTTTCCATTGCTCAGGTGTTTATTCGAGAAATTGTGCGGTTACATGGGATTCCTCGTAGTATTGTATCAGATTGTGATCCTGCGTTTACAAGTTTGTTTTGGGAGGAGTTGTTCAAATGGCAAGGGACTAAGTTAAAGAGAAGTACAACTTATCATCCTCAAATGGATGGGCAAACGGAAGTTGTTAATAGAGGACTGGAGGCTTATTTGCGTTGCATTGTAATACTAAATGGGTTCGTTGGTTACCTTGGGCTGAGTTTAGTTACAATACGTCCTATCATTTTGGGATGAAAACAACTCTGTTTGAAGTAGTGTATGGCTGCCTTCCTCCATCTATTTTGCCATGTGTGGTTGATGGATCTCCTGTTTTGGAGGTGGATAAACAACTAAAAGAGAGGGATGAAATGTTGGTTGTGATCAAGGAACGATTAGCTTATGCGCAACAATACATGAAGTCTTATGCAAATGAGAAGCATAGGCATGTGGAGTTGTCTGTTGGGGATTGGGCCTATTTAAAGCTGCGTTCGTACAGACAGGGTTCGGTGACTAAGTTCTATAATTCGAAGTTGGCACCAAGATACGTTGGCCCCTTTCAGGTTGAAGCTAAAGTGGGGAATGTAGCTTATCGTCTGACTTTGCCTGATAATGCCATAATACACCCGGTTTTTCATGTTTCTCAACTATGGAAAGCACTCGGTCATACGTTTCCAGTAACACCATTTCCTCCCAATATGTCTCCTGAGTTTGTGTTCAAAGTATGACTGTTGGGTATTCGTCAGTCATCGGAGGATTCTTCTAAGCTTGAAGTTTTGATTCGTTGGGAAGATATGGAAGCATCTGAAGCTACATGGGAAGATGTTGTGTGGATTACAAACCAGTTTCCAGAATTTCGTCTTGAGGACAAGATGGTTCTTTGGGGTCGAGTAGTGATAGACCTCCTATGAAATATGTGTATCGTAGAAGACGTAAGAAGAGTAAGCGTGGGGACCAGTAGTATTCTGTTAAGTAGTTGGAGTCTGTTATGGGTAGTTGTAGATACCTATATAGTTAGGAGTCTTTAGATGGAGAAGATACTTTTTGGCTAGTCAATTGTAGTGGATCAAGGTGGAGAGATTGGGGAGCTCTCGAACTCCTCATAGGGTTGTAATCGATACTTGTTCATAAATAATATCGAGGTTCTATCATATCCAAACATCCTCCATGATAATTGGGATGCCTTTATTTTTCATTTGATTTTTTTTTTGAAATTTTCTTTCACTTCCTCATGGAGTTTGTATCTTTTGAGCATTCGTCTCTTTTCATTTCTTCAATGAAAAGTTTTGTTTTTTGTAAAAAAAAAAAATCCTCCATGATGTAATCCGATGGTGATGATTGATGGAATAGCCTTGATCTCTTGATCTCCCTAGAATCGAATGAAAAGTTGAATTTGGTGGGGCTTTCATTCTCCATGAATATGGTCCATCACATCATTTGAAGATCTTTTGATCCTTTCTTGTTTGTTCCTCCTTATAGTGTCTCTTGTAAAGCAAGCTTCCTCTGGAAGCTTGAATGATCAAAGTAGGCCTGGTACTTGGTTTGATTTTCAGTTTGGACTTGAATCTTCTTCCTTGGTTGGAGTTGAATATCTTTTTTGTAGTTGTCCAAAATCCTGACAAGTCCCCTGGTGTGTGTTTGAGAGGAAGAGGTTAAAGGGGATAAGGACGGAGAATGTAAAAATGAGAGAGCAGGGACCATGAGGCGTGTTATGGAGTTATTATAATGGATACAATCTCGGGAAGTAGTTAATTTGAAGAATAGGAAGTTTTGTTTGGGGTTGAAATTGGAGGAAGAAGGTGGGTTAAGCAAATAAGCCTTATTTATTTTAATTAAAAAAAGGATAAATGAAAGAAAAGAGAGAGCCAAAAAGAAAAATAAACCTTTATGTTGGCAACTAACTACAAAAAAAGGTTACTATAAAGCGCTCTAGTTGTTGAGATTAAGAAATAAAGGATAATCATGGAACTCCTTGATTACAGAAATCTAAAGAGTGACACTGAACCAAGCCAAAACCCACAACTTTCCTTAAGGATGCTAAGTGTCTTGGGCATGATTGTCCAAGGCAAGTTGTGCCTATGGCCGCATGTCCAACCTGTCCTCAACGGCTCAACCACCATGTTTTTACATCATGTAATTAGTTTAGTTGTTTGCTTTTGTTTGTAACTAGTTTTGGGGTGTATGACTCTTCAAGATTTTGATGTTCATGCTTGCCAGGTTGAAAATGCTCAAAATGTACTATGGGAGGACCAAGCGATCAACAAACCTATCCCTGGTCAAGTGTTGGACTTCCTTACAATCAAGTTTTCTTGCATCCATTGTCTACCATACTTTCGTTAAAAATGTTTTCAAATGCCTTTTCTCTCTCATGTTTTATAAAAAAATTTTCTCTCAAAACATGAGTGGCAGCTAGATCCTACACTGAAGTTGTCCACGATTTATGATTTCTACTTAACTGTCTTGCTTACTGAGTTGGAAGCAAGTGTTGCACAATCACCTGTCCCTTGATCGAAAGTTAGCGATTGTGACAAGTGGCTGTTGAACAATGCAAAAAGGACACTGTCTCCAAGAAATAAATGTTGGTTGTTGTTCATTGCTTCAAAGCATGGGTGCAATATTTGTTGAGATCATGTTTCATAGTGAGAGTAGACAACCAGGGCTATCTGCCACTTCTTTAATAAGCCAAAATTGACCTCAAAGGAAGCGCGGTGGCAAGAGTTCTTGGTAGAGTTTGATTTTAAGTTTGAGCACAAGACAGAAAAGAGTTATCATATACATCTTGGCCCTCCTTTCTTTGTTAGAGGGGGTAAGCCTGAGACCGGGTAGGTGGGATATTCACTTTTGGAGTCCCAACCCCTCTAGGGGCTTTTCTCTGTTCGTTGTTTCAATCCTTGTTAAATCCCTCCCCGGGTAAAGAGTCTGGCTTCCTGTGTCTGTGGAAGGTTAAAGTTCCAAAGAGAGTTCCGTTCTTCTGAAGGTAGGAGACCACAAGACAATCTTGGTTATCATAGATTGGTTTTCTAAGTATGCCACCTTTATACCAACTCCCCAAAATGATGTTTGACCGAACTGGCAACCCAATTGTTCTTCAAGAACATTATAAAGTTGTGGGGGATTCAGTGTTTCAAAAGGCCCGCCTAGGCGCAATGCGCCCCCTTAGCGCCTCGCTCCGAAGAAGCGAGGTGCGATGAGGAAGGCGCGACCAAGGCACGCGCCTTCCTCGAAGCCCTTGAGGCGCACGCCTTAGGCGCCTCTGGGGCTTCACATTTATATATATTTTTTAAACCTAAAAACTTGTTATGATAGTAAAATTTTAAATTTAGCTTCTGGGGCGTTGCCCCCGAATCCCTATCAGAGTGTCAGATATCAGATTCAAGACATATCAACAATACTAAACTCACTGTTTTTTGTGGAGTATTGACATTTGACTCTATGTTGGAAGACTAATATTTGAACCTTGTTTATCTTTTATTTATTTTTCTTGGTTAAAAACTTCATTACTTGCCATGAAAGTGTTTTATATACATGTATATATATATATATATATTTTTTTTCTATATAATGCGCCTTAAAAAAAAGCCCGTGCCTTTTTGTGCACCTTGTGCCTAGGCCCCAGGGGCCATTGCGCCTTAGTGTGACCTTGGGACTTTTAAAACACTTGGGGGGGGGGGGGGGAGAGATTCCATTGAGCATTGTGAGTGACAAAGACGACAAGTTCATCAGTACATTTTGGACAAAGTTGTTTGCGTTCTTGGAGACGAGCCTGAATATATCCTCAAGTTATCATCCACAGATGGATGGCTAGACTGAATATATCCTCAAGTTATCATCCACAGATAGATGGCTAGACAGGGAGATTCAATTGCTTGCTTGAAGATACTTGCATCACTTTGTTGACACTCGACAAAAGAATTGGGCCCGTTTTGTTGCATCTTATGTCGAAAGGCCGAGGAAGATTTGAACCATATCTTGTGGAATTGTCAGTTTGCCCGTTCGGTGTGGAGTTTCTTTTATGATGCGTTCGGGATTCAGGCGTGACGATTTAGAGACTACATGGAGATGATCCAGGAGTTCCTCCTCCATCCGCCTTTTCGCGATAAGGGGAGGTTTTTATGGTTAGCGGGGGTGTGTGCTGTTTTATGGGGTCTTTGGGGCGAGAGAAACAATAGGGTTTTTCGTGGCATTGAGAGAGATTCTTCTGATGTTTGGGCTCTTACTAGATTCTATGTTTCTCTTTGGGCCTCAGTGTCCAAGGCTTTTTGTAATTATTCTCTAGATTCTATCATTTTGAGTTGGCGGCCATTCCTTTAAGGGAGGCCTTTTGTGGGCTGGTTTTTTTGTATGCCCTTGTATTCTTTCATTTTTTCTCAATGAAAGTTGGTTTATTCATCAAAAAAAAAAAAAAAAAACATATAAAGAAATGTCTAGACAAGAAACGTTGCTCCCTTGAATTTCGAGCTGGAGAACAAATCCTCATAAAGCTAAGACTAGAACAGATTTGATTTCGCAATCGAAAGGATTATTGACTTGTAAGTATGAAGGACTAGTGGAAGTTCTTAAGAAGATTGGACCACCTCGTATAGGGTGGGTTGCTTGCATGAACAAAAATTCACCCACTCCATGTAAGCATCTTAAAACCCTATCACCTCGATCTAGATGATGATTGCAGGAATGCCTTTGTTCGACTTGACATCGACTTGAAGCAGAAAGAAGACAAGGAAGTTGAAGAGATCATGGCTGAGAGAGTCAGGAAATTGGAAGACCCACACGAGGGGTCCAAAGATTCCTTGTCAAATGGAAGGACTTCTGTTAGGCCACCAATTAAGAACGTGTATGTTACAAAGAATGAGTGGGGAGAAAAGAAGATAATTGTTGGAGATATCAACAATTAATAGGTTTGCTGTTAGTATTCTGTTTACCATCCATAACAGAAACCCTTACTGACCACTAAAACCCAAAAGACAAACAACAAGGCTCATTGAAACTGCAAGACAAACACCCCAAACTAACAAAAAAAAAGCCAACGAACTATATCTTCAGCTTGAATCATATCTAGAGATGTCCATTTTTCCCATGAGGGGGCCCTGGGGAACCTACCCCTAACGGGGTGGGAAGTCCTCGTTTAGACAGAGAATGGGGAAGGGAGTGGAGGAAAACAATTCCTCATGATCTAAACAGGGACGAGGATGGGGAATGCATTCCCATCTCCGTTCTCTGATCTCCGTCCCATTTATTTTTGTCTTTTTTTAATCTATATATATATATATATATATATATATATATATATAAATTTAAAGTTTTATCGTTAATGATTTAAATAATTGGATATGTTTGAATCATATGTATGGATAATTAGATAAGGAGTCTTAATGTGTTTTCATTAGGAGGTTTAAGAATTTTATCCTTAAATAGATTTTTTTTCCATAGAAAATTAACTATTTAAATGAATATTTTCCATGAATAATTAACTATCTAATTTAAAATTAATGGATATTTCCCATGGAAAGTTAACTATTTTAAAATGGATCAAAAGAATTATTTGATTTAGTTGAGATTAAAAAAAAGAAGAAAAAAAATTAAACAGTGAATAATTCCTGCGGGAACCCGATTGCCACGCCCTGATCCCCACAAAATCTAACAGGGAGAGTTTTGTGGGGATGAGGATTAAAATGAGGTGCCGTGTCTCGTGGACATCTATTCATATCTACTTGAATACCAATGGTATCTCTTTCCATCCATACATATTCATATCTACTTGAATACCAATGGTATCTCTTTCCATCCATACATCAGCACTGTATAAAACACCTCAAGCCCCAACCCGAACCACCTCATCAAAGTCAAAACCATTAAAACAAACACAGCTGGCCTTATGGAAATAACGTCTTCAAATCCATCAGCATCTCCGAATCAGAAATAATGTTTCCTACTTTTTTATGGCCTTTTGTTTCCTAAAAACAATATCTGTTACATAGTTTTTTAACGAGGAATAATAAACGTGAGTACTTTTCCCTTCCACCTGAAAATCTACAAAAATTAAACTTTCATGCATGCATGTGTGTATGTATAAATACTTTGTGGAGTAAATTTTGAGCTTCTTTCATTCGCTTGATAAAAGTTATCTTTTGGATAAAAAAAAAAGGAGTTAATTCTAAGCCATGGTTTCTTAGCAATGTATTATATGATTCTCCAGATGGCTGCCATGTGCGATGTATCAGCCACAGAAACTGCCATTATTTACAGCTTGGAGCCAGTCTGGGGCGGTAGTTTTGCCTGGTTCCTTCTTGGTGAAAGGTGGGGATTGACTGGCTGGATTGGTGCTGCCCTTGTGCTAGGTAAACTTACAAAATTTAAAAATTCGTGATAGGAGCTATGCTATTTTTCTTTCTGCTGGGTAAGAACAAATACTGACCAAGGAATTTCTACCTTTGGACTGGCATCATTTTTCGCTTTCCTAAATGTTAACAGAAAGAACATGTGAAGGTTCTTGCCGACTTTTAACTTTTGCGTGTCTTTTTCCTGTATTATTTAAGTGTTTTCTGCTTGATAAAACTGCAATATAGCAGCGGGCTTATGTTTTTCTTTGCCTGACAGTTTGTGAATTGTGCATTTAAAATAAGCACTATGAAACTACTAATTAAATTTTGGTTAAATTACAAATTTAGTCCCTAAACTTTGAGGTTTGTATCTATTTGGTTCCCTAACTTTCAAAATTACAAATTTAGTCCTTGAACTTTTGATTTTTTTAAAATTTACGAATCTATTAGACACAAAATTGAAATTTTAGAATTCCATTAGACATAAATTACAAATTATATCTAGATTGATTAATTTTTAATAATTTCTAATTTGTTAGGAACCTATTAGACACAAAATTGAAAGTTCAAGGATCTCTGAGACACAAAATTAAAAGTTTAGGGGCCTATTAAACAATTTAAAAAGTTCAGGGACAAAATAGACACAAACTTCAATGTTCAGGGACAAAACTTGTAATTTAACCTTAAAAGTTCAATGCTCCCGAGTTTCTTTTTCTCCTTAAAAAAAGAGGGGATAGGAAAGAAAAGTTCAATGCTTTTTCTTAAAAGGTAAATTTGTGGAGATTGAAACAATCAAACAAACGATGCAAGTAGAGGATATGGGGATTCTTTGAAGTAAAGACAAACCTTTCGGGATTATCTGCAAGTATAGTTCAAAGCTTTTTCCAAGTTAAAGATTTTATTCAGATGTTGCGGGGGACTATTTGTAACTTCACTTTAGATTTGTTACTTGCTGTAGGATGAGATGCTTTTATTTTAATTTTCTTTCGTTGTGATTGGTAAACATTATTCCTTAGTAATGTCATTAAGATTTTTATTTGAAAGGTTAATTATGAGTGTCCAATGGATCTTTGAGATTGTAGAATGCAGGGGCAAACTACACACACACGTATATAACTGAAGAGAAAGAAGGTAAAATGATAGAATATAAGAGGATGAAAAGGATCAAGAGGCCAAAAGGGGGCCTCAAACAAAAGTTCAAGGAAAGATGCTATTCAGTAATCAACTTTGCTTATAGCCTTCTTAAGGGGAAGCTCAATCTGCTCGTCCTTTGCAAACCTATCTAGAAACAGAAAATGATTGGATAATAGTTTAGACTTTGAAGCTGTTGGTCATAAGCTTTAAGCTTCAGTAGTTGGGGCTTGGTTCCATAGGAGCATAACTGGCTTACTAGCCATTATTCTTGTTTTATTGGGTAGATTGAGGATATATTTCCTTTTCTGAGACACTTATGCCTTCCTTGGATTTGGCTGTCTTCATCCCTATGAAATATTTGAGTGGTTCCTAATCTTTAATTTCAAATTGTGCAGCTAATAGTTCTTTTAGTTTTTGCATTTCATCTTCATGATTTTCAGGTAGGATGATAGAGAGCATTGCATCTTCATAACAATTATCTTACTCATCACTGAAGATACAATGCTCTCTATCTCTCTCTCTCCTCTCCCACATCCTTTTCCTATCTACCATTCATCAATTGTCCCACAATGTCCCTCTTGTAGTTTGCCTCGTCTTTGTATAGGGTTCCCGCCCTTGATGGGGTCAAATGTGCGGCTGGGCACAAGGTGTTCATTCTTGACTTTGATAGGAGAAGTGGTAAGGGAAAGTTTTGCTCAGCGGAAAGGGGCAGCAATACAGCATACTCCCATTACTCTTGAAAAGTCTGAGTTAGTCTGGCTTCTGGCTGGGTACCTTCTTAAAACAAAAGTTGTTTAGAAAAATGGCGATCTAGAGCGTCTTCCTAACAGGTGTATTGGATTATGAACAAAAGAATAGCTGACTGCACTGAAACATTATCTTTACTACTCCTCTGGACATAAAAATTCTGCATTCATTTGAATCAGATATGGTGTTCATACCCACCCACATCTACTTTGCAAGACTTTACAGTGTCCTGTTGATGTTTAATACGCAGGTGGAAGCTTAGCAGTGCAGATATTTGCATCATCACCAACAAAATCTTGCCAAGATGAGAGAAGCAAGGAAGTCCATGGCCTTTTGGGTTCGGGCAATAAGCGCAGTTTGTCGACCTCTCCAATTGTGATAACAAGGGGAAAGAATGTCGCAGATCGCTTGAAGAAGTAAGACATTATTTAGGTTAAATTATAAGTTTGGTGTTGATCTTTCATATTTGTTTCTAGTAGGGCTCTGTATGATAGGTTGTTAAACTTTTTGTGTGTAATAGGTCTTTAAATTTTAAAAACTGTTTAATAGATTCATAAACTTTCATTTTGTGTCTAATATTGATCCATTAGATTTTTTTTTTTAATAAAAGTCAAATGACTTATTAGACACAAATTAAAAGTCTATAAATCTATTAAACATTTTTTAAAGTTTAAAAACCTATTAGACACAATTGTTAAAGTTGAAGGATCTATTAGATTTAAGTTTGAAAATTCAAGGACCAAACTTGTAATGTAACCTATTACTCGTTTACACAGATAGATTGTAGATATACCCAATAATTAGAGGTATACCTATGAATATGTACATATATATCAAAGTGAAGCTACTAACAAGCTTTAGGTAGCTTTGTCTAAGTTCCTGATGTCTTGAATAATGTAATATTGGCTATGAATAGGTACATATATATCAAAGTAAAGTTACTGACAAGCTTTAGGTAGCTTTGTCCAAGTTCCTGATGTCTTGAATTATGTAATATTTGGCTGCTGGAGGCCTATAGGCATTAGCCATTTGCAATAGTATGTGGAATCTACGTCCAATTTTTAGGTTTTTTTTTTTTCTATTCTTTTTTAAAATGGTTTTTTTTTTAAAAAAATTATTTTACAATATGTTGAGACGAGGGATTTAGGACCCGTGGAATACCCTTCTAGTTTAAATGTTTTTCAAGAATGTATTTTTAATTTTAAAAAAATATTTGGTATAAAACTTGTTTAGAATTTAAACACTCGTATGTTTGGTTATATTTCTTCACAAGTGTTTTTATACACAAGTTATTATGTACTTAAAAACTCTAAATTTTTTTTTTCTCAAAATAGTTTATTTCTCAATCTCATTCTTTAATAAGTCATTTTTAGTGATTGCTTAACACTAGATTTTTTTTTCCAAAATGATTTTTCTTTTCAAAATTAAACACCTGAAAAGTTAAATCCAAACGTACCCTTAGACCTATAACCTCTGGTTGATGGTTGTTAAGTTATGTTTATGTTGGTTTGTAGAGTGGTCTTAGAAAATAGCCAAAGGTTACGGCCTCGTTTGATAACCATTTGGTTTTTGAAAATTAAGCTTATACATATCTACTTCCACCTATAAATTTTTTTTGTTTTAGTATCAATCTTCTTTCTTGTTTTTAAAAACCAAGTCAAATTTTGAAAAAAAAAATAGTTTTCAAAAACTTGTTTCTGTTTTTAGAATTTGGTTAGGAATCCATACGGATCCTTAACAAGAGAAAGTTATGGAAGGGAATTTAGGAGAAAACAAACATATTTTTCAAAAATCAAAAACAAAAAACCAAATGGTTATCTAACGAAGCCTACATAATCCTAATTATTGACCACGGGGATTTTTGTCCGATGATACCCATTTTTCTTTTCATCCTTGCCCTTCAATCTAATTTAAACCTTTTTCTTCTCGGGAAAATGGTTTTTTGTTTTTTTCAAGGAAAAAACTTTTCTTTTTCCTTTTTCTTTCATCAACAAAATCAAATTCAAATATTCTCTTACCAAAAAAATCAAATTAAAATCTTAGCAATATTATCTAATTTCAAATTTTAATAACTATTTTCACAGTTTATGATGAAATTTGTGAATTCCACTTTTTTCTTATTCTTTCTCATTTATTTATTTATTTATTTTATTCTGGATCTATATTCATAGAATCACCATAATTCTAGGTAATCAACCCTTCTTACTTTTATTTTGAATCTTCATTTTTTTTAATCTCATTTTTTGTTCTAGATTTATCTTCCTAGAAATAATTAATTAAATTTGATTTAATTAATTAAATAAATTTTATTTAATTTATTTTAAATTAAATTTATACTGATGACTGCTTTAGTTATGAGAGACGTGGAGGCTTCCGCGTTTTTCTTCCCCCTCTCTCAACTGATAGTGAATTTACGCTTGGGATAGTGGAGATGTTTTCTCTGGTATTTAGATTAATTCAATGAATAGCTTCCTAGTGGTGAGCACTCTCTCAAGAAATTCTCTCCAGATCGTTGACAAAAAATTTGAGTGAATTCTTTTCCAAATTTCTAGATTGGTTCCCACAAACCAATAGACTCACATACTCAGAGGATAGGAAGTGTGCTAATCGGTGGTGTCCCAAATTGTTGCCGAGAACATGAATTTATAGAGGAATTGTTCGTGATTTCTTCTCCAAGGAGTTGGTGAAATTAATCCAGAGTCGACAAGTGGTGAATCTTTATTATGTAGATTAATCACCTATTTATCATATGCTTAACCTGATTTTGAAGTGTATTGCCAACATATTTGGTATTTCATGTTGAAATTAAATTGAGTTTGGTGTTGGCTTCCGTTGCGTTAGGGATTTCAATCCTACAAGGTGCGCTTCACTCAAACTAACGCACACTCTCCCATCCGGGCCTACACCAGCTCACGAGGAGGATCCATACTTGTAGGAGGCGAGCCTCGCTTGGACGAGGACTCCACCTATAGCAACAGCCGATGCCACCACCCAACTTGA

mRNA sequence

ATGGGAGCGCCATTTCAATGGAGCTCATCTCTTCACGCTGCTCCGATCAAGCTCAAATCGCCCATTTTCCTACCCTCGCCATCCAATTTCATCTACTATTATTGTAAACGATCTCGTGTCAATGATTCGTCAACTCGTCGTGGCGCTGTTTGTGCTCAGAACTCCAATTTGCCGCGGCCTAAATCCACGTCCACCAACTCCGATGCTCCGAGTTCGAAATTGGTCGTTCTCGGTGATTGCCAAGGGAACGAGGTTGTTCGAGTTTCTTCGACTCCGATTCGACGGCGTAAAAGTGTGATTCTGTCTATAGTGTCTTTGTTTGATAAACGTTCTCTTTGGCGAAGGATCTTTTTTGCCTCCAAGAAAGTTAGGAGTATCATTCTGCTCAATGTCGTCACGATTGTTTACGCTAGCAGTATTCCAGTTGTGAAAGAGGTTGAAGAATTAGTGGATCCAGCAACCTTCAATGCCGTGCGATTTGCCATGACTGCTATTCCATTTGTTCCACTTGTATTGTATGAATGGGATGATGTTGAGACCCGTAATGCTGGAATAGAGTTGGGTTTCTGGGTTAGTCTAGGGTACCTGATGCAGGCATTTGGACTTCTTACATCTGATGCTGGGCGTGCATCCTTCATATCAATGCTCACGGTACTTGTAGTTCCTTTTCTTGATGGACTTTTAGGGGCTGTAGTTCCTGCTCGTACCTGGTTTGGAGCTCTCATGTCTGTCATTGGAGTTGCAATGCTGGAATCCAGTGGATCCCCTCCATGTGTGGGAGATCTTTTGAACTTCTTGAGTGCAATATTTTTTGGTGTGCATATGCTTCGAACAGAGCATATTTCAAGACGTACAGACAAGGATAAATTCTTACCACTCCTTGCTTATGAGGTTTGCGTTGTTTCTATTCTATCGATGGTATGGTATTTTATTTGGAGATGGATTGATGGAACTGAAACAATTAGCGAGTCATGGAATTGGAAAACATATTTAGATTGGGTGTTCATGTTTCCTTGGGTACCTGCTTTGTACACAGGCTTATTGTCCACTGGTTTTTGCCTGTGGCTAGAGATGGCTGCCATGTGCGATGTATCAGCCACAGAAACTGCCATTATTTACAGCTTGGAGCCAGTCTGGGGCGGTAGTTTTGCCTGGTTCCTTCTTGGTGAAAGGTGGGGATTGACTGGCTGGATTGGTGCTGCCCTTGTGCTAGGTGGAAGCTTAGCAGTGCAGATATTTGCATCATCACCAACAAAATCTTGCCAAGATGAGAGAAGCAAGGAAGTCCATGGCCTTTTGGGTTCGGGCAATAAGCGCAGTTTGTCGACCTCTCCAATTGTGATAACAAGGGGAAAGAATGTCGCAGATCGCTTGAAGAATTATGAGAGACGTGGAGGCTTCCGCGTTTTTCTTCCCCCTCTCTCAACTGATAGTGAATTTACGCTTGGGATAGTGGAGATGTTTTCTCTGGGATTTCAATCCTACAAGGTGCGCTTCACTCAAACTAACGCACACTCTCCCATCCGGGCCTACACCAGCTCACGAGGAGGATCCATACTTGTAGGAGGCGAGCCTCGCTTGGACGAGGACTCCACCTATAGCAACAGCCGATGCCACCACCCAACTTGA

Coding sequence (CDS)

ATGGGAGCGCCATTTCAATGGAGCTCATCTCTTCACGCTGCTCCGATCAAGCTCAAATCGCCCATTTTCCTACCCTCGCCATCCAATTTCATCTACTATTATTGTAAACGATCTCGTGTCAATGATTCGTCAACTCGTCGTGGCGCTGTTTGTGCTCAGAACTCCAATTTGCCGCGGCCTAAATCCACGTCCACCAACTCCGATGCTCCGAGTTCGAAATTGGTCGTTCTCGGTGATTGCCAAGGGAACGAGGTTGTTCGAGTTTCTTCGACTCCGATTCGACGGCGTAAAAGTGTGATTCTGTCTATAGTGTCTTTGTTTGATAAACGTTCTCTTTGGCGAAGGATCTTTTTTGCCTCCAAGAAAGTTAGGAGTATCATTCTGCTCAATGTCGTCACGATTGTTTACGCTAGCAGTATTCCAGTTGTGAAAGAGGTTGAAGAATTAGTGGATCCAGCAACCTTCAATGCCGTGCGATTTGCCATGACTGCTATTCCATTTGTTCCACTTGTATTGTATGAATGGGATGATGTTGAGACCCGTAATGCTGGAATAGAGTTGGGTTTCTGGGTTAGTCTAGGGTACCTGATGCAGGCATTTGGACTTCTTACATCTGATGCTGGGCGTGCATCCTTCATATCAATGCTCACGGTACTTGTAGTTCCTTTTCTTGATGGACTTTTAGGGGCTGTAGTTCCTGCTCGTACCTGGTTTGGAGCTCTCATGTCTGTCATTGGAGTTGCAATGCTGGAATCCAGTGGATCCCCTCCATGTGTGGGAGATCTTTTGAACTTCTTGAGTGCAATATTTTTTGGTGTGCATATGCTTCGAACAGAGCATATTTCAAGACGTACAGACAAGGATAAATTCTTACCACTCCTTGCTTATGAGGTTTGCGTTGTTTCTATTCTATCGATGGTATGGTATTTTATTTGGAGATGGATTGATGGAACTGAAACAATTAGCGAGTCATGGAATTGGAAAACATATTTAGATTGGGTGTTCATGTTTCCTTGGGTACCTGCTTTGTACACAGGCTTATTGTCCACTGGTTTTTGCCTGTGGCTAGAGATGGCTGCCATGTGCGATGTATCAGCCACAGAAACTGCCATTATTTACAGCTTGGAGCCAGTCTGGGGCGGTAGTTTTGCCTGGTTCCTTCTTGGTGAAAGGTGGGGATTGACTGGCTGGATTGGTGCTGCCCTTGTGCTAGGTGGAAGCTTAGCAGTGCAGATATTTGCATCATCACCAACAAAATCTTGCCAAGATGAGAGAAGCAAGGAAGTCCATGGCCTTTTGGGTTCGGGCAATAAGCGCAGTTTGTCGACCTCTCCAATTGTGATAACAAGGGGAAAGAATGTCGCAGATCGCTTGAAGAATTATGAGAGACGTGGAGGCTTCCGCGTTTTTCTTCCCCCTCTCTCAACTGATAGTGAATTTACGCTTGGGATAGTGGAGATGTTTTCTCTGGGATTTCAATCCTACAAGGTGCGCTTCACTCAAACTAACGCACACTCTCCCATCCGGGCCTACACCAGCTCACGAGGAGGATCCATACTTGTAGGAGGCGAGCCTCGCTTGGACGAGGACTCCACCTATAGCAACAGCCGATGCCACCACCCAACTTGA

Protein sequence

MGAPFQWSSSLHAAPIKLKSPIFLPSPSNFIYYYCKRSRVNDSSTRRGAVCAQNSNLPRPKSTSTNSDAPSSKLVVLGDCQGNEVVRVSSTPIRRRKSVILSIVSLFDKRSLWRRIFFASKKVRSIILLNVVTIVYASSIPVVKEVEELVDPATFNAVRFAMTAIPFVPLVLYEWDDVETRNAGIELGFWVSLGYLMQAFGLLTSDAGRASFISMLTVLVVPFLDGLLGAVVPARTWFGALMSVIGVAMLESSGSPPCVGDLLNFLSAIFFGVHMLRTEHISRRTDKDKFLPLLAYEVCVVSILSMVWYFIWRWIDGTETISESWNWKTYLDWVFMFPWVPALYTGLLSTGFCLWLEMAAMCDVSATETAIIYSLEPVWGGSFAWFLLGERWGLTGWIGAALVLGGSLAVQIFASSPTKSCQDERSKEVHGLLGSGNKRSLSTSPIVITRGKNVADRLKNYERRGGFRVFLPPLSTDSEFTLGIVEMFSLGFQSYKVRFTQTNAHSPIRAYTSSRGGSILVGGEPRLDEDSTYSNSRCHHPT
Homology
BLAST of Lag0041347.1 vs. NCBI nr
Match: XP_023551258.1 (uncharacterized protein LOC111809127 isoform X1 [Cucurbita pepo subsp. pepo])

HSP 1 Score: 809.3 bits (2089), Expect = 2.0e-230
Identity = 409/459 (89.11%), Postives = 429/459 (93.46%), Query Frame = 0

Query: 1   MGAPFQWSSSLHAAPIKLKSPIFLPSPSNFIYYYCKRSRVNDSSTRRGAVCAQNSNLPRP 60
           MGA  QWSSSL  APIKLKS I L SPSNFI+YYCKRSRVN SST R AVCA NSNLPRP
Sbjct: 1   MGASHQWSSSLQTAPIKLKSSIPLTSPSNFIFYYCKRSRVNYSSTSRCAVCAHNSNLPRP 60

Query: 61  KSTSTNSDAPSSKLVVLGDCQGNEVVRVSSTPIRRRKSVILSIVSLFDKRSLWRRIFFAS 120
           K  STNSDA  SK VVLGDCQG+E+VR+SST IRRRKSVILS+VSLFDKRSLWRRIFFAS
Sbjct: 61  K--STNSDARISKSVVLGDCQGHELVRISSTSIRRRKSVILSLVSLFDKRSLWRRIFFAS 120

Query: 121 KKVRSIILLNVVTIVYASSIPVVKEVEELVDPATFNAVRFAMTAIPFVPLVLYEWDDVET 180
           KKVRSIILLN+VTIVYASSIPVVKEVEELVDPATFNAVRFA+TAIPFVPLVLY+WDDVET
Sbjct: 121 KKVRSIILLNIVTIVYASSIPVVKEVEELVDPATFNAVRFAITAIPFVPLVLYKWDDVET 180

Query: 181 RNAGIELGFWVSLGYLMQAFGLLTSDAGRASFISMLTVLVVPFLDGLLGAVVPARTWFGA 240
           RNAGIELGFWVSLGYLMQAFGLLTSDAGRASFISMLTVLVVP LDG+LGAVVPARTWFG 
Sbjct: 181 RNAGIELGFWVSLGYLMQAFGLLTSDAGRASFISMLTVLVVPILDGVLGAVVPARTWFGV 240

Query: 241 LMSVIGVAMLESSGSPPCVGDLLNFLSAIFFGVHMLRTEHISRRTDKDKFLPLLAYEVCV 300
           LMSVIGVAMLESSGSPPCVGDLLNFLSAIFFGVHMLRTEHISRRT+KDK +PLLAYEVCV
Sbjct: 241 LMSVIGVAMLESSGSPPCVGDLLNFLSAIFFGVHMLRTEHISRRTEKDKLVPLLAYEVCV 300

Query: 301 VSILSMVWYFIWRWIDGTETISESWNWKTYLDWVFMFPWVPALYTGLLSTGFCLWLEMAA 360
           VSILSM+WYFIWRWIDGTETISESWNWKTY DWVFMFPWVPALYTGLLSTGFCLWLEM A
Sbjct: 301 VSILSMLWYFIWRWIDGTETISESWNWKTYSDWVFMFPWVPALYTGLLSTGFCLWLEMGA 360

Query: 361 MCDVSATETAIIYSLEPVWGGSFAWFLLGERWGLTGWIGAALVLGGSLAVQIFASSPTKS 420
           MCDVSATETA+IYSLEPVWGGSFAWFLLGERWGL+GWIGAALVLGGSL VQI +SS TKS
Sbjct: 361 MCDVSATETAVIYSLEPVWGGSFAWFLLGERWGLSGWIGAALVLGGSLTVQILSSSATKS 420

Query: 421 CQDERSKEVHGLLGSGNKRSLSTSPIVITRGKNVADRLK 460
           C+D+RSKEVH +LGS +KRSLSTSPIV+TRGKNV   LK
Sbjct: 421 CKDDRSKEVHDVLGSADKRSLSTSPIVLTRGKNVTHHLK 457

BLAST of Lag0041347.1 vs. NCBI nr
Match: XP_022987075.1 (uncharacterized protein LOC111484651 isoform X1 [Cucurbita maxima])

HSP 1 Score: 806.2 bits (2081), Expect = 1.7e-229
Identity = 407/459 (88.67%), Postives = 428/459 (93.25%), Query Frame = 0

Query: 1   MGAPFQWSSSLHAAPIKLKSPIFLPSPSNFIYYYCKRSRVNDSSTRRGAVCAQNSNLPRP 60
           MGA  QWSSSL  APIKLKS I L S SNFI+Y+CKRSRVNDSSTRR AVCA NSNLPRP
Sbjct: 1   MGASHQWSSSLQTAPIKLKSSISLTSSSNFIFYFCKRSRVNDSSTRRCAVCAHNSNLPRP 60

Query: 61  KSTSTNSDAPSSKLVVLGDCQGNEVVRVSSTPIRRRKSVILSIVSLFDKRSLWRRIFFAS 120
           K  STNSDA  SK VVLGDCQG+E+VR+SST IRRR SVILS+VSLFDKRSLWRRIFFAS
Sbjct: 61  K--STNSDARISKSVVLGDCQGHELVRISSTSIRRRNSVILSLVSLFDKRSLWRRIFFAS 120

Query: 121 KKVRSIILLNVVTIVYASSIPVVKEVEELVDPATFNAVRFAMTAIPFVPLVLYEWDDVET 180
           KKVRSIILLN+VTIVYASSIPVVKEVEELVDPATFNAVRFA+TAIPFVPLVLY+WDDVET
Sbjct: 121 KKVRSIILLNIVTIVYASSIPVVKEVEELVDPATFNAVRFAITAIPFVPLVLYKWDDVET 180

Query: 181 RNAGIELGFWVSLGYLMQAFGLLTSDAGRASFISMLTVLVVPFLDGLLGAVVPARTWFGA 240
           RNAGIELGFWVSLGYLMQAFGLLTSDAGRASFISMLTVLVVP LDG+LGAVVPARTWFG 
Sbjct: 181 RNAGIELGFWVSLGYLMQAFGLLTSDAGRASFISMLTVLVVPILDGVLGAVVPARTWFGV 240

Query: 241 LMSVIGVAMLESSGSPPCVGDLLNFLSAIFFGVHMLRTEHISRRTDKDKFLPLLAYEVCV 300
           LMSVIGVAMLESSGSPPCVGDLLNFLSAIFFGVHMLRTEHISRRT+KDK + LLAYEVCV
Sbjct: 241 LMSVIGVAMLESSGSPPCVGDLLNFLSAIFFGVHMLRTEHISRRTEKDKLVSLLAYEVCV 300

Query: 301 VSILSMVWYFIWRWIDGTETISESWNWKTYLDWVFMFPWVPALYTGLLSTGFCLWLEMAA 360
           VSILSM+WYFIWRWIDGTETISESWNWKTY DWVFMFPWVPALYTGLLSTGFCLWLEM A
Sbjct: 301 VSILSMLWYFIWRWIDGTETISESWNWKTYSDWVFMFPWVPALYTGLLSTGFCLWLEMGA 360

Query: 361 MCDVSATETAIIYSLEPVWGGSFAWFLLGERWGLTGWIGAALVLGGSLAVQIFASSPTKS 420
           MCDVSATETA+IYSLEPVWGGSFAWFLLGERWGL+GWIGAALVLGGSL VQI +SS TKS
Sbjct: 361 MCDVSATETAVIYSLEPVWGGSFAWFLLGERWGLSGWIGAALVLGGSLTVQILSSSATKS 420

Query: 421 CQDERSKEVHGLLGSGNKRSLSTSPIVITRGKNVADRLK 460
           C+D+RSKEVH +LGS +KRSLSTSPIV+TRGKNV   LK
Sbjct: 421 CKDDRSKEVHDVLGSADKRSLSTSPIVLTRGKNVTHHLK 457

BLAST of Lag0041347.1 vs. NCBI nr
Match: KAG6600804.1 (hypothetical protein SDJN03_06037, partial [Cucurbita argyrosperma subsp. sororia])

HSP 1 Score: 800.4 bits (2066), Expect = 9.4e-228
Identity = 404/459 (88.02%), Postives = 424/459 (92.37%), Query Frame = 0

Query: 1   MGAPFQWSSSLHAAPIKLKSPIFLPSPSNFIYYYCKRSRVNDSSTRRGAVCAQNSNLPRP 60
           MGA  QWSSSL  APIKLKS I L S SNFI+Y+CKRSRVNDS TRR AVCA NSN PRP
Sbjct: 1   MGASHQWSSSLQTAPIKLKSSISLTSSSNFIFYFCKRSRVNDSLTRRCAVCAHNSNFPRP 60

Query: 61  KSTSTNSDAPSSKLVVLGDCQGNEVVRVSSTPIRRRKSVILSIVSLFDKRSLWRRIFFAS 120
           K  STNSDA  SK VVLGDCQG+E+VR SST IRRR SVILS+ SLFDKRSLWRRIFFAS
Sbjct: 61  K--STNSDARISKSVVLGDCQGHELVRTSSTSIRRRNSVILSLASLFDKRSLWRRIFFAS 120

Query: 121 KKVRSIILLNVVTIVYASSIPVVKEVEELVDPATFNAVRFAMTAIPFVPLVLYEWDDVET 180
           KKVRSIILLN+VTIVYASSIPVVKEVEELVDPATFNAVRFA+TAIPFVPLVLY+WDDVET
Sbjct: 121 KKVRSIILLNIVTIVYASSIPVVKEVEELVDPATFNAVRFAITAIPFVPLVLYKWDDVET 180

Query: 181 RNAGIELGFWVSLGYLMQAFGLLTSDAGRASFISMLTVLVVPFLDGLLGAVVPARTWFGA 240
           RNAGIELGFWVSLGYLMQAFGLLTSDAGRASFISMLTVLVVP LDG+LGAVVPARTWFG 
Sbjct: 181 RNAGIELGFWVSLGYLMQAFGLLTSDAGRASFISMLTVLVVPILDGVLGAVVPARTWFGV 240

Query: 241 LMSVIGVAMLESSGSPPCVGDLLNFLSAIFFGVHMLRTEHISRRTDKDKFLPLLAYEVCV 300
           LMSVIGVAMLESSGSPPCVGDLLNFLSAIFFGVHMLRTEHISRRT+KDK +PLLAYEVCV
Sbjct: 241 LMSVIGVAMLESSGSPPCVGDLLNFLSAIFFGVHMLRTEHISRRTEKDKLVPLLAYEVCV 300

Query: 301 VSILSMVWYFIWRWIDGTETISESWNWKTYLDWVFMFPWVPALYTGLLSTGFCLWLEMAA 360
           VSILSM+WYFIWRWIDGTETISESWNWK Y DWVFMFPWVPALYTGLLSTGFCLWLEM A
Sbjct: 301 VSILSMLWYFIWRWIDGTETISESWNWKMYSDWVFMFPWVPALYTGLLSTGFCLWLEMGA 360

Query: 361 MCDVSATETAIIYSLEPVWGGSFAWFLLGERWGLTGWIGAALVLGGSLAVQIFASSPTKS 420
           MCDVSATETA+IYSLEPVWGGSFAWFLLGERWGL+GWIGAALVLGGSL VQI +SS TKS
Sbjct: 361 MCDVSATETAVIYSLEPVWGGSFAWFLLGERWGLSGWIGAALVLGGSLTVQILSSSATKS 420

Query: 421 CQDERSKEVHGLLGSGNKRSLSTSPIVITRGKNVADRLK 460
           C+D+RSKEVH +LGS +KRSLSTSPIV+TRGKNV   LK
Sbjct: 421 CKDDRSKEVHDVLGSADKRSLSTSPIVLTRGKNVTHHLK 457

BLAST of Lag0041347.1 vs. NCBI nr
Match: XP_038877380.1 (uncharacterized protein LOC120069670 [Benincasa hispida])

HSP 1 Score: 798.1 bits (2060), Expect = 4.7e-227
Identity = 403/461 (87.42%), Postives = 422/461 (91.54%), Query Frame = 0

Query: 1   MGAPFQWSSSLHAAPIKLKSPIFLPSPSNFIYYYCKRSRVNDSSTRRGAVCAQNSNLPRP 60
           MG+PFQWSSSLH APIKLKSPIF  SPSNFI+YYC+RS V DSS RR AVCAQNSN PRP
Sbjct: 1   MGSPFQWSSSLHTAPIKLKSPIFPSSPSNFIFYYCQRSPVKDSSNRRCAVCAQNSNSPRP 60

Query: 61  KSTSTNSDAPSSKLVVLGDCQGNEVVRVSSTPIRRRKSVILSIVSLFDKRSLWRRIFFAS 120
           K         +SK V+LGDCQGNE+VRVSSTP+RR  SVI S+VSLFDKRSLWRRIFFAS
Sbjct: 61  K---------NSKSVLLGDCQGNELVRVSSTPVRRPNSVIFSLVSLFDKRSLWRRIFFAS 120

Query: 121 KKVRSIILLNVVTIVYASSIPVVKEVEELVDPATFNAVRFAMTAIPFVPLVLYEWDDVET 180
           KKVRSIILLNVVTIVYASSIPVVKEVEELVDPATFN VRFAMTA+PFVPL LY+WDD E 
Sbjct: 121 KKVRSIILLNVVTIVYASSIPVVKEVEELVDPATFNVVRFAMTAVPFVPLALYKWDDAEI 180

Query: 181 RNAGIELGFWVSLGYLMQAFGLLTSDAGRASFISMLTVLVVPFLDGLLGAVVPARTWFGA 240
           R+AGIELGFWVSLGYLMQAFGL+TSDAGRASFISMLTVLVVP LDGLLGAVVPARTWFGA
Sbjct: 181 RDAGIELGFWVSLGYLMQAFGLITSDAGRASFISMLTVLVVPLLDGLLGAVVPARTWFGA 240

Query: 241 LMSVIGVAMLESSGSPPCVGDLLNFLSAIFFGVHMLRTEHISRRTDKDKFLPLLAYEVCV 300
           LMSVIGVAMLESSGSPPCVGDLLNFLSAIFFGVHMLRTEHISRR DK+KFLPLLAYEVCV
Sbjct: 241 LMSVIGVAMLESSGSPPCVGDLLNFLSAIFFGVHMLRTEHISRRIDKNKFLPLLAYEVCV 300

Query: 301 VSILSMVWYFIWRWIDGTETISESWNWKTYLDWVFMFPWVPALYTGLLSTGFCLWLEMAA 360
           VSILSM+WYFIWRWIDG ETI ESWNWKTYLDWVFMFPWVPALYTGLLSTGFCLWLEMAA
Sbjct: 301 VSILSMLWYFIWRWIDGAETIIESWNWKTYLDWVFMFPWVPALYTGLLSTGFCLWLEMAA 360

Query: 361 MCDVSATETAIIYSLEPVWGGSFAWFLLGERWGLTGWIGAALVLGGSLAVQIFASSPTKS 420
           MCDVSATETAIIYSLEPVWGGSFAW LLGERWGLTGWIGAALVL GS+ VQIFASS TKS
Sbjct: 361 MCDVSATETAIIYSLEPVWGGSFAWILLGERWGLTGWIGAALVLAGSITVQIFASSATKS 420

Query: 421 CQDERSK--EVHGLLGSGNKRSLSTSPIVITRGKNVADRLK 460
           C+DERSK  EVHGLLGSG+ R+LSTSPIVITR KN+ D LK
Sbjct: 421 CKDERSKSREVHGLLGSGDDRNLSTSPIVITRVKNIVDHLK 452

BLAST of Lag0041347.1 vs. NCBI nr
Match: XP_022150064.1 (uncharacterized protein LOC111018331 [Momordica charantia])

HSP 1 Score: 785.0 bits (2026), Expect = 4.1e-223
Identity = 397/459 (86.49%), Postives = 422/459 (91.94%), Query Frame = 0

Query: 1   MGAPFQWSSSLHAAPIKLKSPIFLPSPSNFIYYYCKRSRVNDSSTRRGAVCAQNSNLPRP 60
           MGAP  WSS+LHA+PI  KSPI + SPSN IYYY KRSRVN SS RR AVCAQNSN PR 
Sbjct: 1   MGAPLPWSSTLHASPINHKSPISISSPSNLIYYYSKRSRVNHSSPRRCAVCAQNSNSPRS 60

Query: 61  KSTSTNSDAPSSKLVVLGDCQGNEVVRVSSTPIRRRKSVILSIVSLFDKRSLWRRIFFAS 120
           KST   SDAPSSK  VLGDCQGNEV RVSSTPIRRR + ILS++SLFDKRSLWRRIFFAS
Sbjct: 61  KSTI--SDAPSSKPAVLGDCQGNEVARVSSTPIRRRNNGILSLMSLFDKRSLWRRIFFAS 120

Query: 121 KKVRSIILLNVVTIVYASSIPVVKEVEELVDPATFNAVRFAMTAIPFVPLVLYEWDDVET 180
           KKVRSIILLNVVTIVYASSIPVVKEVEELVDPATFN VRFA+ AIPF PLVLY+W+DV+T
Sbjct: 121 KKVRSIILLNVVTIVYASSIPVVKEVEELVDPATFNVVRFAIAAIPFAPLVLYKWNDVQT 180

Query: 181 RNAGIELGFWVSLGYLMQAFGLLTSDAGRASFISMLTVLVVPFLDGLLGAVVPARTWFGA 240
           RNAGIELGFWVSLGYLMQAFGLLTSDAGRASFIS+LTVLVVPFLDGLLGAVVPARTWFGA
Sbjct: 181 RNAGIELGFWVSLGYLMQAFGLLTSDAGRASFISILTVLVVPFLDGLLGAVVPARTWFGA 240

Query: 241 LMSVIGVAMLESSGSPPCVGDLLNFLSAIFFGVHMLRTEHISRRTDKDKFLPLLAYEVCV 300
           LMSV+GVAMLESSGSPPCVGDLLNFLSAIFFGVHMLRTEHISRRT+KDKFLPLLA+EVCV
Sbjct: 241 LMSVVGVAMLESSGSPPCVGDLLNFLSAIFFGVHMLRTEHISRRTEKDKFLPLLAFEVCV 300

Query: 301 VSILSMVWYFIWRWIDGTETISESWNWKTYLDWVFMFPWVPALYTGLLSTGFCLWLEMAA 360
           VSILS VWYFI RWIDGTE IS SWNW+TYLDWVF+FPW+PALYTGLLSTGFCLWLEMAA
Sbjct: 301 VSILSTVWYFIGRWIDGTEAISVSWNWETYLDWVFVFPWIPALYTGLLSTGFCLWLEMAA 360

Query: 361 MCDVSATETAIIYSLEPVWGGSFAWFLLGERWGLTGWIGAALVLGGSLAVQIFASSPTKS 420
           MCDVSATETAIIYSL+PVWGGSFAWF+LGERWG +GWIGAALVLGGSL VQIFASSPTKS
Sbjct: 361 MCDVSATETAIIYSLDPVWGGSFAWFMLGERWGPSGWIGAALVLGGSLTVQIFASSPTKS 420

Query: 421 CQDERSKEVHGLLGSGNKRSLSTSPIVITRGKNVADRLK 460
            +DER+KEV GLLGSG+ RSLSTSPIV+T  K+V D LK
Sbjct: 421 SKDERNKEVRGLLGSGDNRSLSTSPIVVTTRKDVTDHLK 457

BLAST of Lag0041347.1 vs. ExPASy Swiss-Prot
Match: O29470 (Uncharacterized transporter AF_0788 OS=Archaeoglobus fulgidus (strain ATCC 49558 / VC-16 / DSM 4304 / JCM 9628 / NBRC 100126) OX=224325 GN=AF_0788 PE=3 SV=1)

HSP 1 Score: 67.4 bits (163), Expect = 5.7e-10
Identity = 74/293 (25.26%), Postives = 130/293 (44.37%), Query Frame = 0

Query: 121 KKVRSIILLNVVTIVYASSIPVVKEVEELVDPATFNAVRFAMTAIPFVPLVLYEWDDVET 180
           K++ + + L +V +++ S+ PVVK   + + P  FN VRF +  + F+P  L  WD  + 
Sbjct: 39  KRLYADLGLALVALIWGSTFPVVKIALDSMSPFAFNTVRFFIACLFFLPF-LKGWDFKD- 98

Query: 181 RNAGIELGFWVSLGYLMQAFGLLTSDAGRASFISMLTVLVVPFLDGLL-GAVVPARTWFG 240
              G ++G    LGY  Q  GL  + A  A FI+   V++ P +  L+   V   R   G
Sbjct: 99  ---GFKIGIASFLGYTFQTVGLDYTTATNAGFITSTYVVLAPIISWLVYKDVFDKRDVSG 158

Query: 241 ALMSVIGVAMLESSGSPPCVGDLLNFLSAIFFGVHMLRTEHISRRTDKDKFLPLLAYEVC 300
            L++ +G   L S  S   +GD+L    A+FFG  +    H SR ++        ++ + 
Sbjct: 159 VLLAFVGFYFL-SGYSGFNIGDILMLFCALFFGAEIAMISHYSRLSNPTMLAFWQSFAIF 218

Query: 301 VVSILSMVWYFIWRWIDGTETISESWNWKTYLDWVFMFPWVPALYTGLLSTGFCLWLEMA 360
           ++S    V+      I+ T               V +   + A +   ++     WL+  
Sbjct: 219 ILSAPFAVFTTTKFEINTT---------------VILCLLITAFFATFVAKMLQNWLQSY 278

Query: 361 AMCDVSATETAIIYSLEPVWGGSFAWFLLGERWGLTGWIGAALVLGGSLAVQI 413
                 +++ A+I SLE V+   F+  +L E      + GA L+L   + V +
Sbjct: 279 ----TKSSDAAVILSLEGVFAHLFSVAVLAEILTPVQYFGAFLILLAVIIVSL 306

BLAST of Lag0041347.1 vs. ExPASy TrEMBL
Match: A0A6J1JFT3 (uncharacterized protein LOC111484651 isoform X1 OS=Cucurbita maxima OX=3661 GN=LOC111484651 PE=3 SV=1)

HSP 1 Score: 806.2 bits (2081), Expect = 8.3e-230
Identity = 407/459 (88.67%), Postives = 428/459 (93.25%), Query Frame = 0

Query: 1   MGAPFQWSSSLHAAPIKLKSPIFLPSPSNFIYYYCKRSRVNDSSTRRGAVCAQNSNLPRP 60
           MGA  QWSSSL  APIKLKS I L S SNFI+Y+CKRSRVNDSSTRR AVCA NSNLPRP
Sbjct: 1   MGASHQWSSSLQTAPIKLKSSISLTSSSNFIFYFCKRSRVNDSSTRRCAVCAHNSNLPRP 60

Query: 61  KSTSTNSDAPSSKLVVLGDCQGNEVVRVSSTPIRRRKSVILSIVSLFDKRSLWRRIFFAS 120
           K  STNSDA  SK VVLGDCQG+E+VR+SST IRRR SVILS+VSLFDKRSLWRRIFFAS
Sbjct: 61  K--STNSDARISKSVVLGDCQGHELVRISSTSIRRRNSVILSLVSLFDKRSLWRRIFFAS 120

Query: 121 KKVRSIILLNVVTIVYASSIPVVKEVEELVDPATFNAVRFAMTAIPFVPLVLYEWDDVET 180
           KKVRSIILLN+VTIVYASSIPVVKEVEELVDPATFNAVRFA+TAIPFVPLVLY+WDDVET
Sbjct: 121 KKVRSIILLNIVTIVYASSIPVVKEVEELVDPATFNAVRFAITAIPFVPLVLYKWDDVET 180

Query: 181 RNAGIELGFWVSLGYLMQAFGLLTSDAGRASFISMLTVLVVPFLDGLLGAVVPARTWFGA 240
           RNAGIELGFWVSLGYLMQAFGLLTSDAGRASFISMLTVLVVP LDG+LGAVVPARTWFG 
Sbjct: 181 RNAGIELGFWVSLGYLMQAFGLLTSDAGRASFISMLTVLVVPILDGVLGAVVPARTWFGV 240

Query: 241 LMSVIGVAMLESSGSPPCVGDLLNFLSAIFFGVHMLRTEHISRRTDKDKFLPLLAYEVCV 300
           LMSVIGVAMLESSGSPPCVGDLLNFLSAIFFGVHMLRTEHISRRT+KDK + LLAYEVCV
Sbjct: 241 LMSVIGVAMLESSGSPPCVGDLLNFLSAIFFGVHMLRTEHISRRTEKDKLVSLLAYEVCV 300

Query: 301 VSILSMVWYFIWRWIDGTETISESWNWKTYLDWVFMFPWVPALYTGLLSTGFCLWLEMAA 360
           VSILSM+WYFIWRWIDGTETISESWNWKTY DWVFMFPWVPALYTGLLSTGFCLWLEM A
Sbjct: 301 VSILSMLWYFIWRWIDGTETISESWNWKTYSDWVFMFPWVPALYTGLLSTGFCLWLEMGA 360

Query: 361 MCDVSATETAIIYSLEPVWGGSFAWFLLGERWGLTGWIGAALVLGGSLAVQIFASSPTKS 420
           MCDVSATETA+IYSLEPVWGGSFAWFLLGERWGL+GWIGAALVLGGSL VQI +SS TKS
Sbjct: 361 MCDVSATETAVIYSLEPVWGGSFAWFLLGERWGLSGWIGAALVLGGSLTVQILSSSATKS 420

Query: 421 CQDERSKEVHGLLGSGNKRSLSTSPIVITRGKNVADRLK 460
           C+D+RSKEVH +LGS +KRSLSTSPIV+TRGKNV   LK
Sbjct: 421 CKDDRSKEVHDVLGSADKRSLSTSPIVLTRGKNVTHHLK 457

BLAST of Lag0041347.1 vs. ExPASy TrEMBL
Match: A0A6J1D8X4 (uncharacterized protein LOC111018331 OS=Momordica charantia OX=3673 GN=LOC111018331 PE=3 SV=1)

HSP 1 Score: 785.0 bits (2026), Expect = 2.0e-223
Identity = 397/459 (86.49%), Postives = 422/459 (91.94%), Query Frame = 0

Query: 1   MGAPFQWSSSLHAAPIKLKSPIFLPSPSNFIYYYCKRSRVNDSSTRRGAVCAQNSNLPRP 60
           MGAP  WSS+LHA+PI  KSPI + SPSN IYYY KRSRVN SS RR AVCAQNSN PR 
Sbjct: 1   MGAPLPWSSTLHASPINHKSPISISSPSNLIYYYSKRSRVNHSSPRRCAVCAQNSNSPRS 60

Query: 61  KSTSTNSDAPSSKLVVLGDCQGNEVVRVSSTPIRRRKSVILSIVSLFDKRSLWRRIFFAS 120
           KST   SDAPSSK  VLGDCQGNEV RVSSTPIRRR + ILS++SLFDKRSLWRRIFFAS
Sbjct: 61  KSTI--SDAPSSKPAVLGDCQGNEVARVSSTPIRRRNNGILSLMSLFDKRSLWRRIFFAS 120

Query: 121 KKVRSIILLNVVTIVYASSIPVVKEVEELVDPATFNAVRFAMTAIPFVPLVLYEWDDVET 180
           KKVRSIILLNVVTIVYASSIPVVKEVEELVDPATFN VRFA+ AIPF PLVLY+W+DV+T
Sbjct: 121 KKVRSIILLNVVTIVYASSIPVVKEVEELVDPATFNVVRFAIAAIPFAPLVLYKWNDVQT 180

Query: 181 RNAGIELGFWVSLGYLMQAFGLLTSDAGRASFISMLTVLVVPFLDGLLGAVVPARTWFGA 240
           RNAGIELGFWVSLGYLMQAFGLLTSDAGRASFIS+LTVLVVPFLDGLLGAVVPARTWFGA
Sbjct: 181 RNAGIELGFWVSLGYLMQAFGLLTSDAGRASFISILTVLVVPFLDGLLGAVVPARTWFGA 240

Query: 241 LMSVIGVAMLESSGSPPCVGDLLNFLSAIFFGVHMLRTEHISRRTDKDKFLPLLAYEVCV 300
           LMSV+GVAMLESSGSPPCVGDLLNFLSAIFFGVHMLRTEHISRRT+KDKFLPLLA+EVCV
Sbjct: 241 LMSVVGVAMLESSGSPPCVGDLLNFLSAIFFGVHMLRTEHISRRTEKDKFLPLLAFEVCV 300

Query: 301 VSILSMVWYFIWRWIDGTETISESWNWKTYLDWVFMFPWVPALYTGLLSTGFCLWLEMAA 360
           VSILS VWYFI RWIDGTE IS SWNW+TYLDWVF+FPW+PALYTGLLSTGFCLWLEMAA
Sbjct: 301 VSILSTVWYFIGRWIDGTEAISVSWNWETYLDWVFVFPWIPALYTGLLSTGFCLWLEMAA 360

Query: 361 MCDVSATETAIIYSLEPVWGGSFAWFLLGERWGLTGWIGAALVLGGSLAVQIFASSPTKS 420
           MCDVSATETAIIYSL+PVWGGSFAWF+LGERWG +GWIGAALVLGGSL VQIFASSPTKS
Sbjct: 361 MCDVSATETAIIYSLDPVWGGSFAWFMLGERWGPSGWIGAALVLGGSLTVQIFASSPTKS 420

Query: 421 CQDERSKEVHGLLGSGNKRSLSTSPIVITRGKNVADRLK 460
            +DER+KEV GLLGSG+ RSLSTSPIV+T  K+V D LK
Sbjct: 421 SKDERNKEVRGLLGSGDNRSLSTSPIVVTTRKDVTDHLK 457

BLAST of Lag0041347.1 vs. ExPASy TrEMBL
Match: A0A1S3BNU1 (uncharacterized protein LOC103491903 isoform X1 OS=Cucumis melo OX=3656 GN=LOC103491903 PE=3 SV=1)

HSP 1 Score: 769.6 bits (1986), Expect = 8.6e-219
Identity = 398/462 (86.15%), Postives = 417/462 (90.26%), Query Frame = 0

Query: 1   MGAPFQWSSSLHAAPIKLKSPIFLPSPSNFIYYYCKRSRVNDSSTRRGAVCAQNSNLPRP 60
           MGAPFQ SSSLH API LKSPIF  SPSNFI+YYCKRS V  SST R AV AQNS+ P P
Sbjct: 1   MGAPFQLSSSLHTAPINLKSPIFPSSPSNFIFYYCKRSPVIASSTHRCAVYAQNSSSPLP 60

Query: 61  KSTSTNSDAPSSKLVVLGDCQGNEVVRVSSTPIR-RRKSVILSIVSLFDKRSLWRRIFFA 120
           K         +SK VVLG CQGNE+VRVSS  IR R +SVILS+VSLFDKRSLWRRIFFA
Sbjct: 61  K---------NSKSVVLGHCQGNELVRVSSNTIRPRNRSVILSLVSLFDKRSLWRRIFFA 120

Query: 121 SKKVRSIILLNVVTIVYASSIPVVKEVEELVDPATFNAVRFAMTAIPFVPLVLYEWDDVE 180
           SKKVRSIILLNVVTIVYASSIPVVKEVEELVDPATFN VRF MTAIPFVPLVL +WDDVE
Sbjct: 121 SKKVRSIILLNVVTIVYASSIPVVKEVEELVDPATFNVVRFVMTAIPFVPLVLDKWDDVE 180

Query: 181 TRNAGIELGFWVSLGYLMQAFGLLTSDAGRASFISMLTVLVVPFLDGLLGAVVPARTWFG 240
            R+AGIELGFWVSLGYLMQAFGL+TSDAGRASFISMLTVLVVP LDGLLGA+VPARTWFG
Sbjct: 181 IRDAGIELGFWVSLGYLMQAFGLITSDAGRASFISMLTVLVVPLLDGLLGAIVPARTWFG 240

Query: 241 ALMSVIGVAMLESSGSPPCVGDLLNFLSAIFFGVHMLRTEHISRRTDKDKFLPLLAYEVC 300
           ALMSV+GVAMLESSGSPPCVGDLLNF+SAIFFGVHMLRTEHISRR DKDKFLPLLAYEVC
Sbjct: 241 ALMSVVGVAMLESSGSPPCVGDLLNFMSAIFFGVHMLRTEHISRRIDKDKFLPLLAYEVC 300

Query: 301 VVSILSMVWYFIWRWIDGTETISESWNWKTYLDWVFMFPWVPALYTGLLSTGFCLWLEMA 360
           VVSILSM+WYFIWRWI+GTETISESWNWKTYLDWVFMFPWVPALYTGLLSTGFCLWLEMA
Sbjct: 301 VVSILSMLWYFIWRWINGTETISESWNWKTYLDWVFMFPWVPALYTGLLSTGFCLWLEMA 360

Query: 361 AMCDVSATETAIIYSLEPVWGGSFAWFLLGERWGLTGWIGAALVLGGSLAVQIFASSPTK 420
           AMCDVSATETAIIYSLEPVWGGSFAW LLGERWGL+GWIGAALVLGGSL VQIFASS TK
Sbjct: 361 AMCDVSATETAIIYSLEPVWGGSFAWILLGERWGLSGWIGAALVLGGSLTVQIFASSTTK 420

Query: 421 SCQDERS--KEVHGLLGSGNKRSLSTSPIVITRGKNVADRLK 460
           SC+DERS  KEVH LLGS + RSL+TSPIVITR  N+AD LK
Sbjct: 421 SCKDERSKTKEVHDLLGSSDDRSLTTSPIVITRVDNIADHLK 453

BLAST of Lag0041347.1 vs. ExPASy TrEMBL
Match: A0A6J1JIE8 (uncharacterized protein LOC111484651 isoform X2 OS=Cucurbita maxima OX=3661 GN=LOC111484651 PE=3 SV=1)

HSP 1 Score: 726.9 bits (1875), Expect = 6.4e-206
Identity = 366/404 (90.59%), Postives = 381/404 (94.31%), Query Frame = 0

Query: 1   MGAPFQWSSSLHAAPIKLKSPIFLPSPSNFIYYYCKRSRVNDSSTRRGAVCAQNSNLPRP 60
           MGA  QWSSSL  APIKLKS I L S SNFI+Y+CKRSRVNDSSTRR AVCA NSNLPRP
Sbjct: 1   MGASHQWSSSLQTAPIKLKSSISLTSSSNFIFYFCKRSRVNDSSTRRCAVCAHNSNLPRP 60

Query: 61  KSTSTNSDAPSSKLVVLGDCQGNEVVRVSSTPIRRRKSVILSIVSLFDKRSLWRRIFFAS 120
           K  STNSDA  SK VVLGDCQG+E+VR+SST IRRR SVILS+VSLFDKRSLWRRIFFAS
Sbjct: 61  K--STNSDARISKSVVLGDCQGHELVRISSTSIRRRNSVILSLVSLFDKRSLWRRIFFAS 120

Query: 121 KKVRSIILLNVVTIVYASSIPVVKEVEELVDPATFNAVRFAMTAIPFVPLVLYEWDDVET 180
           KKVRSIILLN+VTIVYASSIPVVKEVEELVDPATFNAVRFA+TAIPFVPLVLY+WDDVET
Sbjct: 121 KKVRSIILLNIVTIVYASSIPVVKEVEELVDPATFNAVRFAITAIPFVPLVLYKWDDVET 180

Query: 181 RNAGIELGFWVSLGYLMQAFGLLTSDAGRASFISMLTVLVVPFLDGLLGAVVPARTWFGA 240
           RNAGIELGFWVSLGYLMQAFGLLTSDAGRASFISMLTVLVVP LDG+LGAVVPARTWFG 
Sbjct: 181 RNAGIELGFWVSLGYLMQAFGLLTSDAGRASFISMLTVLVVPILDGVLGAVVPARTWFGV 240

Query: 241 LMSVIGVAMLESSGSPPCVGDLLNFLSAIFFGVHMLRTEHISRRTDKDKFLPLLAYEVCV 300
           LMSVIGVAMLESSGSPPCVGDLLNFLSAIFFGVHMLRTEHISRRT+KDK + LLAYEVCV
Sbjct: 241 LMSVIGVAMLESSGSPPCVGDLLNFLSAIFFGVHMLRTEHISRRTEKDKLVSLLAYEVCV 300

Query: 301 VSILSMVWYFIWRWIDGTETISESWNWKTYLDWVFMFPWVPALYTGLLSTGFCLWLEMAA 360
           VSILSM+WYFIWRWIDGTETISESWNWKTY DWVFMFPWVPALYTGLLSTGFCLWLEM A
Sbjct: 301 VSILSMLWYFIWRWIDGTETISESWNWKTYSDWVFMFPWVPALYTGLLSTGFCLWLEMGA 360

Query: 361 MCDVSATETAIIYSLEPVWGGSFAWFLLGERWGLTGWIGAALVL 405
           MCDVSATETA+IYSLEPVWGGSFAWFLLGERWGL+GWIGAALVL
Sbjct: 361 MCDVSATETAVIYSLEPVWGGSFAWFLLGERWGLSGWIGAALVL 402

BLAST of Lag0041347.1 vs. ExPASy TrEMBL
Match: A0A1S3BNS3 (uncharacterized protein LOC103491903 isoform X2 OS=Cucumis melo OX=3656 GN=LOC103491903 PE=3 SV=1)

HSP 1 Score: 696.4 bits (1796), Expect = 9.2e-197
Identity = 356/406 (87.68%), Postives = 371/406 (91.38%), Query Frame = 0

Query: 1   MGAPFQWSSSLHAAPIKLKSPIFLPSPSNFIYYYCKRSRVNDSSTRRGAVCAQNSNLPRP 60
           MGAPFQ SSSLH API LKSPIF  SPSNFI+YYCKRS V  SST R AV AQNS+ P P
Sbjct: 1   MGAPFQLSSSLHTAPINLKSPIFPSSPSNFIFYYCKRSPVIASSTHRCAVYAQNSSSPLP 60

Query: 61  KSTSTNSDAPSSKLVVLGDCQGNEVVRVSSTPIR-RRKSVILSIVSLFDKRSLWRRIFFA 120
           K         +SK VVLG CQGNE+VRVSS  IR R +SVILS+VSLFDKRSLWRRIFFA
Sbjct: 61  K---------NSKSVVLGHCQGNELVRVSSNTIRPRNRSVILSLVSLFDKRSLWRRIFFA 120

Query: 121 SKKVRSIILLNVVTIVYASSIPVVKEVEELVDPATFNAVRFAMTAIPFVPLVLYEWDDVE 180
           SKKVRSIILLNVVTIVYASSIPVVKEVEELVDPATFN VRF MTAIPFVPLVL +WDDVE
Sbjct: 121 SKKVRSIILLNVVTIVYASSIPVVKEVEELVDPATFNVVRFVMTAIPFVPLVLDKWDDVE 180

Query: 181 TRNAGIELGFWVSLGYLMQAFGLLTSDAGRASFISMLTVLVVPFLDGLLGAVVPARTWFG 240
            R+AGIELGFWVSLGYLMQAFGL+TSDAGRASFISMLTVLVVP LDGLLGA+VPARTWFG
Sbjct: 181 IRDAGIELGFWVSLGYLMQAFGLITSDAGRASFISMLTVLVVPLLDGLLGAIVPARTWFG 240

Query: 241 ALMSVIGVAMLESSGSPPCVGDLLNFLSAIFFGVHMLRTEHISRRTDKDKFLPLLAYEVC 300
           ALMSV+GVAMLESSGSPPCVGDLLNF+SAIFFGVHMLRTEHISRR DKDKFLPLLAYEVC
Sbjct: 241 ALMSVVGVAMLESSGSPPCVGDLLNFMSAIFFGVHMLRTEHISRRIDKDKFLPLLAYEVC 300

Query: 301 VVSILSMVWYFIWRWIDGTETISESWNWKTYLDWVFMFPWVPALYTGLLSTGFCLWLEMA 360
           VVSILSM+WYFIWRWI+GTETISESWNWKTYLDWVFMFPWVPALYTGLLSTGFCLWLEMA
Sbjct: 301 VVSILSMLWYFIWRWINGTETISESWNWKTYLDWVFMFPWVPALYTGLLSTGFCLWLEMA 360

Query: 361 AMCDVSATETAIIYSLEPVWGGSFAWFLLGERWGLTGWIGAALVLG 406
           AMCDVSATETAIIYSLEPVWGGSFAW LLGERWGL+GWIGAALVLG
Sbjct: 361 AMCDVSATETAIIYSLEPVWGGSFAWILLGERWGLSGWIGAALVLG 397

The following BLAST results are available for this feature:
Match NameE-valueIdentityDescription
XP_023551258.12.0e-23089.11uncharacterized protein LOC111809127 isoform X1 [Cucurbita pepo subsp. pepo][more]
XP_022987075.11.7e-22988.67uncharacterized protein LOC111484651 isoform X1 [Cucurbita maxima][more]
KAG6600804.19.4e-22888.02hypothetical protein SDJN03_06037, partial [Cucurbita argyrosperma subsp. sorori... [more]
XP_038877380.14.7e-22787.42uncharacterized protein LOC120069670 [Benincasa hispida][more]
XP_022150064.14.1e-22386.49uncharacterized protein LOC111018331 [Momordica charantia][more]
Match NameE-valueIdentityDescription
O294705.7e-1025.26Uncharacterized transporter AF_0788 OS=Archaeoglobus fulgidus (strain ATCC 49558... [more]
Match NameE-valueIdentityDescription
A0A6J1JFT38.3e-23088.67uncharacterized protein LOC111484651 isoform X1 OS=Cucurbita maxima OX=3661 GN=L... [more]
A0A6J1D8X42.0e-22386.49uncharacterized protein LOC111018331 OS=Momordica charantia OX=3673 GN=LOC111018... [more]
A0A1S3BNU18.6e-21986.15uncharacterized protein LOC103491903 isoform X1 OS=Cucumis melo OX=3656 GN=LOC10... [more]
A0A6J1JIE86.4e-20690.59uncharacterized protein LOC111484651 isoform X2 OS=Cucurbita maxima OX=3661 GN=L... [more]
A0A1S3BNS39.2e-19787.68uncharacterized protein LOC103491903 isoform X2 OS=Cucumis melo OX=3656 GN=LOC10... [more]
Match NameE-valueIdentityDescription
InterPro
Analysis Name: InterPro Annotations of Sponge gourd (AG-4) v1
Date Performed: 2022-08-01
IPR TermIPR DescriptionSourceSource TermSource DescriptionAlignment
IPR000620EamA domainPFAMPF00892EamAcoord: 260..408
e-value: 6.4E-15
score: 55.5
coord: 125..250
e-value: 2.2E-10
score: 40.8
NoneNo IPR availableMOBIDB_LITEmobidb-litedisorder_predictioncoord: 521..542
NoneNo IPR availableMOBIDB_LITEmobidb-litedisorder_predictioncoord: 46..70
NoneNo IPR availablePANTHERPTHR42920OS03G0707200 PROTEIN-RELATEDcoord: 85..456
NoneNo IPR availablePANTHERPTHR42920:SF10SUBFAMILY NOT NAMEDcoord: 85..456
NoneNo IPR availableSUPERFAMILY103481Multidrug resistance efflux transporter EmrEcoord: 327..412
NoneNo IPR availableSUPERFAMILY103481Multidrug resistance efflux transporter EmrEcoord: 164..254

Relationships

This mRNA is a part of the following gene feature(s):

Feature NameUnique NameType
Lag0041347Lag0041347gene


The following exon feature(s) are a part of this mRNA:

Feature NameUnique NameType
Lag0041347.1.exon1Lag0041347.1.exon1exon
Lag0041347.1.exon2Lag0041347.1.exon2exon
Lag0041347.1.exon3Lag0041347.1.exon3exon
Lag0041347.1.exon4Lag0041347.1.exon4exon
Lag0041347.1.exon5Lag0041347.1.exon5exon
Lag0041347.1.exon6Lag0041347.1.exon6exon
Lag0041347.1.exon7Lag0041347.1.exon7exon
Lag0041347.1.exon8Lag0041347.1.exon8exon
Lag0041347.1.exon9Lag0041347.1.exon9exon


The following CDS feature(s) are a part of this mRNA:

Feature NameUnique NameType
cds.Lag0041347.1cds.Lag0041347.1CDS
cds.Lag0041347.1cds.Lag0041347.1_2CDS
cds.Lag0041347.1cds.Lag0041347.1_3CDS
cds.Lag0041347.1cds.Lag0041347.1_4CDS
cds.Lag0041347.1cds.Lag0041347.1_5CDS
cds.Lag0041347.1cds.Lag0041347.1_6CDS
cds.Lag0041347.1cds.Lag0041347.1_7CDS
cds.Lag0041347.1cds.Lag0041347.1_8CDS
cds.Lag0041347.1cds.Lag0041347.1_9CDS


The following polypeptide feature(s) derives from this mRNA:

Feature NameUnique NameType
Lag0041347.1Lag0041347.1-proteinpolypeptide


GO Annotation
GO Assignments
This mRNA is annotated with the following GO terms.
Category Term Accession Term Name
cellular_component GO:0016021 integral component of membrane
cellular_component GO:0016020 membrane