Sequences
The following sequences are available for this feature:
Gene sequence (with intron)
Legend: CDSinitialstart_codonpolypeptideintroninternalterminalstop_codon
Hold the cursor over a type above to highlight its positions in the sequence below.
ATGTCGAAGTTCAACTCCTTGATTTTGGTTTTGATTCTCTTCGTATTTCCACTTGCTCTATCGGAACAAGAAGCAATTAAAGCAATAATCCATCGTTTGGATTCCAAAACTTCATCTCCTTCGATTCAGGAAGCTGCGGCGAAGGGTCTACTCCGGCGATTGCTTCCGACTCATGTGGATAGCTTCAAGTTTCAGATTGTTTCTAGGGTACCAAGATTGGGAACTTTCCCCTCCTTGTGTTTTCTTCAGTTCAATTTCAGTTTTTATATCTCGATCGCATTTTTAGAGAAATCTCAAGTGATAATGTGAAATGTGCCACAATCTTTGAGCCCTAATTATGCTTTTCATTCTAATTTTGTATTCTGTAATCAGCACGTTAAGCATTCTTCAAATTTCCGGGAAAAATGAACTCTAATCGTGTTTTCTGATTTTCTATTTATCATCAGGACGTTTGTGGTGGAGGAAGCTGCTTCTTGATAAGTAATTTCAAGCCCTCAAGCAGTAATGGCGCAGAGATATTGTATGTTGCCTTTCATATTGATGAAGTATAAGGAAAAGAATAAGTGTTGTTAAGAATCACGACTCTCCACAATGGTACAATATTGTCCACTTTGAGCATAAGCTCTCATGACTTTGCTTTAGGCTTCCCCAAAATGCCTCATACCAATGGAGATGTGTTCCTTACTTATAAACCCATGATCATTCACTATAGACCCTCCCCGAGGCCTATGGAGCCCTCAAACAGCCTCCCTTTAATCGAGGCTCAACTCCTTCTCTGGAGTTCTCGAACAACTTACACCCTTTCTTCGACACTTGAGTCACTTTTGACTACATCTTCGAGGCTCACAACTTCTTTGTTCGACATTTGAGGATTCTATTGACATGGCTAAGTTAAGGGTATGGCTCTGATACCATGTTAGGAATCACGAACCTCCACAATGGTATGATATTGTCCACTTTGAGTATAAGCTCTTATGGTTTTGCTTTGGGCTTCCCCAAAAGGCCTCATACCAATGAAGATGTATTCCTTACTTATAAACCAGTAACCCATGATCATTCCCTAAACTAGCTAGCATGGGACTCCCCCCAACAATCCTCAACCAGTGTTTCGTTGACCTTTCCACCAACAAATGGTTAAGATGCTTTAACTTAATTTTGATCACTTGCCCTTCTATTCATTATGTAATGCTTAGCTGTGTTCGTTAATAGAGTGGTTGACTCTTCCAATCACCACTCCTAGAGGGATATGTTAGTATAAGTGCCAGAGTTTCGATATAATTAAATTTACTATAACCTATCAGCTCAAGCTTTACGGTTTAATGGTGATTTAAGAACTATATTTTACTTTTTTTAGTTTTTTTTGCAATCTTCTCAAGGATTCGAGGCACCACTGCGGTTGAAATTACGTCTGGTCTTTACTGGTACTTAAAATATTGGTGTGGTGCTCATGTTTCCTGGGACAAGACTGGTGGAGTTCAATTAGCTTCTATTCCTAAACCAGGATCTCTGCCTCGTTTAGAGGGTAACGGAGTTGTGGTTAAGCGGCCCGTGCCATGGAACTATTACCAAAATGTTGTTACTTCAAGCTGTAAGTGCTGATTTCTTATTTGTGATTTGATTCAACCTGTGTTAAGAGTTATGAATGTCAAGTTCTAGCATGCAAAGGATTTTTTCTTTAAATTATACAGAATATGCTTGTTAAAGATCACGTATTTGTTTAGAATGCTGTCAGTTAATATCTAATTAAATCTCCGTTAGGAGTTAGATCTAGTTTTTTATTTGATTTAGTTTTGATTTGATTAGATTTTATTCTGATTTGTTTACTCGTTTGTTACCAGATTTTCTGCAGATTTTTAGGTAGATTTTCTGAATATCTTTTGTTATCTCGGTATAAATATGGAGCATTCTTGCTCTTCATAATTCAATCTTCTCATATGTGAGGGGGGAAAAGTAGATTGAGGAAGATGATTACCATATCAAGAAGGGATAGAAAACTGAATCAAAGACTTCCTGGATATCAATCCATGAAATCAATATCATGCTCATCACAATTCTTTAGTCTTCTTGGTTTTTCTTCTCTTTAAATGATAAGTATTTACATTTATGCTTATTGAACTAGAGATCAGTTAGATAACACATCTTTTTCTTTTCGAGTATTATCCGATATTTCAATCCACTTTTCAGATTCCTATGTGTGGTGGGATTGGGAAAGATGGGAGAAAGAGATAGACTGGATGGCCCTCCATGGAATTAACCTACCTTTGGCATTCACTGGGCAAGAATCAATTTGGAGAAGTGTTTTCAGGGTGAGCAATTACCAAGGCCTTATTTTATTTTAGGAACATCCAAATCTGCACCTCCTTCACATTCAAATTTAATTTAGAGTTGAGATTCCATCTAGGTTGGGACTAGAGAATAGAACGACTCGAAATAGGATGAACTTTTGGAGACAGGCACTGTTGAATATAATAAGAGGGATTCGAACCCTCAATTCAAAAAACTAGTACAACGGATTAGCAATCCGATGCTTTAGTCCACTCAGCCATCTCTCCCCAAATTGAAAAAAGGATAATTACTATGATACATAGTATAAAAAATAGAAAATGATTGTTTTGCAACGTTTATTTATGCCCTTACATTCAAGGATCTGGTTTAGATGGATTGAAGAGTTTTTGTCATTTTTCTCTTGGATGTTAATGTCCTTCCATTTTGCATAGGCATTTGTCACAAGTCTCCCCATTTTTGGTAGAGTTTTCTTTTTCACTGTTCGAAATCGTGCATATTATTTGTAGGAAGAAATAAAGGTCATGTTCAAGGACTCCATTTCAAACTAAGAGTCTGCCTTTGTGAATAATCTCGAGTTTTTCTCTCTCTTTTCTCTTTCTAAATGGTGTTCATAGGGTCGCTGTCAGTTAGTATTATCATATTTTCACTTTCACCTGAGTGACACTACTTGTTTCTTTTTTACTTGTAGGATTTTAACCTCACTGTCAAAGATTTGGACAATTTCTTTGGTGGACCTGCTTTCCTTGCCTGGGCTCGCATGGGAAATCTTCATGGGTGGGTGAAATTAATTGTTCTTGAACTATAGAACATAAAAACTTACCCAGAAGTCATATATTCATTCTCAAACATGTTATTTACAATTTATGCATGTATGCTACATAGAAATATATGAGCACTTATAGAATGCACATCCATGTATTGGTGGGTTGCTTTGTTAAGTATTGGCATTCTTAAGCACTTATTAATGAGAAAAGCTCTCAACTTGTGGAAGATGAAAAGTATGGGTATTAAGATTATTTTGTGCCTTCTTTGGCCTTCAATCACGAAAAAATTGTTATAACTTATAATGTTCGTCTTTTACGTTTTGTATCGTTACTTGTTAATTGAAATGTTTCTTAAGACTTGAGTGTAAATCAATTACAGAAACACTTCCAACTTACATGATGCATTCTAAGATGGCTACTGAAGATAATCCGGCTTTCCTTGATGTTCTCATCTTTTCTTTGTTCCCATTCATATACACTGACATCTATCTTACCAAAGGTGGGGTGGGCCTCTATCACAAAATTGGTTGGATCAACAGTTAGCTTTACAGAAACAGATACTTTCAAGAATGCGAGAGTTGGGGATGACTCCAGGTTTGCTAATTCTAGTTATTAGATAAAGATAACTTAATGGTTATGAAAGTGTGATATCCAACATCGGTTGGGAGGAGAATGAAACACCTTTTATAAGGGCGTGGAAACCTCTCCCTAGCAAACACATTTTAAAAACTTTGAGGGAAAGTATGTGAGGGAAAGTGCAACGAGGACAATATCTGCTAGCGGTGTGCTTAACACCGGGCGATGTGCCAACGAGGAGGCTGTTCTCCGAAGGGGGTAGACACGAGGCGGTGTGCCAGTAAGGATGCTGGGCCCCAAAGGGGGTGGATTTGGTGGGGGTTCCACATCGATTGGAGAAAGGAACGAGTGTCAGTGAGGACGCTGGACCTTGAAGGAGGGTGGATTGTGATATCCCACATCAATTGGGGAGGAGAACAAAACACCCTTTATAAGGGTGTGGAAACCTCTCCCTAGCAGACACGTTTTAAAAACCTTGAGGGGAAGCCCGAAAGGGAAAACCCAAAGAAGATAATATTTGCTAGCGGTGGGTTTGGGTTGATACGGATGATAATTTATCATGTCATTTTGTTTGTAAACTTGATTATTTAACAGAGGCTTTTCTTTCTTTTCTTTTCAGTTCTACCATCATTCTCTGGAAATGTTCCAGCAGCTTTGGCCAAAAGATTTCCCTCAGCAGACATAACTAGATTAGGAAATTGGTATCCCATTTTTGTTTCCCTTTATATGGGTTATGATAATTCTTAATTTTTTTTTTCTTATGATAAGTTTCCCATTACTAAATATAATTTCTACTAACTAAAGCTTTCCATTTTGTTTTCCCCTGTTAGGAATTCAATTAATGCTGATCCTAGTACATGCTGTACATACCTTCTTAATCCTTCTGATCCTCTGTTTGTCAAGATTGGGGAGGCTTTTATCAGACAACAAATTAAAGGTGCACTTCCATCCGTTGGCTTTGACTTAAAAGCTCTTCTCGAATTTGCTATGACGTAAATTTAGCTTATCGGCCAAGTCGTTGCTCTTCTCATGCTTTAATATCGGTATCTCATCATGCACGCTTATCACCATGTCGAAAGAACAATAGTCTGTTTTTCAGTTAACAATTAGAAAGTAAAGGATTGTTTTTCAAAATCGTTGTTGAAAATTGAGATTGAATGAATGATAAAAGTTAATAGTATTGTGTTCATCAAAGCTGCTATTCGCAACTTCATGCTTTTTTAAGTGATAATGATTCCCTTTTTTAATAGGTTATTTGCGTTTACACATCAAAAGAAAACACAATAAAATTACAAAAAAGATTCTAAATGCAGTTAGCAAGGACATTATTTTTAGAATTATTGTTCAAAATAATAGAATCTACCCCATATCAACGTACTTTACATGGGGAGCTTGTATGCAACGGATGCATTCTTTTAAGACGGGTATAATTTGTTGTGTTTGATCATATGATGCATGTCAACTAGCTACCTATCAATTTCAGCTTTAAGCATGTTAAAATATTTTTATTGATTAATAGTATGCTGTTGTCATGCTATTGGGAATATAGATTGTTCACAAAAGATATCTCTTCAAGTTACACATTACTTTTGACATTGAACTATTATGCTTTTGTTTTTCACATTTTCTGTATTTTCTGCAGAGTATGGGGATGTGACAGACATTTACAACTGGTAACAATTATTTGTAGTACTGAATATTATCTTTATCACGTTGTTTCTTGATGTATATTGTTCTCCTGTTGATGGATAAGCACTTTCCCTGTGCATTAAGTCACTGTATATTATATGGATCGATGTGTTGGAACATCACTTTTTGTAAGGTTTTCTTAGTTAGTATTCACTCTTCTCAATGCTTAGTTTTCATTTGTGTCTTATAGTGTGATGTCTCACATTGGTTGGGGAGGAGAACAAACCACCTTGGGTGTGGAAACCTTCCCCTAGCAGACGCGTTTTAAAGCCTTGAGGAGAAACCCGAAAGGGAAAGCCCAAAGAGGACAATATCTGCTAGCAGTGAATCTAGGCCGTTACAAATGGTATCAGAGCCAGACACCGGACGATGTGCCAGCTTTCTCGCTATTCCCCGAAGGGGGTAGACACGAGGCGGTGTGCTAGTAATGACGCTGGCCCCAAACGGGGGTGGATTTGGGGGCGGTCCCACATCGATTGGAGGAAGGAAAGAGTGCCAGCGAGGACGTTGGGCCTCCGAAGGGGGGTGGATTGTGATGTCCCACATTGGTTGGGGAGGAGAAGAAACCACCATTTATAAGGGTGTGGAAACCTTCCCTTAGCAGTCGCGTTTTAAAGCCTTGAGGGGAAGCCTGAAAAGGAAAGCCCAAAGAGGACAATATCTGCTAGCGGTGGATTTGGGCCGTTACATATAGGAAAATATTCCAATACCCAAAGGAACACAGTTTAAATGGATCAGAATGCCCTTTATGAGTTAGTGCACCAACCCATGGGCAATTTGGAAGCATATGAAATTGCATCCAAGTAGTTGTGAGATCCAACATTGGTTGGAGAGGGGAACGAAGCATTCCTTATAAGCATGTGGAAACCTCTCCTTAGTAGAGACATTTTAAAACCTTGAGGGCAAGCAAAGAAGGAAAAGCCCAAAGAGGACAATATCTGCTAACGGTGGGCTTGAGCTGTTACAAATGGTATCAGAGCTAGACTCCGGACGGTGTGCCAGCGAGGACACTGGGTCCCAAGGGGGGTGGATTGTGAGATCCCACATTGGTTGGAGAGGGGAACGAAACATTCATTATAATGGTGTGAAAACCTCTCCCTAGTAGACGCGTTTTAAAACCTTGAGGGGAAGCCTAGAAGGGAAAGCCCAAAGAAGTCAATATCTGCTAACGGTGGGCTTGGGCTATTACAGTAGCAGAGAGAGAGAGAGAAATTTGAATCTAAAACAGAATTCACACAATGGCTGGCAACAACTGATTGGTATCCATAGTTCCTTTTGCATTATTATTCATTCCAGCAAAGAACTAAATGTGTCCCTTGTTTCCAAATGAGGACCCTCAGGCTTGTTGTTTTGGAACATGTTAAAAAACACTAGAATTTAAGTGCATGAAACAAGTTTAATCTCTAACAGATCATTGCAATAACTAGCTTTAGAGAAATTCCTTCACTTCCCTTATTTATCATATCTTGCTGCCATGGAGAACTGAATGATATATATCCTGTTCATTGCAGTGATACATTCAATGAAAATACTCCACCTACCAATGACACTTCATATATTTCATCACTTGGAGCTTCTGTCTATAAAGCCATGGTGAAAGCTGATAAGGATGCTGTGTGGCTTATGCAAGTATGCTCCTCATGTTACAATAGATAGTTTTGTGTCCTTAATTAATTGACTAGTCATAGCCGCATACAAGTTTTGTTTTTGGTTTCATGTTAAACTTTTTTGTTTATAGAGTAAAATTTTATTTCTTATAATCCTTTGGTTTCTGGAACTTTATTTTGGAATTTCGCTCGAACTTGAAAGGCTATTTTAAAAAGTTAGAAATGTAGGAAAATAAATGTCTAGTAAGTTTGATTCTAAACAACATAGAGCTAAAAACAAGATCATCATCAAACTAGGCATAAATGTTTGTTTTTGTTCAACTATAACGAAACCATATCGAAGGTTAACTTGGTAACCACACTGTTTATGGAGTTCAGCAGATTCAAAATTGTAGAATAGAAAGACGGGTTCATTCAAGTTTCGGGGGTGTTTATGCAAATCAAACTTTTTTACAAATTTTAGTTTGATGAGTGTTTTTTCTTTCTATATTTGTATTAAATTGATTGTTCTATCTGTGTGCAGGGATGGCTCTTCTATTCAGACTCTACTTTTTGGAAACCTGAACAAATGAAAGTATGTACGCACACAAGCCACATAGAATTTCTTAACAGTCATTGTTACTGGTAAAGGATGTATTTGATCTAAAGAGTCTCACCCAATGTCCTCATCTCTTGTTTAAAGTTGTACGGTTTGTAGTTATGTGGGATAGTTGGAGGTTGTTAGAGGGAATTGTTTAGGGTAGGGGAACAGGAATGAGGCTTGGAAATATATGGGTGTATAGAAAGAGATACAGTTCTTGCCTTGGAATATACATTGGTACCTCTCGAATTGTCGTAAGAGTAACTGTTCTTGAGCATGGATCTAGACTTCGGAAGTCTAATGGAGGCTGATGGAAATGAAGGGTGTTTCGGTATCCGTGAATTGGAAGAGAACGTTGGCCAGAAAACGAACTTATAGAAGTTCTAAAAGTAGGCTGAATCAAAGAAAAGGAATCAGAACCCATCTGCTTGCAATATGGGTTGATGGGTGTGGATGATGTCAAATCCAAGTGCGTTTAACAAAAAATAATTTATCTATGGTCTATTTGTGAGATCCCACGATGATTGGAGAGGGGAACGAGTGCTAGCGAAGACGCTGGACTCCGAAGTAGGGTGGATTGTGAGATCCTACATTGGTTGGGAGGAGAATGAAGCATTCTTTATAAGGTGTGGGAACCTCCCCTAGCAGACACATTTTAAAAACCTTGAAGGGAAGCCCGAAAGGAAAAGTCCAAAGAGGACAATATCGGCTAGCAGTGAGCTTGGGCTGTTACAAATGGTATCAGAGTCAGAGACCAGGTGGTGTGCCAGCGAGGACGCTGGTCCCGAAGGAGGGTGAATTGTGATATCCCTCATCGACTGGGGAGGGAAACGAGAATCAACGAGGATACTGGACCTTGAAAAGGGGTGGATTGTGAGATCCCACATCGGAGGGGAAGGAGAACGAAACATTCTTTATAAGGATGTAGAAACCTCCCCCTAGCAGATGCATTTTAAAAACCTTGAGGGTAAGCCCAAAAGGAAAAGCCCAAAGAGGACAATATCCGCTAGCGGTGGGCTTGAGCTGTTACACTGTTACAGGTTTCTTATTGCAACGTTGTCTTTTTTCTATGACTGTTATGTAATCCAAGGTCAAACTATTAAGTGCTAGCAACATATGCTGAATGTAAATATCTAGTTAATGTCAAAGTGGCTCTTTTTCTAGCCTTTTGGTTGTCTCATAATACCATTTATTAGCCATCTTTTATGGGATCTGCAGGCACTACTTCATTCAGTCCCATTTGGGAAAATGATTGTTCTTGATCTTTTTGCGGACGTCAAGCCTATTTGGAAAACATCATCTCAATTTTATGGCACACCCTATGTATGGTCAGTAACCCCTTTATTACCATTTTCAGAGGAGCATTGGAACGTCTCAATAATGTCCTTTCGATGTTTTTATTTCAAAAGTTTATTAAAACCTAGTTTGATTTCAGGTGTATGTTGCATAACTTTGGTGGAAATATAGAAATGTATGGTGTATTGGATGCAATCTCTTCAGGTCCAGTCGATGCCCTTGCAAGTGAAAACTCAACAATGGTATGTTTAATTCTGTATTGTATAATTTACTAAGGTCTTGCATTTTGCACATCGAACTCCTTGTTAGGAATCATGGACCTCCACGATGGTATGATATTGTCCACTTTGAGCATAAACTCTCATAGGTTTGCTTTTGGTTTTCCCAAAAGGCCTCATACCAATGGAGATAGTATTCTTTTCTTATAAACTCATGATCATCCTCTTAATTAGCCAAGGTTGGACTCCCTCCCAATAATACTCCCTTCGAACAAAATACACCATAGAGTCTCCCTTGGGGTCTATAGAGCCCTCAAACAACCTCCCTTAATTGAGGCTTGACTCCTTTCTTAGAGCCCTCGAACAAAGTACACCCTTTGTTTGACACTTAAGTCACCTTTTTACTATACTTTCGAGGCTCACAACTTCTTTGTTCGACATTTGAGGATTCTATTGACATGACTAAGTTAAGGGTATGGCTCTGATACCATGTTAGGAATCACGGACCTCCACAATGGTATGATATTCTCCACTTTGAGCATAAATTCTCATGGCTTTACTTTTGGTTTTCCCAAAAAGCCTCATACCAATGGAGATAGTATTCTTTTCTTATAAACTCATGATCATCCTTTTAATTAGCCAAGGTAGGATTCCCTCCCAACAATCCTCCCCTCGAAAAAATACACCATAGAGCCTCCCTTGAGGCCTATAGAGCCCTTGAACAGCTTCCCTTTAATTGAGGCTTGACTCCTTTCTTAGAGCCCTTGAACAAAACACACCCTTTGTTCGACACTTGAGTCAATTTTTTACTACACTTTCAAGGCTTACAACTTCTTTGTTCGACATTTGAGGATTCTATTGACATTACTAAGTTAAGGGTATAACTCTGATACCATGTTAGGAATCACTGACCTCCACGAGGGTATGATATTGTCTACTTTGAGCATAAATTCTCATGACTTTACTTTTGGTTTTCTTAAAAGGCCCCATACTAATGGAGGTCGAATTCCTTACTTATAAACCCATAATCATCCTTTTAATTAGCCAATATCGGACTTCCTCCCAACAATCCTCAACACTCCTATGAGCATGCAGCTAGCTAATATTTCTTAGAGAACAGAAGATATGTTTGTTCGCTGTATATTTTGTCGACCATAGTTCTATATTTCTTCATTTCATCCCATTCATGCATGTGAAAGTAGAATGTAAAGATTGGAACTCTTGATATTTGATCCTCTTACACATGGTGTTCCCTTCCCTATGGTAGGTTGGCGTTGGCATGTGCATGGAAGGAATAGAGCATAATTCGGTCGTTTATGAATTGATGTCTGAGATGGCATTTCGCAGCAAAAAAGTTGAAGTCCAGGTAGCTTTGATCTAAATGCCTTTTAATAGTTGAGGTTCCTATAAAAAAGAAATACATAGTTGAGGCAATATCTATGTTAAGTGATTCACGCCATTATGAGATCCCACATCTGTTGGAGAGGGGAGCAAAGTATTCCTTATAAGAGTGTGGAAACCTCTCCCTAACAGACGTGTTTTAAAACTTTGAGGGGAAGTTCGGAAAGGAAAAGCCCAAAGAAGACAATATCTGCTAGTGGTGGGCTTGGGCTGTTATAATGTTGTAACTTGCATAATTCGGTGATAGCTTATTAGATGTTGGCTTTTTTAGTAGTTTGTCAATCCTAGCACAGTTCTCTCCATGGATGAGAGAATTTGAAGGAACCATAGAGATTTACACGGTTGAGAGCCGTGTACGTTTTAACCACCCAGAGATAAAAAAATGAAGAACCACAATATCTTGGTTTGAAAGAAACTTCATGCTATTTTAATGTGAAGAGCGTTGGATTTCGATAATCGGCCAGAGAAATCCTTTTCTTTTCGGTGAGAGGAAATCTAAGTTGTTGGAAGAAAATAAAACGCGGAAAACAACAAAGAGAGAGAATGGCTGAAATTTTGACTGCGGTGTTTGTCAAATGGTCAAACAGAGAATTAATGTAATCGTGTGAATCTAAATAAGGAAAACTCAGGTTTTATCTAACAAAGAGGGGAACAAATCATTTCTTATAAGGGTGTGGAAACCTCTCCCTAACAAACGCGTTTTAAAACCATGAGACTGACAGCGATATGTAACATGGACAATATTTGCTAGCGGTGGAATTGGGCTGTTACAAATGGTATCAGAGCCAAGTTCAGGGCGGTGTGCCAGCGAGGACGTTGGACCCTCTAGGAGGGTGGATTGTTAGGTCCCACATCGGTTGGAGAGGAGAACGAAGCATTCCTTATAAGGGTGTGGAAACCTCTCCTTAGCAGACGCATTTTAAAACCGTGAAACTGACGGCTGTTAGATAAAACCTGAGTTTTTCCTTATTTAGATTCACACGATTACATTAATTCTCCGTTTGACCATTTGACAAACACGTCGAATGGATTAACGAAGTTTTAGACGGCAATTTTGTAGGAAGTGGCACAGATTCAGTTGCCACTCTCCAGCCATTTTTAATCAGAAGATTTCACAATCTAATTTTAAGGGCAGTCAAAATTTCAGTCATTCTCTCTACTTGTTATTTTACGCATTTTATTTTTCTTTCAACAACCTCCTGTCGACAATTTCCTCTCACCGAAAAGAAAGGATTTCCCTGGCCGATTATCAAAATCTAACAACGGCGATATGTAATGCAGACAATATCTGCTAGCGGTGGAATTAGGCTGTTACAAATGGTATCAGAGCCAGGTTCAGGGCGGTGTGCCAGCGAGGACGCTGGACCCCCTAGGGCGGTGGATTGTTAGGTCCCACATTGGTTGGAGAGGAGAACGAAGCATTCCTTATAAGGGTATGGAAACCTCTTCCTAGCATATGCATTTTAAAATCGTGAGGCTGACGGCTATGTAACGGACCAAAGCGGACAGTATTTGTTAGCGATAAGCTTAAGCTGTTGCATCTAAACATTGGCTACAGAGAGTCCACGTACTTTGATAGCTTTTACATATTCTCTTGGAACTGATATTATCTTCTTTGTTCGCATTCTCTCTCTGTCACAATTCTTATTCTTCTCCTGAAATGTCTACTGCTGATACAATTGAGTATTCTTGCATATAATGGATTTATGTAAACTTCCATGAAATAATTCTATGATGATCATATAAGGGCCATAATGAAATCTTGTAATCACCTGTAGGATTGGTTGACGACCTACTCCCGTTGTCGTTATGGCAAAACAGATCGTTACGTCGAGGCAGCTTGGAACATTCTTTATCATACAATTTACAATTGCACTGATGGCATTGCGGTATGTAAATTTGAGGCATAATGTTCAGAAAATAAAGTTATATTGTTTAACCATAAAAATAACCTTGAAAGTTCTTAAAAAAGCCTTTAGAAGTGCTTCAAGTAGAAGCAGTTTTTTCTAAAGTCATCTCAAACTAGTTACGTGTAGATTCGACTATTTTTCGAAATCGTGAAAATTGGTTATTTTGCCTAAAATGCTCTGTTGAAATTGTGAAACTTTGGAGACTGTTCTTAGTTCTAGTTCAAGAGAATCCTTTAGTTAACATAGGATGAAATGCACACTTCTCTTGTCTTTTTATTTTTACTGGATTTGTTGCATTTAATGTTTGTGTCTTGAAGACTTGATATGGGTGAGCTATGTGTCAAAATCATGCTCGTTCGAGGCGTGTTGTTTATGGCCGCATGCCCATGTCACGCCAAACCCTTTATTTGATATCATGTTGTATTGTCTTACTATTGTATTTTTCGTTTATATGACTGTTTGGCGAAATCACGTCTAGGTCTGCTATACCTGAATCGCCTCAAAATGTATCATAGGGGGATGCGACTAGTCATTAATTCTCTCTATGACTGTTCGGCGAAATCACGTCTAGGCTTGCCTGACCTGAATCGCCTCAAAATGTATTATAGCGATGTGATGTCCCACATTGGTTGGGGAGGAGAACAAATCACCCTTTATAAGCCTTGAGGGGAAGCCCAAAGAGGACAATATCTGCTTGCGGTGGATCTGGGTCGTTACAAATGGTATCAGAGCTAGACATTAGACGATGTGTCAGCCTTCTCGTTGTTCCCCAAAGGTGGATAGACACGATGCGGTGTGCCAGTAAGGACGCTGGCCTCAAAGGGGGGTGGATTTGGTGGCGGTTCCACATCGATTGGAGAAAGGGCCAGCGAGGACGCTGGGCCCCAAAGGGGGGTGGATTGTGATGTCCCACATTGATTGGGGAGGAGAACAAATCACCCTTTATAAGGGTGTGGAAGCCTTCCCCTAGCAGACGCGTTTTTAAAGTCTTGAGGGGAAGCCTAAAAGGAAAAGCCCAAAGAGGACGATATCTGCCAGCGGTGGATCTGGGTCGTAACAAGCGGGATGCTACTAATTGTCAGTTCTCCCCACCCGAAGTTATATGCTATATAAGTCATGTTTCCTTTATCACTTATAGCCTATAACATTGCTTTCAAAACCTTCTTTCAATATTGCTTTTAAACTCTCTTTCAAAAATCCCTCTGCCCCCGTTTTCTAAAACCTTCTTCTCAAAATGGGGCCAGAGGCTTGAGCATACGTTGTTCGGCTGCAGGCAACACGAATTCGGATTGGCTTGACTCACTCGGTGTTGGGAGTGAGTTCTGCACAATCACAAAGTCCGCTACCAAGAAAAGTGCGACTGTAACACCATGCCCAACTGCAATATGGATTCTTTTAAACTAATATGTGTGCTTCTACCATGTTTTCTATCTAAGTTAACTCCGTCTTGCCTGATTTCACTGATCCATTCCTTTGAACTTGTCGTTTTCCAGGACCATAACAATGATTTCATCGTCAAACTTCCAGATTGGGATCCATCTTCAAGCTTTGATCAGAAAATGCCACATCTATGGTATTCCACTCAGGAGGTTATCAATGCCTTGCAGCTACTCCTTAAAGCCGGTGATAATCTCCGCAACAGCGCTACATATAGGTAAAACGGCACGTTTTCCATATGCATACGGTCGAGTCGTAAGGATGTCTGATAAGATCCAATGCAACATGTTCATAGAGAAGCTAACAATGAAGCCTTATTGAATGTCATTGAACAGATATGACTTGGTTGACTTAACACGGCAAGTGCTAGGGAAGCTGGCAAATGAAGAATATTTGAAAGCTATATCTTCTTTTCAGCGCAAGAATGTGGCGGCTCTGAATCATCACAGCAAGAGATTTGTTCAATTAATAAGAGATATTGACAGATTGCTTGCTTCTGATTCAAATTTTCTGCTTGGAACATGGCTTGAAAGTGCAAAGAAGCTTGCCACAAATCCATCTGAGATGAAGCAGGTCAGGAATAACCCCTTTCTAATGGCATGATACTTGAACCATATTGCTACCTTTTTTGGTTAAGTAAAGCAAGCTTCAAATTTTCTCTTCTTGATTCAGTATGAATGGAATGCAAGAACTCAAGTGACTATGTGGTATGATAACACTGAGGTCAATCAGAGCAAGCTTCATGATTATGGTAATATTATGAACTTTAATACTGTGAGGTCCTACGTCGGTTGGGGGGAACGTAGCATTGTTTATAAGGGTGTGGAGACCTCTCCCTAGCAGATGCGTTTTAAAATTTTGAAGTCCTTGAAGGAAAAACCTGAAGAGGACAATATCTGTTAGCGGTGGGTTTGGGCTGTTACAAACAGTATCAGAGCTAGTCATTGGACGGTGTGCCAGCGAGGACGTTGGGCCCCGAGGGGGTGGATTGTGAGATCCTACATTGGTTGGAGAGGGGAACGAAGCATTCCTTATAAAGATGTGAAAACCTCTCTCTAACAGACGCGTTTTAAAACCTTGAAGGGAAATCCTTGAAGGGAAAGCTCAAAAAGGACAATATCTACTAGCGGTGGGATTGGGCTGTTACAAATGGTATTAGATCCAGTCATTGGATGGTGTGCCAGTGGGGACGTTGGGCCACAAGGGTGGTGGATTGTGAGATCTCACATCACTTGGAGAGAGGAACGAAGCATTCCTTGTAAAGGTGTGAAAACGTCTCCCTAACAGACGCGTTTTAAAACCTTAAGGGGAAGCCCTTGAAGGGAAAGCCCAAAGAGTACAATATCTGCTAGCGGTGGGTTTGGGCCGTTACAAATACTATTATATATCATGCTCTCTCTTTCAAATGAACATATTGTTGTGCTCTTTATCAGCAAATAAGTACTGGAGTGGGCTTGTTGAAGGCTACTATCTTCCAAGAGCTTTGACATACTTTTATTACGTATCAAAAAGCCTGAGAAAAAACGAGAGCTTCCATTTGGAAGAGTGGAGAAGAGAATGGATTCTGTTCTCAAACAAATGGCAAGCTGCTTCAGAAACATACCCAGTTAAAGCTGAAGGAAATTCAATTGCTATTTCTAGAGCCTTCTATGAAAAGTACTTTGGTTGA
mRNA sequence
ATGTCGAAGTTCAACTCCTTGATTTTGGTTTTGATTCTCTTCGTATTTCCACTTGCTCTATCGGAACAAGAAGCAATTAAAGCAATAATCCATCGTTTGGATTCCAAAACTTCATCTCCTTCGATTCAGGAAGCTGCGGCGAAGGGTCTACTCCGGCGATTGCTTCCGACTCATGTGGATAGCTTCAAGTTTCAGATTGTTTCTAGGGACGTTTGTGGTGGAGGAAGCTGCTTCTTGATAAGTAATTTCAAGCCCTCAAGCAGTAATGGCGCAGAGATATTGATTCGAGGCACCACTGCGGTTGAAATTACGTCTGGTCTTTACTGGTACTTAAAATATTGGTGTGGTGCTCATGTTTCCTGGGACAAGACTGGTGGAGTTCAATTAGCTTCTATTCCTAAACCAGGATCTCTGCCTCGTTTAGAGGGTAACGGAGTTGTGGTTAAGCGGCCCGTGCCATGGAACTATTACCAAAATGTTGTTACTTCAAGCTATTCCTATGTGTGGTGGGATTGGGAAAGATGGGAGAAAGAGATAGACTGGATGGCCCTCCATGGAATTAACCTACCTTTGGCATTCACTGGGCAAGAATCAATTTGGAGAAGTGTTTTCAGGGATTTTAACCTCACTGTCAAAGATTTGGACAATTTCTTTGGTGGACCTGCTTTCCTTGCCTGGGCTCGCATGGGAAATCTTCATGGGTGGGGTGGGCCTCTATCACAAAATTGGTTGGATCAACAGTTAGCTTTACAGAAACAGATACTTTCAAGAATGCGAGAGTTGGGGATGACTCCAGTTCTACCATCATTCTCTGGAAATGTTCCAGCAGCTTTGGCCAAAAGATTTCCCTCAGCAGACATAACTAGATTAGGAAATTGGAATTCAATTAATGCTGATCCTAGTACATGCTGTACATACCTTCTTAATCCTTCTGATCCTCTGTTTGTCAAGATTGGGGAGGCTTTTATCAGACAACAAATTAAAGAGTATGGGGATGTGACAGACATTTACAACTGTGATACATTCAATGAAAATACTCCACCTACCAATGACACTTCATATATTTCATCACTTGGAGCTTCTGTCTATAAAGCCATGGTGAAAGCTGATAAGGATGCTGTGTGGCTTATGCAAGGATGGCTCTTCTATTCAGACTCTACTTTTTGGAAACCTGAACAAATGAAAGCACTACTTCATTCAGTCCCATTTGGGAAAATGATTGTTCTTGATCTTTTTGCGGACGTCAAGCCTATTTGGAAAACATCATCTCAATTTTATGGCACACCCTATGTATGGTGTATGTTGCATAACTTTGGTGGAAATATAGAAATGTATGGTGTATTGGATGCAATCTCTTCAGGTCCAGTCGATGCCCTTGCAAGTGAAAACTCAACAATGGTTGGCGTTGGCATGTGCATGGAAGGAATAGAGCATAATTCGGTCGTTTATGAATTGATGTCTGAGATGGCATTTCGCAGCAAAAAAGTTGAAGTCCAGGATTGGTTGACGACCTACTCCCGTTGTCGTTATGGCAAAACAGATCGTTACGTCGAGGCAGCTTGGAACATTCTTTATCATACAATTTACAATTGCACTGATGGCATTGCGGACCATAACAATGATTTCATCGTCAAACTTCCAGATTGGGATCCATCTTCAAGCTTTGATCAGAAAATGCCACATCTATGGTATTCCACTCAGGAGGTTATCAATGCCTTGCAGCTACTCCTTAAAGCCGGTGATAATCTCCGCAACAGCGCTACATATAGATATGACTTGGTTGACTTAACACGGCAAGTGCTAGGGAAGCTGGCAAATGAAGAATATTTGAAAGCTATATCTTCTTTTCAGCGCAAGAATGTGGCGGCTCTGAATCATCACAGCAAGAGATTTGTTCAATTAATAAGAGATATTGACAGATTGCTTGCTTCTGATTCAAATTTTCTGCTTGGAACATGGCTTGAAAGTGCAAAGAAGCTTGCCACAAATCCATCTGAGATGAAGCAGTATGAATGGAATGCAAGAACTCAAGTGACTATGTGGTATGATAACACTGAGGTCAATCAGAGCAAGCTTCATGATTATGCAAATAAGTACTGGAGTGGGCTTGTTGAAGGCTACTATCTTCCAAGAGCTTTGACATACTTTTATTACGTATCAAAAAGCCTGAGAAAAAACGAGAGCTTCCATTTGGAAGAGTGGAGAAGAGAATGGATTCTGTTCTCAAACAAATGGCAAGCTGCTTCAGAAACATACCCAGTTAAAGCTGAAGGAAATTCAATTGCTATTTCTAGAGCCTTCTATGAAAAGTACTTTGGTTGA
Coding sequence (CDS)
ATGTCGAAGTTCAACTCCTTGATTTTGGTTTTGATTCTCTTCGTATTTCCACTTGCTCTATCGGAACAAGAAGCAATTAAAGCAATAATCCATCGTTTGGATTCCAAAACTTCATCTCCTTCGATTCAGGAAGCTGCGGCGAAGGGTCTACTCCGGCGATTGCTTCCGACTCATGTGGATAGCTTCAAGTTTCAGATTGTTTCTAGGGACGTTTGTGGTGGAGGAAGCTGCTTCTTGATAAGTAATTTCAAGCCCTCAAGCAGTAATGGCGCAGAGATATTGATTCGAGGCACCACTGCGGTTGAAATTACGTCTGGTCTTTACTGGTACTTAAAATATTGGTGTGGTGCTCATGTTTCCTGGGACAAGACTGGTGGAGTTCAATTAGCTTCTATTCCTAAACCAGGATCTCTGCCTCGTTTAGAGGGTAACGGAGTTGTGGTTAAGCGGCCCGTGCCATGGAACTATTACCAAAATGTTGTTACTTCAAGCTATTCCTATGTGTGGTGGGATTGGGAAAGATGGGAGAAAGAGATAGACTGGATGGCCCTCCATGGAATTAACCTACCTTTGGCATTCACTGGGCAAGAATCAATTTGGAGAAGTGTTTTCAGGGATTTTAACCTCACTGTCAAAGATTTGGACAATTTCTTTGGTGGACCTGCTTTCCTTGCCTGGGCTCGCATGGGAAATCTTCATGGGTGGGGTGGGCCTCTATCACAAAATTGGTTGGATCAACAGTTAGCTTTACAGAAACAGATACTTTCAAGAATGCGAGAGTTGGGGATGACTCCAGTTCTACCATCATTCTCTGGAAATGTTCCAGCAGCTTTGGCCAAAAGATTTCCCTCAGCAGACATAACTAGATTAGGAAATTGGAATTCAATTAATGCTGATCCTAGTACATGCTGTACATACCTTCTTAATCCTTCTGATCCTCTGTTTGTCAAGATTGGGGAGGCTTTTATCAGACAACAAATTAAAGAGTATGGGGATGTGACAGACATTTACAACTGTGATACATTCAATGAAAATACTCCACCTACCAATGACACTTCATATATTTCATCACTTGGAGCTTCTGTCTATAAAGCCATGGTGAAAGCTGATAAGGATGCTGTGTGGCTTATGCAAGGATGGCTCTTCTATTCAGACTCTACTTTTTGGAAACCTGAACAAATGAAAGCACTACTTCATTCAGTCCCATTTGGGAAAATGATTGTTCTTGATCTTTTTGCGGACGTCAAGCCTATTTGGAAAACATCATCTCAATTTTATGGCACACCCTATGTATGGTGTATGTTGCATAACTTTGGTGGAAATATAGAAATGTATGGTGTATTGGATGCAATCTCTTCAGGTCCAGTCGATGCCCTTGCAAGTGAAAACTCAACAATGGTTGGCGTTGGCATGTGCATGGAAGGAATAGAGCATAATTCGGTCGTTTATGAATTGATGTCTGAGATGGCATTTCGCAGCAAAAAAGTTGAAGTCCAGGATTGGTTGACGACCTACTCCCGTTGTCGTTATGGCAAAACAGATCGTTACGTCGAGGCAGCTTGGAACATTCTTTATCATACAATTTACAATTGCACTGATGGCATTGCGGACCATAACAATGATTTCATCGTCAAACTTCCAGATTGGGATCCATCTTCAAGCTTTGATCAGAAAATGCCACATCTATGGTATTCCACTCAGGAGGTTATCAATGCCTTGCAGCTACTCCTTAAAGCCGGTGATAATCTCCGCAACAGCGCTACATATAGATATGACTTGGTTGACTTAACACGGCAAGTGCTAGGGAAGCTGGCAAATGAAGAATATTTGAAAGCTATATCTTCTTTTCAGCGCAAGAATGTGGCGGCTCTGAATCATCACAGCAAGAGATTTGTTCAATTAATAAGAGATATTGACAGATTGCTTGCTTCTGATTCAAATTTTCTGCTTGGAACATGGCTTGAAAGTGCAAAGAAGCTTGCCACAAATCCATCTGAGATGAAGCAGTATGAATGGAATGCAAGAACTCAAGTGACTATGTGGTATGATAACACTGAGGTCAATCAGAGCAAGCTTCATGATTATGCAAATAAGTACTGGAGTGGGCTTGTTGAAGGCTACTATCTTCCAAGAGCTTTGACATACTTTTATTACGTATCAAAAAGCCTGAGAAAAAACGAGAGCTTCCATTTGGAAGAGTGGAGAAGAGAATGGATTCTGTTCTCAAACAAATGGCAAGCTGCTTCAGAAACATACCCAGTTAAAGCTGAAGGAAATTCAATTGCTATTTCTAGAGCCTTCTATGAAAAGTACTTTGGTTGA
Protein sequence
MSKFNSLILVLILFVFPLALSEQEAIKAIIHRLDSKTSSPSIQEAAAKGLLRRLLPTHVDSFKFQIVSRDVCGGGSCFLISNFKPSSSNGAEILIRGTTAVEITSGLYWYLKYWCGAHVSWDKTGGVQLASIPKPGSLPRLEGNGVVVKRPVPWNYYQNVVTSSYSYVWWDWERWEKEIDWMALHGINLPLAFTGQESIWRSVFRDFNLTVKDLDNFFGGPAFLAWARMGNLHGWGGPLSQNWLDQQLALQKQILSRMRELGMTPVLPSFSGNVPAALAKRFPSADITRLGNWNSINADPSTCCTYLLNPSDPLFVKIGEAFIRQQIKEYGDVTDIYNCDTFNENTPPTNDTSYISSLGASVYKAMVKADKDAVWLMQGWLFYSDSTFWKPEQMKALLHSVPFGKMIVLDLFADVKPIWKTSSQFYGTPYVWCMLHNFGGNIEMYGVLDAISSGPVDALASENSTMVGVGMCMEGIEHNSVVYELMSEMAFRSKKVEVQDWLTTYSRCRYGKTDRYVEAAWNILYHTIYNCTDGIADHNNDFIVKLPDWDPSSSFDQKMPHLWYSTQEVINALQLLLKAGDNLRNSATYRYDLVDLTRQVLGKLANEEYLKAISSFQRKNVAALNHHSKRFVQLIRDIDRLLASDSNFLLGTWLESAKKLATNPSEMKQYEWNARTQVTMWYDNTEVNQSKLHDYANKYWSGLVEGYYLPRALTYFYYVSKSLRKNESFHLEEWRREWILFSNKWQAASETYPVKAEGNSIAISRAFYEKYFG
Homology
BLAST of Csor.00g005080 vs. ExPASy Swiss-Prot
Match:
Q9FNA3 (Alpha-N-acetylglucosaminidase OS=Arabidopsis thaliana OX=3702 GN=NAGLU PE=2 SV=1)
HSP 1 Score: 1137.1 bits (2940), Expect = 0.0e+00
Identity = 534/797 (67.00%), Postives = 639/797 (80.18%), Query Frame = 0
Query: 7 LILVLILFVFPLALSEQEAIKAIIHRLDSKTSSPSIQEAAAKGLLRRLLPTHVDSFKFQI 66
L+L++I F I ++ RLDS + S+QE+AAKGLL+RLLPTH SF+ +I
Sbjct: 9 LVLLIISFHSQTVSKHHPTIDGLLDRLDSLLPTSSVQESAAKGLLQRLLPTHSQSFELRI 68
Query: 67 VSRDVCGGGSCFLISNFKPSSSNGAEILIRGTTAVEITSGLYWYLKYWCGAHVSWDKTGG 126
+S+D CGG SCF+I N+ G EILI+GTT VEI SGL+WYLKY C AHVSWDKTGG
Sbjct: 69 ISKDACGGTSCFVIENYDGPGRIGPEILIKGTTGVEIASGLHWYLKYKCNAHVSWDKTGG 128
Query: 127 VQLASIPKPGSLPRLEGNGVVVKRPVPWNYYQNVVTSSYSYVWWDWERWEKEIDWMALHG 186
+Q+AS+P+PG LPR++ + ++RPVPWNYYQNVVTSSYSYVWW WERWE+EIDWMAL G
Sbjct: 129 IQVASVPQPGHLPRIDSKRIFIRRPVPWNYYQNVVTSSYSYVWWGWERWEREIDWMALQG 188
Query: 187 INLPLAFTGQESIWRSVFRDFNLTVKDLDNFFGGPAFLAWARMGNLHGWGGPLSQNWLDQ 246
INLPLAFTGQE+IW+ VF+ FN++ +DLD++FGGPAFLAWARMGNLH WGGPLS+NWLD
Sbjct: 189 INLPLAFTGQEAIWQKVFKRFNISKEDLDDYFGGPAFLAWARMGNLHAWGGPLSKNWLDD 248
Query: 247 QLALQKQILSRMRELGMTPVLPSFSGNVPAALAKRFPSADITRLGNWNSINADPSTCCTY 306
QL LQKQILSRM + GMTPVLPSFSGNVP+AL K +P A+ITRL NWN+++ D CCTY
Sbjct: 249 QLLLQKQILSRMLKFGMTPVLPSFSGNVPSALRKIYPEANITRLDNWNTVDGDSRWCCTY 308
Query: 307 LLNPSDPLFVKIGEAFIRQQIKEYGDVTDIYNCDTFNENTPPTNDTSYISSLGASVYKAM 366
LLNPSDPLF++IGEAFI+QQ +EYG++T+IYNCDTFNENTPPT++ YISSLGA+VYKAM
Sbjct: 309 LLNPSDPLFIEIGEAFIKQQTEEYGEITNIYNCDTFNENTPPTSEPEYISSLGAAVYKAM 368
Query: 367 VKADKDAVWLMQGWLFYSDSTFWKPEQMKALLHSVPFGKMIVLDLFADVKPIWKTSSQFY 426
K +K+AVWLMQGWLF SDS FWKP Q+KALLHSVPFGKMIVLDL+A+VKPIW S+QFY
Sbjct: 369 SKGNKNAVWLMQGWLFSSDSKFWKPPQLKALLHSVPFGKMIVLDLYAEVKPIWNKSAQFY 428
Query: 427 GTPYVWCMLHNFGGNIEMYGVLDAISSGPVDALASENSTMVGVGMCMEGIEHNSVVYELM 486
GTPY+WCMLHNFGGNIEMYG LD+ISSGPVDA S+NSTMVGVGMCMEGIE N VVYEL
Sbjct: 429 GTPYIWCMLHNFGGNIEMYGALDSISSGPVDARVSKNSTMVGVGMCMEGIEQNPVVYELT 488
Query: 487 SEMAFRSKKVEVQDWLTTYSRCRYGKTDRYVEAAWNILYHTIYNCTDGIADHNNDFIVKL 546
SEMAFR +KV+VQ WL +Y+R RY K + +EAAW ILYHT+YNCTDGIADHN DFIVKL
Sbjct: 489 SEMAFRDEKVDVQKWLKSYARRRYMKENHQIEAAWEILYHTVYNCTDGIADHNTDFIVKL 548
Query: 547 PDWDPSSSF------------------------------DQKMPHLWYSTQEVINALQLL 606
PDWDPSSS D HLWYST+EVI AL+L
Sbjct: 549 PDWDPSSSVQDDLKQKDSYMISTGPYETKRRVLFQDKTADLPKAHLWYSTKEVIQALKLF 608
Query: 607 LKAGDNLRNSATYRYDLVDLTRQVLGKLANEEYLKAISSFQRKNVAALNHHSKRFVQLIR 666
L+AGD+L S TYRYD+VDLTRQVL KLAN+ Y +A+++F +K++ +L S++F++LI+
Sbjct: 609 LEAGDDLSRSLTYRYDMVDLTRQVLSKLANQVYTEAVTAFVKKDIGSLGQLSEKFLELIK 668
Query: 667 DIDRLLASDSNFLLGTWLESAKKLATNPSEMKQYEWNARTQVTMWYDNTEVNQSKLHDYA 726
D+D LLASD N LLGTWLESAKKLA N E KQYEWNARTQVTMWYD+ +VNQSKLHDYA
Sbjct: 669 DMDVLLASDDNCLLGTWLESAKKLAKNGDERKQYEWNARTQVTMWYDSNDVNQSKLHDYA 728
Query: 727 NKYWSGLVEGYYLPRALTYFYYVSKSLRKNESFHLEEWRREWILFSNKW-QAASETYPVK 773
NK+WSGL+E YYLPRA YF + KSLR + F +E+WRREWI+ S+KW Q++SE YPVK
Sbjct: 729 NKFWSGLLEDYYLPRARLYFNEMLKSLRDKKIFKVEKWRREWIMMSHKWQQSSSEVYPVK 788
BLAST of Csor.00g005080 vs. ExPASy Swiss-Prot
Match:
P54802 (Alpha-N-acetylglucosaminidase OS=Homo sapiens OX=9606 GN=NAGLU PE=1 SV=2)
HSP 1 Score: 577.0 bits (1486), Expect = 3.2e-163
Identity = 296/734 (40.33%), Postives = 445/734 (60.63%), Query Frame = 0
Query: 43 QEAAAKGLLRRLL-PTHVDSFKFQIVSRDVCGGGSCFLISNFKPSSSNGAEILIRGTTAV 102
+ AA + L+ RLL P F + G + + A + +RG+T V
Sbjct: 28 EAAAVRALVARLLGPGPAADFSVSVERALAAKPG----LDTYSLGGGGAARVRVRGSTGV 87
Query: 103 EITSGLYWYLKYWCGAHVSWDKTGGVQLASIPKPGSLPRLEGNGVVVKRPVPWNYYQNVV 162
+GL+ YL+ +CG HV+W G QL +P+P LP + G + P + YYQNV
Sbjct: 88 AAAAGLHRYLRDFCGCHVAW---SGSQL-RLPRP--LPAVPGE-LTEATPNRYRYYQNVC 147
Query: 163 TSSYSYVWWDWERWEKEIDWMALHGINLPLAFTGQESIWRSVFRDFNLTVKDLDNFFGGP 222
T SYS+VWWDW RWE+EIDWMAL+GINL LA++GQE+IW+ V+ LT +++ FF GP
Sbjct: 148 TQSYSFVWWDWARWEREIDWMALNGINLALAWSGQEAIWQRVYLALGLTQAEINEFFTGP 207
Query: 223 AFLAWARMGNLHGWGGPLSQNWLDQQLALQKQILSRMRELGMTPVLPSFSGNVPAALAKR 282
AFLAW RMGNLH W GPL +W +QL LQ ++L +MR GMTPVLP+F+G+VP A+ +
Sbjct: 208 AFLAWGRMGNLHTWDGPLPPSWHIKQLYLQHRVLDQMRSFGMTPVLPAFAGHVPEAVTRV 267
Query: 283 FPSADITRLGNWNSINADPSTCCTYLLNPSDPLFVKIGEAFIRQQIKEYGDVTDIYNCDT 342
FP ++T++G+W N S C++LL P DP+F IG F+R+ IKE+G IY DT
Sbjct: 268 FPQVNVTKMGSWGHFNC--SYSCSFLLAPEDPIFPIIGSLFLRELIKEFG-TDHIYGADT 327
Query: 343 FNENTPPTNDTSYISSLGASVYKAMVKADKDAVWLMQGWLFYSDSTFWKPEQMKALLHSV 402
FNE PP+++ SY+++ +VY+AM D +AVWL+QGWLF FW P Q++A+L +V
Sbjct: 328 FNEMQPPSSEPSYLAAATTAVYEAMTAVDTEAVWLLQGWLFQHQPQFWGPAQIRAVLGAV 387
Query: 403 PFGKMIVLDLFADVKPIWKTSSQFYGTPYVWCMLHNFGGNIEMYGVLDAISSGPVDALAS 462
P G+++VLDLFA+ +P++ ++ F G P++WCMLHNFGGN ++G L+A++ GP A
Sbjct: 388 PRGRLLVLDLFAESQPVYTRTASFQGQPFIWCMLHNFGGNHGLFGALEAVNGGPEAARLF 447
Query: 463 ENSTMVGVGMCMEGIEHNSVVYELMSEMAFRSKKV-EVQDWLTTYSRCRYGKTDRYVEAA 522
NSTMVG GM EGI N VVY LM+E+ +R V ++ W+T+++ RYG + AA
Sbjct: 448 PNSTMVGTGMAPEGISQNEVVYSLMAELGWRKDPVPDLAAWVTSFAARRYGVSHPDAGAA 507
Query: 523 WNILYHTIYNCT-DGIADHNNDFIVKLPDWDPSSSFDQKMPHLWYSTQEVINALQLLLKA 582
W +L ++YNC+ + HN +V+ P ++S +WY+ +V A +LLL +
Sbjct: 508 WRLLLRSVYNCSGEACRGHNRSPLVRRPSLQMNTS-------IWYNRSDVFEAWRLLLTS 567
Query: 583 GDNLRNSATYRYDLVDLTRQVLGKLANEEYLKAISSFQRKNVAALNHHSKRFV-QLIRDI 642
+L S +RYDL+DLTRQ + +L + Y +A S++ K +A+L +L+ +
Sbjct: 568 APSLATSPAFRYDLLDLTRQAVQELVSLYYEEARSAYLSKELASLLRAGGVLAYELLPAL 627
Query: 643 DRLLASDSNFLLGTWLESAKKLATNPSEMKQYEWNARTQVTMWYDNTEVNQSKLHDYANK 702
D +LASDS FLLG+WLE A+ A + +E YE N+R Q+T+W + + DYANK
Sbjct: 628 DEVLASDSRFLLGSWLEQARAAAVSEAEADFYEQNSRYQLTLWGP-----EGNILDYANK 687
Query: 703 YWSGLVEGYYLPRALTYFYYVSKSLRKNESFHLEEWRREWILFSNKWQAASETYPVKAEG 762
+GLV YY PR + + S+ + F ++ + + + + YP + G
Sbjct: 688 QLAGLVANYYTPRWRLFLEALVDSVAQGIPFQQHQFDKNVFQLEQAFVLSKQRYPSQPRG 735
Query: 763 NSIAISRAFYEKYF 773
+++ +++ + KY+
Sbjct: 748 DTVDLAKKIFLKYY 735
BLAST of Csor.00g005080 vs. NCBI nr
Match:
KAG6593283.1 (Alpha-N-acetylglucosaminidase, partial [Cucurbita argyrosperma subsp. sororia])
HSP 1 Score: 1598 bits (4137), Expect = 0.0
Identity = 773/773 (100.00%), Postives = 773/773 (100.00%), Query Frame = 0
Query: 1 MSKFNSLILVLILFVFPLALSEQEAIKAIIHRLDSKTSSPSIQEAAAKGLLRRLLPTHVD 60
MSKFNSLILVLILFVFPLALSEQEAIKAIIHRLDSKTSSPSIQEAAAKGLLRRLLPTHVD
Sbjct: 1 MSKFNSLILVLILFVFPLALSEQEAIKAIIHRLDSKTSSPSIQEAAAKGLLRRLLPTHVD 60
Query: 61 SFKFQIVSRDVCGGGSCFLISNFKPSSSNGAEILIRGTTAVEITSGLYWYLKYWCGAHVS 120
SFKFQIVSRDVCGGGSCFLISNFKPSSSNGAEILIRGTTAVEITSGLYWYLKYWCGAHVS
Sbjct: 61 SFKFQIVSRDVCGGGSCFLISNFKPSSSNGAEILIRGTTAVEITSGLYWYLKYWCGAHVS 120
Query: 121 WDKTGGVQLASIPKPGSLPRLEGNGVVVKRPVPWNYYQNVVTSSYSYVWWDWERWEKEID 180
WDKTGGVQLASIPKPGSLPRLEGNGVVVKRPVPWNYYQNVVTSSYSYVWWDWERWEKEID
Sbjct: 121 WDKTGGVQLASIPKPGSLPRLEGNGVVVKRPVPWNYYQNVVTSSYSYVWWDWERWEKEID 180
Query: 181 WMALHGINLPLAFTGQESIWRSVFRDFNLTVKDLDNFFGGPAFLAWARMGNLHGWGGPLS 240
WMALHGINLPLAFTGQESIWRSVFRDFNLTVKDLDNFFGGPAFLAWARMGNLHGWGGPLS
Sbjct: 181 WMALHGINLPLAFTGQESIWRSVFRDFNLTVKDLDNFFGGPAFLAWARMGNLHGWGGPLS 240
Query: 241 QNWLDQQLALQKQILSRMRELGMTPVLPSFSGNVPAALAKRFPSADITRLGNWNSINADP 300
QNWLDQQLALQKQILSRMRELGMTPVLPSFSGNVPAALAKRFPSADITRLGNWNSINADP
Sbjct: 241 QNWLDQQLALQKQILSRMRELGMTPVLPSFSGNVPAALAKRFPSADITRLGNWNSINADP 300
Query: 301 STCCTYLLNPSDPLFVKIGEAFIRQQIKEYGDVTDIYNCDTFNENTPPTNDTSYISSLGA 360
STCCTYLLNPSDPLFVKIGEAFIRQQIKEYGDVTDIYNCDTFNENTPPTNDTSYISSLGA
Sbjct: 301 STCCTYLLNPSDPLFVKIGEAFIRQQIKEYGDVTDIYNCDTFNENTPPTNDTSYISSLGA 360
Query: 361 SVYKAMVKADKDAVWLMQGWLFYSDSTFWKPEQMKALLHSVPFGKMIVLDLFADVKPIWK 420
SVYKAMVKADKDAVWLMQGWLFYSDSTFWKPEQMKALLHSVPFGKMIVLDLFADVKPIWK
Sbjct: 361 SVYKAMVKADKDAVWLMQGWLFYSDSTFWKPEQMKALLHSVPFGKMIVLDLFADVKPIWK 420
Query: 421 TSSQFYGTPYVWCMLHNFGGNIEMYGVLDAISSGPVDALASENSTMVGVGMCMEGIEHNS 480
TSSQFYGTPYVWCMLHNFGGNIEMYGVLDAISSGPVDALASENSTMVGVGMCMEGIEHNS
Sbjct: 421 TSSQFYGTPYVWCMLHNFGGNIEMYGVLDAISSGPVDALASENSTMVGVGMCMEGIEHNS 480
Query: 481 VVYELMSEMAFRSKKVEVQDWLTTYSRCRYGKTDRYVEAAWNILYHTIYNCTDGIADHNN 540
VVYELMSEMAFRSKKVEVQDWLTTYSRCRYGKTDRYVEAAWNILYHTIYNCTDGIADHNN
Sbjct: 481 VVYELMSEMAFRSKKVEVQDWLTTYSRCRYGKTDRYVEAAWNILYHTIYNCTDGIADHNN 540
Query: 541 DFIVKLPDWDPSSSFDQKMPHLWYSTQEVINALQLLLKAGDNLRNSATYRYDLVDLTRQV 600
DFIVKLPDWDPSSSFDQKMPHLWYSTQEVINALQLLLKAGDNLRNSATYRYDLVDLTRQV
Sbjct: 541 DFIVKLPDWDPSSSFDQKMPHLWYSTQEVINALQLLLKAGDNLRNSATYRYDLVDLTRQV 600
Query: 601 LGKLANEEYLKAISSFQRKNVAALNHHSKRFVQLIRDIDRLLASDSNFLLGTWLESAKKL 660
LGKLANEEYLKAISSFQRKNVAALNHHSKRFVQLIRDIDRLLASDSNFLLGTWLESAKKL
Sbjct: 601 LGKLANEEYLKAISSFQRKNVAALNHHSKRFVQLIRDIDRLLASDSNFLLGTWLESAKKL 660
Query: 661 ATNPSEMKQYEWNARTQVTMWYDNTEVNQSKLHDYANKYWSGLVEGYYLPRALTYFYYVS 720
ATNPSEMKQYEWNARTQVTMWYDNTEVNQSKLHDYANKYWSGLVEGYYLPRALTYFYYVS
Sbjct: 661 ATNPSEMKQYEWNARTQVTMWYDNTEVNQSKLHDYANKYWSGLVEGYYLPRALTYFYYVS 720
Query: 721 KSLRKNESFHLEEWRREWILFSNKWQAASETYPVKAEGNSIAISRAFYEKYFG 773
KSLRKNESFHLEEWRREWILFSNKWQAASETYPVKAEGNSIAISRAFYEKYFG
Sbjct: 721 KSLRKNESFHLEEWRREWILFSNKWQAASETYPVKAEGNSIAISRAFYEKYFG 773
BLAST of Csor.00g005080 vs. NCBI nr
Match:
XP_022960481.1 (alpha-N-acetylglucosaminidase [Cucurbita moschata])
HSP 1 Score: 1587 bits (4108), Expect = 0.0
Identity = 768/773 (99.35%), Postives = 768/773 (99.35%), Query Frame = 0
Query: 1 MSKFNSLILVLILFVFPLALSEQEAIKAIIHRLDSKTSSPSIQEAAAKGLLRRLLPTHVD 60
MSKFNSLILVLILFVFPLA SEQEAIKAIIHRLDSKTSSPSIQEAAAKGLLRRLLPTHVD
Sbjct: 1 MSKFNSLILVLILFVFPLAQSEQEAIKAIIHRLDSKTSSPSIQEAAAKGLLRRLLPTHVD 60
Query: 61 SFKFQIVSRDVCGGGSCFLISNFKPSSSNGAEILIRGTTAVEITSGLYWYLKYWCGAHVS 120
SFKFQIVSRDVCGGGSCFLISNFKPSSSNGAEILIRGTTAVEITSGLYWYLKYWCGAHVS
Sbjct: 61 SFKFQIVSRDVCGGGSCFLISNFKPSSSNGAEILIRGTTAVEITSGLYWYLKYWCGAHVS 120
Query: 121 WDKTGGVQLASIPKPGSLPRLEGNGVVVKRPVPWNYYQNVVTSSYSYVWWDWERWEKEID 180
WDKTGGVQLASIPKPGSLP LEGNGVVVKRPVPWNYYQNVVTSSYSYVWWDWERWEKEID
Sbjct: 121 WDKTGGVQLASIPKPGSLPLLEGNGVVVKRPVPWNYYQNVVTSSYSYVWWDWERWEKEID 180
Query: 181 WMALHGINLPLAFTGQESIWRSVFRDFNLTVKDLDNFFGGPAFLAWARMGNLHGWGGPLS 240
WMALHGINLPLAFTGQESIWRSVFRDFNLTVKDLDNFFGGPAFLAWARMGNLHGWGGPLS
Sbjct: 181 WMALHGINLPLAFTGQESIWRSVFRDFNLTVKDLDNFFGGPAFLAWARMGNLHGWGGPLS 240
Query: 241 QNWLDQQLALQKQILSRMRELGMTPVLPSFSGNVPAALAKRFPSADITRLGNWNSINADP 300
QNWLDQQLALQKQILSRMRELGMTPVLPSFSGNVPAALAKRFPSADITRLGNWNSINADP
Sbjct: 241 QNWLDQQLALQKQILSRMRELGMTPVLPSFSGNVPAALAKRFPSADITRLGNWNSINADP 300
Query: 301 STCCTYLLNPSDPLFVKIGEAFIRQQIKEYGDVTDIYNCDTFNENTPPTNDTSYISSLGA 360
STCCTYLLNPSDPLFVKIGEAFIRQQIKEYGDVTDIYNCDTFNENTPPTNDTSYISSLGA
Sbjct: 301 STCCTYLLNPSDPLFVKIGEAFIRQQIKEYGDVTDIYNCDTFNENTPPTNDTSYISSLGA 360
Query: 361 SVYKAMVKADKDAVWLMQGWLFYSDSTFWKPEQMKALLHSVPFGKMIVLDLFADVKPIWK 420
SVYKAMVKADKDAVWLMQGWLFYSDSTFWKPEQMKALLHSVPFGKMIVLDLFADVKPIWK
Sbjct: 361 SVYKAMVKADKDAVWLMQGWLFYSDSTFWKPEQMKALLHSVPFGKMIVLDLFADVKPIWK 420
Query: 421 TSSQFYGTPYVWCMLHNFGGNIEMYGVLDAISSGPVDALASENSTMVGVGMCMEGIEHNS 480
TSSQFYGTPYVWCMLHNFGGNIEMYGVLDAISSGPVDALASENSTMVGVGMCMEGIEHNS
Sbjct: 421 TSSQFYGTPYVWCMLHNFGGNIEMYGVLDAISSGPVDALASENSTMVGVGMCMEGIEHNS 480
Query: 481 VVYELMSEMAFRSKKVEVQDWLTTYSRCRYGKTDRYVEAAWNILYHTIYNCTDGIADHNN 540
VVYELMSEMAFRSKKVEVQDWL TYSRCRYGK DRYVEAAWNILYHTIYNCTDGIADHNN
Sbjct: 481 VVYELMSEMAFRSKKVEVQDWLKTYSRCRYGKADRYVEAAWNILYHTIYNCTDGIADHNN 540
Query: 541 DFIVKLPDWDPSSSFDQKMPHLWYSTQEVINALQLLLKAGDNLRNSATYRYDLVDLTRQV 600
DFIVKLPDWDPSSSFDQKMPHLWYSTQEVINALQLLLKAGDNLRNSATYRYDLVDLTRQV
Sbjct: 541 DFIVKLPDWDPSSSFDQKMPHLWYSTQEVINALQLLLKAGDNLRNSATYRYDLVDLTRQV 600
Query: 601 LGKLANEEYLKAISSFQRKNVAALNHHSKRFVQLIRDIDRLLASDSNFLLGTWLESAKKL 660
LGKLANEEYLKAISSFQRKNVAALNHHSKRFVQLIRDIDRLLASDSNFLLGTWLESAKKL
Sbjct: 601 LGKLANEEYLKAISSFQRKNVAALNHHSKRFVQLIRDIDRLLASDSNFLLGTWLESAKKL 660
Query: 661 ATNPSEMKQYEWNARTQVTMWYDNTEVNQSKLHDYANKYWSGLVEGYYLPRALTYFYYVS 720
ATNPSEMKQYEWNARTQVTMWYDNTEVNQSKLHDYANKYWSGLVEGYYLPRALTYFYYVS
Sbjct: 661 ATNPSEMKQYEWNARTQVTMWYDNTEVNQSKLHDYANKYWSGLVEGYYLPRALTYFYYVS 720
Query: 721 KSLRKNESFHLEEWRREWILFSNKWQAASETYPVKAEGNSIAISRAFYEKYFG 773
KSLRKNESFHLEEWRREWILFSNKWQAASETYPVKAEGN IAISRAFYEKYFG
Sbjct: 721 KSLRKNESFHLEEWRREWILFSNKWQAASETYPVKAEGNPIAISRAFYEKYFG 773
BLAST of Csor.00g005080 vs. NCBI nr
Match:
XP_023514212.1 (alpha-N-acetylglucosaminidase [Cucurbita pepo subsp. pepo])
HSP 1 Score: 1587 bits (4108), Expect = 0.0
Identity = 767/773 (99.22%), Postives = 769/773 (99.48%), Query Frame = 0
Query: 1 MSKFNSLILVLILFVFPLALSEQEAIKAIIHRLDSKTSSPSIQEAAAKGLLRRLLPTHVD 60
MSKFNSLILVLILFVFPLALSEQEAIKAIIHRLDSKTSSPSIQEAAAKGLLRRLLPTHVD
Sbjct: 1 MSKFNSLILVLILFVFPLALSEQEAIKAIIHRLDSKTSSPSIQEAAAKGLLRRLLPTHVD 60
Query: 61 SFKFQIVSRDVCGGGSCFLISNFKPSSSNGAEILIRGTTAVEITSGLYWYLKYWCGAHVS 120
SFKFQIVSRDVCGGGSCFLISNFKPSSSNGAEILIRGTTAVEITSGLYWYLKYWCGAHVS
Sbjct: 61 SFKFQIVSRDVCGGGSCFLISNFKPSSSNGAEILIRGTTAVEITSGLYWYLKYWCGAHVS 120
Query: 121 WDKTGGVQLASIPKPGSLPRLEGNGVVVKRPVPWNYYQNVVTSSYSYVWWDWERWEKEID 180
WDKTGGVQLASIPKPGSLP LEGNGVVVKRPVPWNYYQNVVTSSYSYVWWDWERWEKEID
Sbjct: 121 WDKTGGVQLASIPKPGSLPLLEGNGVVVKRPVPWNYYQNVVTSSYSYVWWDWERWEKEID 180
Query: 181 WMALHGINLPLAFTGQESIWRSVFRDFNLTVKDLDNFFGGPAFLAWARMGNLHGWGGPLS 240
WMALHGINLPLAFTGQESIWRSVFRDFNLTVKDLDNFFGGPAFLAWARMGNLHGWGGPLS
Sbjct: 181 WMALHGINLPLAFTGQESIWRSVFRDFNLTVKDLDNFFGGPAFLAWARMGNLHGWGGPLS 240
Query: 241 QNWLDQQLALQKQILSRMRELGMTPVLPSFSGNVPAALAKRFPSADITRLGNWNSINADP 300
Q+WLDQQLALQK ILSRMRELGMTPVLPSFSGNVPAALAKRFPSADITRLGNWNSINADP
Sbjct: 241 QSWLDQQLALQKHILSRMRELGMTPVLPSFSGNVPAALAKRFPSADITRLGNWNSINADP 300
Query: 301 STCCTYLLNPSDPLFVKIGEAFIRQQIKEYGDVTDIYNCDTFNENTPPTNDTSYISSLGA 360
STCCTYLLNPSDPLFVKIGEAFIRQQIKEYGDVTDIYNCDTFNENTPPTNDTSYISSLGA
Sbjct: 301 STCCTYLLNPSDPLFVKIGEAFIRQQIKEYGDVTDIYNCDTFNENTPPTNDTSYISSLGA 360
Query: 361 SVYKAMVKADKDAVWLMQGWLFYSDSTFWKPEQMKALLHSVPFGKMIVLDLFADVKPIWK 420
SVYKAMVKADKDAVWLMQGWLFYSDSTFWKPEQMKALLHSVPFGKMIVLDLFADVKPIWK
Sbjct: 361 SVYKAMVKADKDAVWLMQGWLFYSDSTFWKPEQMKALLHSVPFGKMIVLDLFADVKPIWK 420
Query: 421 TSSQFYGTPYVWCMLHNFGGNIEMYGVLDAISSGPVDALASENSTMVGVGMCMEGIEHNS 480
TSSQFYGTPYVWCMLHNFGGNIEMYGVLDAISSGPVDALASENSTMVGVGMCMEGIEHNS
Sbjct: 421 TSSQFYGTPYVWCMLHNFGGNIEMYGVLDAISSGPVDALASENSTMVGVGMCMEGIEHNS 480
Query: 481 VVYELMSEMAFRSKKVEVQDWLTTYSRCRYGKTDRYVEAAWNILYHTIYNCTDGIADHNN 540
VVYELMSEMAFRSKKVEVQDWL TYSRCRYGK DRYVEAAWN+LYHTIYNCTDGIADHNN
Sbjct: 481 VVYELMSEMAFRSKKVEVQDWLKTYSRCRYGKADRYVEAAWNVLYHTIYNCTDGIADHNN 540
Query: 541 DFIVKLPDWDPSSSFDQKMPHLWYSTQEVINALQLLLKAGDNLRNSATYRYDLVDLTRQV 600
DFIVKLPDWDPSSSFDQKMPHLWYSTQEVINALQLLLKAGDNLRNSATYRYDLVDLTRQV
Sbjct: 541 DFIVKLPDWDPSSSFDQKMPHLWYSTQEVINALQLLLKAGDNLRNSATYRYDLVDLTRQV 600
Query: 601 LGKLANEEYLKAISSFQRKNVAALNHHSKRFVQLIRDIDRLLASDSNFLLGTWLESAKKL 660
LGKLANEEYLKAISSFQRKNVAALNHHSKRFVQLIRDIDRLLASDSNFLLGTWLESAKKL
Sbjct: 601 LGKLANEEYLKAISSFQRKNVAALNHHSKRFVQLIRDIDRLLASDSNFLLGTWLESAKKL 660
Query: 661 ATNPSEMKQYEWNARTQVTMWYDNTEVNQSKLHDYANKYWSGLVEGYYLPRALTYFYYVS 720
ATNPSEMKQYEWNARTQVTMWYDNTEVNQSKLHDYANKYWSGLVEGYYLPRALTYFYYVS
Sbjct: 661 ATNPSEMKQYEWNARTQVTMWYDNTEVNQSKLHDYANKYWSGLVEGYYLPRALTYFYYVS 720
Query: 721 KSLRKNESFHLEEWRREWILFSNKWQAASETYPVKAEGNSIAISRAFYEKYFG 773
KSLRKNESFHLEEWRREWILFSNKWQAASETYPVKAEGNSIAISRAFYEKYFG
Sbjct: 721 KSLRKNESFHLEEWRREWILFSNKWQAASETYPVKAEGNSIAISRAFYEKYFG 773
BLAST of Csor.00g005080 vs. NCBI nr
Match:
XP_023004465.1 (alpha-N-acetylglucosaminidase [Cucurbita maxima])
HSP 1 Score: 1576 bits (4082), Expect = 0.0
Identity = 759/773 (98.19%), Postives = 766/773 (99.09%), Query Frame = 0
Query: 1 MSKFNSLILVLILFVFPLALSEQEAIKAIIHRLDSKTSSPSIQEAAAKGLLRRLLPTHVD 60
MSKFNSLILVLILFVFPLALSEQEAIKAIIHRLDSKTSSPSIQEAAAKGLLRR LPTHVD
Sbjct: 1 MSKFNSLILVLILFVFPLALSEQEAIKAIIHRLDSKTSSPSIQEAAAKGLLRRFLPTHVD 60
Query: 61 SFKFQIVSRDVCGGGSCFLISNFKPSSSNGAEILIRGTTAVEITSGLYWYLKYWCGAHVS 120
SFKFQIVSRDVCGGGSCFLISNFKPSSSN AEILIRGTTAVEITSGLYWYLKYWCGAHVS
Sbjct: 61 SFKFQIVSRDVCGGGSCFLISNFKPSSSNSAEILIRGTTAVEITSGLYWYLKYWCGAHVS 120
Query: 121 WDKTGGVQLASIPKPGSLPRLEGNGVVVKRPVPWNYYQNVVTSSYSYVWWDWERWEKEID 180
WDKTGGVQLASIPKPGSLP LEGNGVVVKRPVPWNYYQNVVTSSYSYVWWDWERWEKEID
Sbjct: 121 WDKTGGVQLASIPKPGSLPLLEGNGVVVKRPVPWNYYQNVVTSSYSYVWWDWERWEKEID 180
Query: 181 WMALHGINLPLAFTGQESIWRSVFRDFNLTVKDLDNFFGGPAFLAWARMGNLHGWGGPLS 240
WMALHGINLPLAFTGQES+WRSVFRDFNLTVKDLDNFFGGPAFLAWARMGNLHGWGGPLS
Sbjct: 181 WMALHGINLPLAFTGQESVWRSVFRDFNLTVKDLDNFFGGPAFLAWARMGNLHGWGGPLS 240
Query: 241 QNWLDQQLALQKQILSRMRELGMTPVLPSFSGNVPAALAKRFPSADITRLGNWNSINADP 300
+NWLDQQLALQKQILSRMRELGMTPVLPSFSGNVPAAL KRFPSADITRLGNWNSINADP
Sbjct: 241 KNWLDQQLALQKQILSRMRELGMTPVLPSFSGNVPAALTKRFPSADITRLGNWNSINADP 300
Query: 301 STCCTYLLNPSDPLFVKIGEAFIRQQIKEYGDVTDIYNCDTFNENTPPTNDTSYISSLGA 360
STCCTYLLNPSDPLFVKIGEAFIRQQIKEYGDVTDIYNCDTFNENTPPTNDTSYISSLGA
Sbjct: 301 STCCTYLLNPSDPLFVKIGEAFIRQQIKEYGDVTDIYNCDTFNENTPPTNDTSYISSLGA 360
Query: 361 SVYKAMVKADKDAVWLMQGWLFYSDSTFWKPEQMKALLHSVPFGKMIVLDLFADVKPIWK 420
SVYKAMVKADKDAVWLMQGWLFYSDSTFWKPEQMKALLHSVPFGKMIVLDLFADVKPIWK
Sbjct: 361 SVYKAMVKADKDAVWLMQGWLFYSDSTFWKPEQMKALLHSVPFGKMIVLDLFADVKPIWK 420
Query: 421 TSSQFYGTPYVWCMLHNFGGNIEMYGVLDAISSGPVDALASENSTMVGVGMCMEGIEHNS 480
TSSQFYGTPYVWCMLHNFGGNIEMYGVLDAISSGPVDALASENSTMVGVGMCMEGIEHNS
Sbjct: 421 TSSQFYGTPYVWCMLHNFGGNIEMYGVLDAISSGPVDALASENSTMVGVGMCMEGIEHNS 480
Query: 481 VVYELMSEMAFRSKKVEVQDWLTTYSRCRYGKTDRYVEAAWNILYHTIYNCTDGIADHNN 540
VVYELMSEMAFRSKKVEVQDWLTTYSRCRYGK DR+VEAAWNILYHTIYNCTDGIADHNN
Sbjct: 481 VVYELMSEMAFRSKKVEVQDWLTTYSRCRYGKADRFVEAAWNILYHTIYNCTDGIADHNN 540
Query: 541 DFIVKLPDWDPSSSFDQKMPHLWYSTQEVINALQLLLKAGDNLRNSATYRYDLVDLTRQV 600
DFIVKLPDWDPSSSFDQKMPHLWY TQEVINALQLLLKAGDNLRNS TYRYDLVDLTRQV
Sbjct: 541 DFIVKLPDWDPSSSFDQKMPHLWYPTQEVINALQLLLKAGDNLRNSTTYRYDLVDLTRQV 600
Query: 601 LGKLANEEYLKAISSFQRKNVAALNHHSKRFVQLIRDIDRLLASDSNFLLGTWLESAKKL 660
LGKLANEEYLKA+SSF+RKNVAALNHHSKRFVQLIRDIDRLLASDSNFL+GTWLESAKKL
Sbjct: 601 LGKLANEEYLKAVSSFRRKNVAALNHHSKRFVQLIRDIDRLLASDSNFLVGTWLESAKKL 660
Query: 661 ATNPSEMKQYEWNARTQVTMWYDNTEVNQSKLHDYANKYWSGLVEGYYLPRALTYFYYVS 720
ATNPSEMKQYEWNARTQVTMWYDNTEVNQSKLHDYANKYWSGL+EGYYLPRALTYFYYVS
Sbjct: 661 ATNPSEMKQYEWNARTQVTMWYDNTEVNQSKLHDYANKYWSGLLEGYYLPRALTYFYYVS 720
Query: 721 KSLRKNESFHLEEWRREWILFSNKWQAASETYPVKAEGNSIAISRAFYEKYFG 773
KSLRKNESFHLEEWRREWILFSNKWQAASETYPVKAEGNSIAISRAFYEKYFG
Sbjct: 721 KSLRKNESFHLEEWRREWILFSNKWQAASETYPVKAEGNSIAISRAFYEKYFG 773
BLAST of Csor.00g005080 vs. NCBI nr
Match:
XP_038897835.1 (alpha-N-acetylglucosaminidase isoform X2 [Benincasa hispida])
HSP 1 Score: 1474 bits (3815), Expect = 0.0
Identity = 705/773 (91.20%), Postives = 739/773 (95.60%), Query Frame = 0
Query: 1 MSKFNSLILVLILFVFPLALSEQEAIKAIIHRLDSKTSSPSIQEAAAKGLLRRLLPTHVD 60
MS F SLILVLIL V PLALSEQEAI+AIIHRLDSKT PSIQEAAA+ LLRRLLPTHVD
Sbjct: 1 MSNFISLILVLILVVLPLALSEQEAIQAIIHRLDSKTLPPSIQEAAAQALLRRLLPTHVD 60
Query: 61 SFKFQIVSRDVCGGGSCFLISNFKPSSSNGAEILIRGTTAVEITSGLYWYLKYWCGAHVS 120
SF+FQIVSRDVCGGGSCFLISNFK SS NGAEI I+GTTAVEITSGLYWYLKYWCGAHVS
Sbjct: 61 SFEFQIVSRDVCGGGSCFLISNFKSSSRNGAEIFIKGTTAVEITSGLYWYLKYWCGAHVS 120
Query: 121 WDKTGGVQLASIPKPGSLPRLEGNGVVVKRPVPWNYYQNVVTSSYSYVWWDWERWEKEID 180
WDKTGGVQLASIPKPGSLP L+G+GVVVKRPVPWNYYQNVVTSSYSYVWWDWERWEKEID
Sbjct: 121 WDKTGGVQLASIPKPGSLPLLKGDGVVVKRPVPWNYYQNVVTSSYSYVWWDWERWEKEID 180
Query: 181 WMALHGINLPLAFTGQESIWRSVFRDFNLTVKDLDNFFGGPAFLAWARMGNLHGWGGPLS 240
WMALHGINLPLAFTGQESIWR+VFRDFNLTVK+LDNFFGGPAFLAWARMGNLHGWGGPLS
Sbjct: 181 WMALHGINLPLAFTGQESIWRNVFRDFNLTVKELDNFFGGPAFLAWARMGNLHGWGGPLS 240
Query: 241 QNWLDQQLALQKQILSRMRELGMTPVLPSFSGNVPAALAKRFPSADITRLGNWNSINADP 300
+NWLDQQL+LQKQILSRM+ELGMTPVLPSFSGNVPA LA+ FPSADITRLGNWNSI+ADP
Sbjct: 241 KNWLDQQLSLQKQILSRMQELGMTPVLPSFSGNVPAGLAEIFPSADITRLGNWNSIDADP 300
Query: 301 STCCTYLLNPSDPLFVKIGEAFIRQQIKEYGDVTDIYNCDTFNENTPPTNDTSYISSLGA 360
STCCTYLLNPSDPLFV+IGEAFIRQQIKEYGDVTDIYNCDTFNENTPPTNDTSYISSLGA
Sbjct: 301 STCCTYLLNPSDPLFVEIGEAFIRQQIKEYGDVTDIYNCDTFNENTPPTNDTSYISSLGA 360
Query: 361 SVYKAMVKADKDAVWLMQGWLFYSDSTFWKPEQMKALLHSVPFGKMIVLDLFADVKPIWK 420
SVYKAMVKADKDAVWLMQGWLFYSDSTFWKP+QMKALLHSVPFGKMIVLDLFADV+PIW+
Sbjct: 361 SVYKAMVKADKDAVWLMQGWLFYSDSTFWKPDQMKALLHSVPFGKMIVLDLFADVRPIWR 420
Query: 421 TSSQFYGTPYVWCMLHNFGGNIEMYGVLDAISSGPVDALASENSTMVGVGMCMEGIEHNS 480
TSSQFYGTPYVWCMLHNFGGNIEMYG+LDAISSGPVDALASENSTMVGVGMCMEGIEHN
Sbjct: 421 TSSQFYGTPYVWCMLHNFGGNIEMYGILDAISSGPVDALASENSTMVGVGMCMEGIEHNP 480
Query: 481 VVYELMSEMAFRSKKVEVQDWLTTYSRCRYGKTDRYVEAAWNILYHTIYNCTDGIADHNN 540
VVYELMSEMAFRSKKV VQ+WL TYSRCRYGK D YV+AAW ILYHTIYNCTDGIADHN
Sbjct: 481 VVYELMSEMAFRSKKVVVQEWLKTYSRCRYGKADHYVDAAWTILYHTIYNCTDGIADHNT 540
Query: 541 DFIVKLPDWDPSSSFDQKMPHLWYSTQEVINALQLLLKAGDNLRNSATYRYDLVDLTRQV 600
DFIVKLPDWDPSSS D + PHLWYSTQEV NALQLLL A DNL + ATYRYDLVDLTRQV
Sbjct: 541 DFIVKLPDWDPSSSSDLRKPHLWYSTQEVTNALQLLLNADDNLIHGATYRYDLVDLTRQV 600
Query: 601 LGKLANEEYLKAISSFQRKNVAALNHHSKRFVQLIRDIDRLLASDSNFLLGTWLESAKKL 660
LGKLANEEYLKA+++FQRKNV A N HSKRF+QLIRDIDRLLAS+SNFLLGTWLESAKKL
Sbjct: 601 LGKLANEEYLKAVTAFQRKNVKAQNLHSKRFIQLIRDIDRLLASNSNFLLGTWLESAKKL 660
Query: 661 ATNPSEMKQYEWNARTQVTMWYDNTEVNQSKLHDYANKYWSGLVEGYYLPRALTYFYYVS 720
ATN SEMKQYEWNARTQVTMWYDNTE+NQSKLHDYANKYWSGL+EGYYLPRALTYFYY+S
Sbjct: 661 ATNASEMKQYEWNARTQVTMWYDNTEINQSKLHDYANKYWSGLLEGYYLPRALTYFYYLS 720
Query: 721 KSLRKNESFHLEEWRREWILFSNKWQAASETYPVKAEGNSIAISRAFYEKYFG 773
KSLRKNESFHLE+WRREWILFSNKWQAASE YPVKAEGN++AIS+A YEKYFG
Sbjct: 721 KSLRKNESFHLEDWRREWILFSNKWQAASELYPVKAEGNAVAISKALYEKYFG 773
BLAST of Csor.00g005080 vs. ExPASy TrEMBL
Match:
A0A6J1H7Q2 (alpha-N-acetylglucosaminidase OS=Cucurbita moschata OX=3662 GN=LOC111461205 PE=4 SV=1)
HSP 1 Score: 1587 bits (4108), Expect = 0.0
Identity = 768/773 (99.35%), Postives = 768/773 (99.35%), Query Frame = 0
Query: 1 MSKFNSLILVLILFVFPLALSEQEAIKAIIHRLDSKTSSPSIQEAAAKGLLRRLLPTHVD 60
MSKFNSLILVLILFVFPLA SEQEAIKAIIHRLDSKTSSPSIQEAAAKGLLRRLLPTHVD
Sbjct: 1 MSKFNSLILVLILFVFPLAQSEQEAIKAIIHRLDSKTSSPSIQEAAAKGLLRRLLPTHVD 60
Query: 61 SFKFQIVSRDVCGGGSCFLISNFKPSSSNGAEILIRGTTAVEITSGLYWYLKYWCGAHVS 120
SFKFQIVSRDVCGGGSCFLISNFKPSSSNGAEILIRGTTAVEITSGLYWYLKYWCGAHVS
Sbjct: 61 SFKFQIVSRDVCGGGSCFLISNFKPSSSNGAEILIRGTTAVEITSGLYWYLKYWCGAHVS 120
Query: 121 WDKTGGVQLASIPKPGSLPRLEGNGVVVKRPVPWNYYQNVVTSSYSYVWWDWERWEKEID 180
WDKTGGVQLASIPKPGSLP LEGNGVVVKRPVPWNYYQNVVTSSYSYVWWDWERWEKEID
Sbjct: 121 WDKTGGVQLASIPKPGSLPLLEGNGVVVKRPVPWNYYQNVVTSSYSYVWWDWERWEKEID 180
Query: 181 WMALHGINLPLAFTGQESIWRSVFRDFNLTVKDLDNFFGGPAFLAWARMGNLHGWGGPLS 240
WMALHGINLPLAFTGQESIWRSVFRDFNLTVKDLDNFFGGPAFLAWARMGNLHGWGGPLS
Sbjct: 181 WMALHGINLPLAFTGQESIWRSVFRDFNLTVKDLDNFFGGPAFLAWARMGNLHGWGGPLS 240
Query: 241 QNWLDQQLALQKQILSRMRELGMTPVLPSFSGNVPAALAKRFPSADITRLGNWNSINADP 300
QNWLDQQLALQKQILSRMRELGMTPVLPSFSGNVPAALAKRFPSADITRLGNWNSINADP
Sbjct: 241 QNWLDQQLALQKQILSRMRELGMTPVLPSFSGNVPAALAKRFPSADITRLGNWNSINADP 300
Query: 301 STCCTYLLNPSDPLFVKIGEAFIRQQIKEYGDVTDIYNCDTFNENTPPTNDTSYISSLGA 360
STCCTYLLNPSDPLFVKIGEAFIRQQIKEYGDVTDIYNCDTFNENTPPTNDTSYISSLGA
Sbjct: 301 STCCTYLLNPSDPLFVKIGEAFIRQQIKEYGDVTDIYNCDTFNENTPPTNDTSYISSLGA 360
Query: 361 SVYKAMVKADKDAVWLMQGWLFYSDSTFWKPEQMKALLHSVPFGKMIVLDLFADVKPIWK 420
SVYKAMVKADKDAVWLMQGWLFYSDSTFWKPEQMKALLHSVPFGKMIVLDLFADVKPIWK
Sbjct: 361 SVYKAMVKADKDAVWLMQGWLFYSDSTFWKPEQMKALLHSVPFGKMIVLDLFADVKPIWK 420
Query: 421 TSSQFYGTPYVWCMLHNFGGNIEMYGVLDAISSGPVDALASENSTMVGVGMCMEGIEHNS 480
TSSQFYGTPYVWCMLHNFGGNIEMYGVLDAISSGPVDALASENSTMVGVGMCMEGIEHNS
Sbjct: 421 TSSQFYGTPYVWCMLHNFGGNIEMYGVLDAISSGPVDALASENSTMVGVGMCMEGIEHNS 480
Query: 481 VVYELMSEMAFRSKKVEVQDWLTTYSRCRYGKTDRYVEAAWNILYHTIYNCTDGIADHNN 540
VVYELMSEMAFRSKKVEVQDWL TYSRCRYGK DRYVEAAWNILYHTIYNCTDGIADHNN
Sbjct: 481 VVYELMSEMAFRSKKVEVQDWLKTYSRCRYGKADRYVEAAWNILYHTIYNCTDGIADHNN 540
Query: 541 DFIVKLPDWDPSSSFDQKMPHLWYSTQEVINALQLLLKAGDNLRNSATYRYDLVDLTRQV 600
DFIVKLPDWDPSSSFDQKMPHLWYSTQEVINALQLLLKAGDNLRNSATYRYDLVDLTRQV
Sbjct: 541 DFIVKLPDWDPSSSFDQKMPHLWYSTQEVINALQLLLKAGDNLRNSATYRYDLVDLTRQV 600
Query: 601 LGKLANEEYLKAISSFQRKNVAALNHHSKRFVQLIRDIDRLLASDSNFLLGTWLESAKKL 660
LGKLANEEYLKAISSFQRKNVAALNHHSKRFVQLIRDIDRLLASDSNFLLGTWLESAKKL
Sbjct: 601 LGKLANEEYLKAISSFQRKNVAALNHHSKRFVQLIRDIDRLLASDSNFLLGTWLESAKKL 660
Query: 661 ATNPSEMKQYEWNARTQVTMWYDNTEVNQSKLHDYANKYWSGLVEGYYLPRALTYFYYVS 720
ATNPSEMKQYEWNARTQVTMWYDNTEVNQSKLHDYANKYWSGLVEGYYLPRALTYFYYVS
Sbjct: 661 ATNPSEMKQYEWNARTQVTMWYDNTEVNQSKLHDYANKYWSGLVEGYYLPRALTYFYYVS 720
Query: 721 KSLRKNESFHLEEWRREWILFSNKWQAASETYPVKAEGNSIAISRAFYEKYFG 773
KSLRKNESFHLEEWRREWILFSNKWQAASETYPVKAEGN IAISRAFYEKYFG
Sbjct: 721 KSLRKNESFHLEEWRREWILFSNKWQAASETYPVKAEGNPIAISRAFYEKYFG 773
BLAST of Csor.00g005080 vs. ExPASy TrEMBL
Match:
A0A6J1KUM7 (alpha-N-acetylglucosaminidase OS=Cucurbita maxima OX=3661 GN=LOC111497764 PE=4 SV=1)
HSP 1 Score: 1576 bits (4082), Expect = 0.0
Identity = 759/773 (98.19%), Postives = 766/773 (99.09%), Query Frame = 0
Query: 1 MSKFNSLILVLILFVFPLALSEQEAIKAIIHRLDSKTSSPSIQEAAAKGLLRRLLPTHVD 60
MSKFNSLILVLILFVFPLALSEQEAIKAIIHRLDSKTSSPSIQEAAAKGLLRR LPTHVD
Sbjct: 1 MSKFNSLILVLILFVFPLALSEQEAIKAIIHRLDSKTSSPSIQEAAAKGLLRRFLPTHVD 60
Query: 61 SFKFQIVSRDVCGGGSCFLISNFKPSSSNGAEILIRGTTAVEITSGLYWYLKYWCGAHVS 120
SFKFQIVSRDVCGGGSCFLISNFKPSSSN AEILIRGTTAVEITSGLYWYLKYWCGAHVS
Sbjct: 61 SFKFQIVSRDVCGGGSCFLISNFKPSSSNSAEILIRGTTAVEITSGLYWYLKYWCGAHVS 120
Query: 121 WDKTGGVQLASIPKPGSLPRLEGNGVVVKRPVPWNYYQNVVTSSYSYVWWDWERWEKEID 180
WDKTGGVQLASIPKPGSLP LEGNGVVVKRPVPWNYYQNVVTSSYSYVWWDWERWEKEID
Sbjct: 121 WDKTGGVQLASIPKPGSLPLLEGNGVVVKRPVPWNYYQNVVTSSYSYVWWDWERWEKEID 180
Query: 181 WMALHGINLPLAFTGQESIWRSVFRDFNLTVKDLDNFFGGPAFLAWARMGNLHGWGGPLS 240
WMALHGINLPLAFTGQES+WRSVFRDFNLTVKDLDNFFGGPAFLAWARMGNLHGWGGPLS
Sbjct: 181 WMALHGINLPLAFTGQESVWRSVFRDFNLTVKDLDNFFGGPAFLAWARMGNLHGWGGPLS 240
Query: 241 QNWLDQQLALQKQILSRMRELGMTPVLPSFSGNVPAALAKRFPSADITRLGNWNSINADP 300
+NWLDQQLALQKQILSRMRELGMTPVLPSFSGNVPAAL KRFPSADITRLGNWNSINADP
Sbjct: 241 KNWLDQQLALQKQILSRMRELGMTPVLPSFSGNVPAALTKRFPSADITRLGNWNSINADP 300
Query: 301 STCCTYLLNPSDPLFVKIGEAFIRQQIKEYGDVTDIYNCDTFNENTPPTNDTSYISSLGA 360
STCCTYLLNPSDPLFVKIGEAFIRQQIKEYGDVTDIYNCDTFNENTPPTNDTSYISSLGA
Sbjct: 301 STCCTYLLNPSDPLFVKIGEAFIRQQIKEYGDVTDIYNCDTFNENTPPTNDTSYISSLGA 360
Query: 361 SVYKAMVKADKDAVWLMQGWLFYSDSTFWKPEQMKALLHSVPFGKMIVLDLFADVKPIWK 420
SVYKAMVKADKDAVWLMQGWLFYSDSTFWKPEQMKALLHSVPFGKMIVLDLFADVKPIWK
Sbjct: 361 SVYKAMVKADKDAVWLMQGWLFYSDSTFWKPEQMKALLHSVPFGKMIVLDLFADVKPIWK 420
Query: 421 TSSQFYGTPYVWCMLHNFGGNIEMYGVLDAISSGPVDALASENSTMVGVGMCMEGIEHNS 480
TSSQFYGTPYVWCMLHNFGGNIEMYGVLDAISSGPVDALASENSTMVGVGMCMEGIEHNS
Sbjct: 421 TSSQFYGTPYVWCMLHNFGGNIEMYGVLDAISSGPVDALASENSTMVGVGMCMEGIEHNS 480
Query: 481 VVYELMSEMAFRSKKVEVQDWLTTYSRCRYGKTDRYVEAAWNILYHTIYNCTDGIADHNN 540
VVYELMSEMAFRSKKVEVQDWLTTYSRCRYGK DR+VEAAWNILYHTIYNCTDGIADHNN
Sbjct: 481 VVYELMSEMAFRSKKVEVQDWLTTYSRCRYGKADRFVEAAWNILYHTIYNCTDGIADHNN 540
Query: 541 DFIVKLPDWDPSSSFDQKMPHLWYSTQEVINALQLLLKAGDNLRNSATYRYDLVDLTRQV 600
DFIVKLPDWDPSSSFDQKMPHLWY TQEVINALQLLLKAGDNLRNS TYRYDLVDLTRQV
Sbjct: 541 DFIVKLPDWDPSSSFDQKMPHLWYPTQEVINALQLLLKAGDNLRNSTTYRYDLVDLTRQV 600
Query: 601 LGKLANEEYLKAISSFQRKNVAALNHHSKRFVQLIRDIDRLLASDSNFLLGTWLESAKKL 660
LGKLANEEYLKA+SSF+RKNVAALNHHSKRFVQLIRDIDRLLASDSNFL+GTWLESAKKL
Sbjct: 601 LGKLANEEYLKAVSSFRRKNVAALNHHSKRFVQLIRDIDRLLASDSNFLVGTWLESAKKL 660
Query: 661 ATNPSEMKQYEWNARTQVTMWYDNTEVNQSKLHDYANKYWSGLVEGYYLPRALTYFYYVS 720
ATNPSEMKQYEWNARTQVTMWYDNTEVNQSKLHDYANKYWSGL+EGYYLPRALTYFYYVS
Sbjct: 661 ATNPSEMKQYEWNARTQVTMWYDNTEVNQSKLHDYANKYWSGLLEGYYLPRALTYFYYVS 720
Query: 721 KSLRKNESFHLEEWRREWILFSNKWQAASETYPVKAEGNSIAISRAFYEKYFG 773
KSLRKNESFHLEEWRREWILFSNKWQAASETYPVKAEGNSIAISRAFYEKYFG
Sbjct: 721 KSLRKNESFHLEEWRREWILFSNKWQAASETYPVKAEGNSIAISRAFYEKYFG 773
BLAST of Csor.00g005080 vs. ExPASy TrEMBL
Match:
A0A1S3CEF3 (alpha-N-acetylglucosaminidase OS=Cucumis melo OX=3656 GN=LOC103499946 PE=4 SV=1)
HSP 1 Score: 1465 bits (3793), Expect = 0.0
Identity = 701/774 (90.57%), Postives = 741/774 (95.74%), Query Frame = 0
Query: 1 MSKFNSLILVLILFVFPLALSEQEAIKAIIHRLDSKTSSPSIQEAAAKGLLRRLLPTHVD 60
MS F+S ILVLIL + PLALS+QEAI+AIIHRLDSKT SPSIQEAAAK LLRRLLPTHVD
Sbjct: 1 MSNFHSSILVLILILLPLALSQQEAIQAIIHRLDSKTLSPSIQEAAAKALLRRLLPTHVD 60
Query: 61 SFKFQIVSRDVCGGGSCFLISNFKPSSSNGAEILIRGTTAVEITSGLYWYLKYWCGAHVS 120
SF+FQIVSRDVC GGSCFLISNFK SS NGAEILIRGTTAVEITSGLYWYLKYWCGAHVS
Sbjct: 61 SFEFQIVSRDVCSGGSCFLISNFKSSSRNGAEILIRGTTAVEITSGLYWYLKYWCGAHVS 120
Query: 121 WDKTGGVQLASIPKPGSLPRLEGNGVVVKRPVPWNYYQNVVTSSYSYVWWDWERWEKEID 180
WDKTGGVQLASIPKPGSLP L+G+GVV+KRPVPWNYYQNVVTSSYSYVWWDWERWEKEID
Sbjct: 121 WDKTGGVQLASIPKPGSLPFLKGDGVVIKRPVPWNYYQNVVTSSYSYVWWDWERWEKEID 180
Query: 181 WMALHGINLPLAFTGQESIWRSVFRDFNLTVKDLDNFFGGPAFLAWARMGNLHGWGGPLS 240
WMALHGINLPLAFTGQESIWR+VFRDFNL KDLDNFFGGPAFLAWARMGNLHGWGGPLS
Sbjct: 181 WMALHGINLPLAFTGQESIWRNVFRDFNLAFKDLDNFFGGPAFLAWARMGNLHGWGGPLS 240
Query: 241 QNWLDQQLALQKQILSRMRELGMTPVLPSFSGNVPAALAKRFPSADITRLGNWNSINADP 300
+NWLDQQLALQKQILSRMRELGMTPVLPSFSGNVPA L + FPSA+ITRLGNWNSI+ADP
Sbjct: 241 KNWLDQQLALQKQILSRMRELGMTPVLPSFSGNVPAGLVEIFPSANITRLGNWNSIDADP 300
Query: 301 STCCTYLLNPSDPLFVKIGEAFIRQQIKEYGDVTDIYNCDTFNENTPPTNDTSYISSLGA 360
STCCTYLLNPSDPLFV+IGEAFIRQQIKEYGDVTDIY+CDTFNENTPPTNDTSYISSLGA
Sbjct: 301 STCCTYLLNPSDPLFVEIGEAFIRQQIKEYGDVTDIYSCDTFNENTPPTNDTSYISSLGA 360
Query: 361 SVYKAMVKADKDAVWLMQGWLFYSDSTFWKPEQMKALLHSVPFGKMIVLDLFADVKPIWK 420
SVYKAMVKADKDAVWLMQGWLFYSDS FWKP+QMKALLHSVPFGKMIVLDLFADVKPIWK
Sbjct: 361 SVYKAMVKADKDAVWLMQGWLFYSDSAFWKPDQMKALLHSVPFGKMIVLDLFADVKPIWK 420
Query: 421 TSSQFYGTPYVWCMLHNFGGNIEMYGVLDAISSGPVDALASENSTMVGVGMCMEGIEHNS 480
TSSQFYGTPYVWCMLHNFGGNIEMYG+LDAISSGPVDALASENSTMVGVGMCMEGIEHN
Sbjct: 421 TSSQFYGTPYVWCMLHNFGGNIEMYGILDAISSGPVDALASENSTMVGVGMCMEGIEHNP 480
Query: 481 VVYELMSEMAFRSKKVEVQDWLTTYSRCRYGKTDRYVEAAWNILYHTIYNCTDGIADHNN 540
VVYEL+SEMAFRSKKV+VQ+WL TYSRCRYGK D YV+AAWNILYHTIYNCTDGIA+HN
Sbjct: 481 VVYELISEMAFRSKKVQVQEWLKTYSRCRYGKADHYVDAAWNILYHTIYNCTDGIANHNT 540
Query: 541 DFIVKLPDWDPSSSFD-QKMPHLWYSTQEVINALQLLLKAGDNLRNSATYRYDLVDLTRQ 600
DFIVKLPDWDPSSS D +K PHLWYSTQEVINALQLL+ DNL +SATYRYDLVDLTRQ
Sbjct: 541 DFIVKLPDWDPSSSSDLKKPPHLWYSTQEVINALQLLVNVDDNLVHSATYRYDLVDLTRQ 600
Query: 601 VLGKLANEEYLKAISSFQRKNVAALNHHSKRFVQLIRDIDRLLASDSNFLLGTWLESAKK 660
VLGKLANEEYLKA+++F+R+NV A N HSKRF+QLIRDIDRLLAS+SNFLLGTWLESAKK
Sbjct: 601 VLGKLANEEYLKAVTAFRRQNVKAQNLHSKRFIQLIRDIDRLLASNSNFLLGTWLESAKK 660
Query: 661 LATNPSEMKQYEWNARTQVTMWYDNTEVNQSKLHDYANKYWSGLVEGYYLPRALTYFYYV 720
LATNPSEMKQYEWNARTQVTMWYDNT+VNQSKLHDYANKYWSGL+EGYYLPRALTYFYY+
Sbjct: 661 LATNPSEMKQYEWNARTQVTMWYDNTKVNQSKLHDYANKYWSGLLEGYYLPRALTYFYYL 720
Query: 721 SKSLRKNESFHLEEWRREWILFSNKWQAASETYPVKAEGNSIAISRAFYEKYFG 773
SKSLRKNESFHLE+WRREWILFSNKWQAASE YPVKA+GN++AIS+A YEKYFG
Sbjct: 721 SKSLRKNESFHLEDWRREWILFSNKWQAASELYPVKAKGNAVAISKALYEKYFG 774
BLAST of Csor.00g005080 vs. ExPASy TrEMBL
Match:
A0A6J1D9J6 (alpha-N-acetylglucosaminidase OS=Momordica charantia OX=3673 GN=LOC111018479 PE=4 SV=1)
HSP 1 Score: 1464 bits (3791), Expect = 0.0
Identity = 700/773 (90.56%), Postives = 735/773 (95.08%), Query Frame = 0
Query: 1 MSKFNSLILVLILFVFPLALSEQEAIKAIIHRLDSKTSSPSIQEAAAKGLLRRLLPTHVD 60
MS FN +LVLIL VFPL+LSE EAIKAIIHRLDSK SPSIQEAAA G+LRRLLPTHV
Sbjct: 1 MSNFNLSLLVLILVVFPLSLSEPEAIKAIIHRLDSKALSPSIQEAAANGVLRRLLPTHVH 60
Query: 61 SFKFQIVSRDVCGGGSCFLISNFKPSSSNGAEILIRGTTAVEITSGLYWYLKYWCGAHVS 120
SF+FQIVSRDVCGGGSCFLISNFK S NGAEILI+GTTAVEITSGLYWYLKYWCGAH+S
Sbjct: 61 SFQFQIVSRDVCGGGSCFLISNFKSSIRNGAEILIKGTTAVEITSGLYWYLKYWCGAHIS 120
Query: 121 WDKTGGVQLASIPKPGSLPRLEGNGVVVKRPVPWNYYQNVVTSSYSYVWWDWERWEKEID 180
WDKTGGVQ+ASIPKPGSLP L+G+GVVVKRPVPWNYYQNVVTSSYSYVWWDWERWEKEID
Sbjct: 121 WDKTGGVQIASIPKPGSLPLLKGDGVVVKRPVPWNYYQNVVTSSYSYVWWDWERWEKEID 180
Query: 181 WMALHGINLPLAFTGQESIWRSVFRDFNLTVKDLDNFFGGPAFLAWARMGNLHGWGGPLS 240
WMALHGINLPLAFTGQESIW+SVFRDFNLTVKDLDNFFGGPAFLAWARMGNLHGWGG LS
Sbjct: 181 WMALHGINLPLAFTGQESIWQSVFRDFNLTVKDLDNFFGGPAFLAWARMGNLHGWGGTLS 240
Query: 241 QNWLDQQLALQKQILSRMRELGMTPVLPSFSGNVPAALAKRFPSADITRLGNWNSINADP 300
Q+WLDQQL LQKQILSRMRELGMTPVLPSFSGNVPAALA+RFPSADITRLGNWNSI+ADP
Sbjct: 241 QSWLDQQLVLQKQILSRMRELGMTPVLPSFSGNVPAALAERFPSADITRLGNWNSIDADP 300
Query: 301 STCCTYLLNPSDPLFVKIGEAFIRQQIKEYGDVTDIYNCDTFNENTPPTNDTSYISSLGA 360
STCCTYLLNPSDPLFVKIGEAFIR+QIKEY DVTDIYNCDTFNENTPPTNDTSYISSLGA
Sbjct: 301 STCCTYLLNPSDPLFVKIGEAFIRKQIKEYADVTDIYNCDTFNENTPPTNDTSYISSLGA 360
Query: 361 SVYKAMVKADKDAVWLMQGWLFYSDSTFWKPEQMKALLHSVPFGKMIVLDLFADVKPIWK 420
SVYKAMVKADKDAVWLMQGWLFYSDSTFWKP+QMKALLHSVPFGKMIVLDLFA+VKPIW+
Sbjct: 361 SVYKAMVKADKDAVWLMQGWLFYSDSTFWKPDQMKALLHSVPFGKMIVLDLFAEVKPIWR 420
Query: 421 TSSQFYGTPYVWCMLHNFGGNIEMYGVLDAISSGPVDALASENSTMVGVGMCMEGIEHNS 480
TSSQFYGTPYVWCMLHNFGGNIEMYG+LDAISSGPVDALASENSTMVGVGMCMEGIEHN
Sbjct: 421 TSSQFYGTPYVWCMLHNFGGNIEMYGILDAISSGPVDALASENSTMVGVGMCMEGIEHNP 480
Query: 481 VVYELMSEMAFRSKKVEVQDWLTTYSRCRYGKTDRYVEAAWNILYHTIYNCTDGIADHNN 540
VVYE+MSEMAFRSKKVEVQ+WL TYSRCRYGK D YV+AAW ILYHTIYNCTDGIADHN
Sbjct: 481 VVYEMMSEMAFRSKKVEVQEWLKTYSRCRYGKADHYVDAAWKILYHTIYNCTDGIADHNT 540
Query: 541 DFIVKLPDWDPSSSFDQKMPHLWYSTQEVINALQLLLKAGDNLRNSATYRYDLVDLTRQV 600
DFIVKLPDWDP SS D PHLWYSTQ+VINALQLLL A ++L NS+TYRYDLVDL RQV
Sbjct: 541 DFIVKLPDWDPYSSSDMGKPHLWYSTQKVINALQLLLNANNDLINSSTYRYDLVDLMRQV 600
Query: 601 LGKLANEEYLKAISSFQRKNVAALNHHSKRFVQLIRDIDRLLASDSNFLLGTWLESAKKL 660
LGKLANEEYL A+ +FQRK+V ALN HSKRF+QLIRDIDRLLAS+SNFLLGTWLESAKKL
Sbjct: 601 LGKLANEEYLSAVIAFQRKDVKALNVHSKRFIQLIRDIDRLLASNSNFLLGTWLESAKKL 660
Query: 661 ATNPSEMKQYEWNARTQVTMWYDNTEVNQSKLHDYANKYWSGLVEGYYLPRALTYFYYVS 720
ATNPSEMKQYEWNARTQVTMWYDNT+ NQSKLHDYANKYWSGL+EGYYLPRALTYFYY+S
Sbjct: 661 ATNPSEMKQYEWNARTQVTMWYDNTKFNQSKLHDYANKYWSGLLEGYYLPRALTYFYYLS 720
Query: 721 KSLRKNESFHLEEWRREWILFSNKWQAASETYPVKAEGNSIAISRAFYEKYFG 773
KSLRKNESFHLE+WRREWILFSNKWQAASE YPVKAEGNS+AISRA YEKYFG
Sbjct: 721 KSLRKNESFHLEDWRREWILFSNKWQAASELYPVKAEGNSVAISRALYEKYFG 773
BLAST of Csor.00g005080 vs. ExPASy TrEMBL
Match:
A0A5D3CGM4 (Alpha-N-acetylglucosaminidase OS=Cucumis melo var. makuwa OX=1194695 GN=E5676_scaffold459G00450 PE=4 SV=1)
HSP 1 Score: 1452 bits (3759), Expect = 0.0
Identity = 697/774 (90.05%), Postives = 737/774 (95.22%), Query Frame = 0
Query: 1 MSKFNSLILVLILFVFPLALSEQEAIKAIIHRLDSKTSSPSIQEAAAKGLLRRLLPTHVD 60
MS F+ ILVLIL + PLALS+QEAI+AIIHRLDSKT SPSIQEAAAK LLRRLLPTHVD
Sbjct: 1 MSNFHPSILVLILILLPLALSQQEAIQAIIHRLDSKTLSPSIQEAAAKALLRRLLPTHVD 60
Query: 61 SFKFQIVSRDVCGGGSCFLISNFKPSSSNGAEILIRGTTAVEITSGLYWYLKYWCGAHVS 120
SF+FQIVSRDVC GGSCFLISNFK SS NGAEIL GTTAVEITSGLYWYLKYWCGAHVS
Sbjct: 61 SFEFQIVSRDVCSGGSCFLISNFKSSSRNGAEIL--GTTAVEITSGLYWYLKYWCGAHVS 120
Query: 121 WDKTGGVQLASIPKPGSLPRLEGNGVVVKRPVPWNYYQNVVTSSYSYVWWDWERWEKEID 180
WDKTGGVQLASIPKPGSLP ++G+GVV+KRPVPWNYYQNVVTSSYSYVWWDWERWEKEID
Sbjct: 121 WDKTGGVQLASIPKPGSLPFIKGDGVVIKRPVPWNYYQNVVTSSYSYVWWDWERWEKEID 180
Query: 181 WMALHGINLPLAFTGQESIWRSVFRDFNLTVKDLDNFFGGPAFLAWARMGNLHGWGGPLS 240
WMALHGINLPLAFTGQESIWR+VFRDFNL KDLDNFFGGPAFLAWARMGNLHGWGGPLS
Sbjct: 181 WMALHGINLPLAFTGQESIWRNVFRDFNLAFKDLDNFFGGPAFLAWARMGNLHGWGGPLS 240
Query: 241 QNWLDQQLALQKQILSRMRELGMTPVLPSFSGNVPAALAKRFPSADITRLGNWNSINADP 300
+NWLDQQLALQKQILSRMRELGMTPVLPSFSGNVPA L + FPSA+ITRLGNWNSI+ADP
Sbjct: 241 KNWLDQQLALQKQILSRMRELGMTPVLPSFSGNVPAGLVEIFPSANITRLGNWNSIDADP 300
Query: 301 STCCTYLLNPSDPLFVKIGEAFIRQQIKEYGDVTDIYNCDTFNENTPPTNDTSYISSLGA 360
STCCTYLLNPSDPLFV+IGEAFIRQQIKEYGDVTDIY+CDTFNENTPPTNDTSYISSLGA
Sbjct: 301 STCCTYLLNPSDPLFVEIGEAFIRQQIKEYGDVTDIYSCDTFNENTPPTNDTSYISSLGA 360
Query: 361 SVYKAMVKADKDAVWLMQGWLFYSDSTFWKPEQMKALLHSVPFGKMIVLDLFADVKPIWK 420
SVYKAMVKADKDAVWLMQGWLFYSDS FWKP+QMKALL SVPFGKMIVLDLFADVKPIWK
Sbjct: 361 SVYKAMVKADKDAVWLMQGWLFYSDSAFWKPDQMKALLQSVPFGKMIVLDLFADVKPIWK 420
Query: 421 TSSQFYGTPYVWCMLHNFGGNIEMYGVLDAISSGPVDALASENSTMVGVGMCMEGIEHNS 480
TSSQFYGTPYVWCMLHNFGGNIEMYG+LDAISSGPVDALASENSTMVGVGMCMEGIEHN
Sbjct: 421 TSSQFYGTPYVWCMLHNFGGNIEMYGILDAISSGPVDALASENSTMVGVGMCMEGIEHNP 480
Query: 481 VVYELMSEMAFRSKKVEVQDWLTTYSRCRYGKTDRYVEAAWNILYHTIYNCTDGIADHNN 540
VVYELMSEMAFRSKKV+VQ+WL TYSRCRYGK D YV+AAWNILYHTIYNCTDGIA+HN
Sbjct: 481 VVYELMSEMAFRSKKVQVQEWLKTYSRCRYGKADHYVDAAWNILYHTIYNCTDGIANHNT 540
Query: 541 DFIVKLPDWDPSSSFD-QKMPHLWYSTQEVINALQLLLKAGDNLRNSATYRYDLVDLTRQ 600
DFIVKLPDWDPSSS D +K PHLWYSTQEVINALQLL+ DNL +SATYRYDLVDLTRQ
Sbjct: 541 DFIVKLPDWDPSSSSDLKKPPHLWYSTQEVINALQLLVNVDDNLVHSATYRYDLVDLTRQ 600
Query: 601 VLGKLANEEYLKAISSFQRKNVAALNHHSKRFVQLIRDIDRLLASDSNFLLGTWLESAKK 660
VLGKLANEEYLKA+++F+R+NV A N HSKRF+QLIRDIDRLLAS+SNFLLGTWLESAKK
Sbjct: 601 VLGKLANEEYLKAVTAFRRQNVKAQNLHSKRFIQLIRDIDRLLASNSNFLLGTWLESAKK 660
Query: 661 LATNPSEMKQYEWNARTQVTMWYDNTEVNQSKLHDYANKYWSGLVEGYYLPRALTYFYYV 720
LATNPSEMKQYEWNARTQVTMWYDNT+VNQSKLHDYANKYWSGL+EGYYLPRALTYFYY+
Sbjct: 661 LATNPSEMKQYEWNARTQVTMWYDNTKVNQSKLHDYANKYWSGLLEGYYLPRALTYFYYL 720
Query: 721 SKSLRKNESFHLEEWRREWILFSNKWQAASETYPVKAEGNSIAISRAFYEKYFG 773
SKSLRKNESFHLE+WRREWILFSNKWQAASE YPVKA+GN++AIS+A YEKYFG
Sbjct: 721 SKSLRKNESFHLEDWRREWILFSNKWQAASELYPVKAKGNAVAISKALYEKYFG 772
BLAST of Csor.00g005080 vs. TAIR 10
Match:
AT5G13690.1 (alpha-N-acetylglucosaminidase family / NAGLU family )
HSP 1 Score: 1137.1 bits (2940), Expect = 0.0e+00
Identity = 534/797 (67.00%), Postives = 639/797 (80.18%), Query Frame = 0
Query: 7 LILVLILFVFPLALSEQEAIKAIIHRLDSKTSSPSIQEAAAKGLLRRLLPTHVDSFKFQI 66
L+L++I F I ++ RLDS + S+QE+AAKGLL+RLLPTH SF+ +I
Sbjct: 9 LVLLIISFHSQTVSKHHPTIDGLLDRLDSLLPTSSVQESAAKGLLQRLLPTHSQSFELRI 68
Query: 67 VSRDVCGGGSCFLISNFKPSSSNGAEILIRGTTAVEITSGLYWYLKYWCGAHVSWDKTGG 126
+S+D CGG SCF+I N+ G EILI+GTT VEI SGL+WYLKY C AHVSWDKTGG
Sbjct: 69 ISKDACGGTSCFVIENYDGPGRIGPEILIKGTTGVEIASGLHWYLKYKCNAHVSWDKTGG 128
Query: 127 VQLASIPKPGSLPRLEGNGVVVKRPVPWNYYQNVVTSSYSYVWWDWERWEKEIDWMALHG 186
+Q+AS+P+PG LPR++ + ++RPVPWNYYQNVVTSSYSYVWW WERWE+EIDWMAL G
Sbjct: 129 IQVASVPQPGHLPRIDSKRIFIRRPVPWNYYQNVVTSSYSYVWWGWERWEREIDWMALQG 188
Query: 187 INLPLAFTGQESIWRSVFRDFNLTVKDLDNFFGGPAFLAWARMGNLHGWGGPLSQNWLDQ 246
INLPLAFTGQE+IW+ VF+ FN++ +DLD++FGGPAFLAWARMGNLH WGGPLS+NWLD
Sbjct: 189 INLPLAFTGQEAIWQKVFKRFNISKEDLDDYFGGPAFLAWARMGNLHAWGGPLSKNWLDD 248
Query: 247 QLALQKQILSRMRELGMTPVLPSFSGNVPAALAKRFPSADITRLGNWNSINADPSTCCTY 306
QL LQKQILSRM + GMTPVLPSFSGNVP+AL K +P A+ITRL NWN+++ D CCTY
Sbjct: 249 QLLLQKQILSRMLKFGMTPVLPSFSGNVPSALRKIYPEANITRLDNWNTVDGDSRWCCTY 308
Query: 307 LLNPSDPLFVKIGEAFIRQQIKEYGDVTDIYNCDTFNENTPPTNDTSYISSLGASVYKAM 366
LLNPSDPLF++IGEAFI+QQ +EYG++T+IYNCDTFNENTPPT++ YISSLGA+VYKAM
Sbjct: 309 LLNPSDPLFIEIGEAFIKQQTEEYGEITNIYNCDTFNENTPPTSEPEYISSLGAAVYKAM 368
Query: 367 VKADKDAVWLMQGWLFYSDSTFWKPEQMKALLHSVPFGKMIVLDLFADVKPIWKTSSQFY 426
K +K+AVWLMQGWLF SDS FWKP Q+KALLHSVPFGKMIVLDL+A+VKPIW S+QFY
Sbjct: 369 SKGNKNAVWLMQGWLFSSDSKFWKPPQLKALLHSVPFGKMIVLDLYAEVKPIWNKSAQFY 428
Query: 427 GTPYVWCMLHNFGGNIEMYGVLDAISSGPVDALASENSTMVGVGMCMEGIEHNSVVYELM 486
GTPY+WCMLHNFGGNIEMYG LD+ISSGPVDA S+NSTMVGVGMCMEGIE N VVYEL
Sbjct: 429 GTPYIWCMLHNFGGNIEMYGALDSISSGPVDARVSKNSTMVGVGMCMEGIEQNPVVYELT 488
Query: 487 SEMAFRSKKVEVQDWLTTYSRCRYGKTDRYVEAAWNILYHTIYNCTDGIADHNNDFIVKL 546
SEMAFR +KV+VQ WL +Y+R RY K + +EAAW ILYHT+YNCTDGIADHN DFIVKL
Sbjct: 489 SEMAFRDEKVDVQKWLKSYARRRYMKENHQIEAAWEILYHTVYNCTDGIADHNTDFIVKL 548
Query: 547 PDWDPSSSF------------------------------DQKMPHLWYSTQEVINALQLL 606
PDWDPSSS D HLWYST+EVI AL+L
Sbjct: 549 PDWDPSSSVQDDLKQKDSYMISTGPYETKRRVLFQDKTADLPKAHLWYSTKEVIQALKLF 608
Query: 607 LKAGDNLRNSATYRYDLVDLTRQVLGKLANEEYLKAISSFQRKNVAALNHHSKRFVQLIR 666
L+AGD+L S TYRYD+VDLTRQVL KLAN+ Y +A+++F +K++ +L S++F++LI+
Sbjct: 609 LEAGDDLSRSLTYRYDMVDLTRQVLSKLANQVYTEAVTAFVKKDIGSLGQLSEKFLELIK 668
Query: 667 DIDRLLASDSNFLLGTWLESAKKLATNPSEMKQYEWNARTQVTMWYDNTEVNQSKLHDYA 726
D+D LLASD N LLGTWLESAKKLA N E KQYEWNARTQVTMWYD+ +VNQSKLHDYA
Sbjct: 669 DMDVLLASDDNCLLGTWLESAKKLAKNGDERKQYEWNARTQVTMWYDSNDVNQSKLHDYA 728
Query: 727 NKYWSGLVEGYYLPRALTYFYYVSKSLRKNESFHLEEWRREWILFSNKW-QAASETYPVK 773
NK+WSGL+E YYLPRA YF + KSLR + F +E+WRREWI+ S+KW Q++SE YPVK
Sbjct: 729 NKFWSGLLEDYYLPRARLYFNEMLKSLRDKKIFKVEKWRREWIMMSHKWQQSSSEVYPVK 788
The following BLAST results are available for this feature:
Match Name | E-value | Identity | Description | |
Q9FNA3 | 0.0e+00 | 67.00 | Alpha-N-acetylglucosaminidase OS=Arabidopsis thaliana OX=3702 GN=NAGLU PE=2 SV=1 | [more] |
P54802 | 3.2e-163 | 40.33 | Alpha-N-acetylglucosaminidase OS=Homo sapiens OX=9606 GN=NAGLU PE=1 SV=2 | [more] |
Match Name | E-value | Identity | Description | |
A0A6J1H7Q2 | 0.0 | 99.35 | alpha-N-acetylglucosaminidase OS=Cucurbita moschata OX=3662 GN=LOC111461205 PE=4... | [more] |
A0A6J1KUM7 | 0.0 | 98.19 | alpha-N-acetylglucosaminidase OS=Cucurbita maxima OX=3661 GN=LOC111497764 PE=4 S... | [more] |
A0A1S3CEF3 | 0.0 | 90.57 | alpha-N-acetylglucosaminidase OS=Cucumis melo OX=3656 GN=LOC103499946 PE=4 SV=1 | [more] |
A0A6J1D9J6 | 0.0 | 90.56 | alpha-N-acetylglucosaminidase OS=Momordica charantia OX=3673 GN=LOC111018479 PE=... | [more] |
A0A5D3CGM4 | 0.0 | 90.05 | Alpha-N-acetylglucosaminidase OS=Cucumis melo var. makuwa OX=1194695 GN=E5676_sc... | [more] |
Match Name | E-value | Identity | Description | |
AT5G13690.1 | 0.0e+00 | 67.00 | alpha-N-acetylglucosaminidase family / NAGLU family | [more] |