1.一种从批量contig中批量获取麦类植物LMW‑GS基因编码区的方法,其特征在于,所述方法包括:S1:本发明根据LMW‑GS基因PCR产物PacBio测序后SeqMan组装出来的不同小麦材料中LMW‑GS基因的contig序列,先进行序列标识的批量重命名并整理至同一个fasta格式的文件中;S2:接着根据该基因N端、C端保守的特点,采用已经发表的中国春、小偃54的LMW‑GS基因编码区的两端各90bp序列为参比序列,与SeqMan组装出来的对应不同小麦材料中相应contig序列(即LMW‑GS基因的基因组DNA序列)进行比对,找到相应编码区的起始位置;S3:最后根据起始位置从SeqMan组装出来的LMW‑GS基因contig中批量提取出编码区序列。
2.根据权利要求1所述的从批量contig中批量获取麦类植物LMW‑GS基因编码区的方法,其特征在于,步骤S1序列标识的批量重命名并整理至同一个fasta格式的文件中时本发明编写了4个perl程序(3copyTemptoOne.pl、3fasDelEnterfrommore‑IDrename.pl、
3fasmergeFa.pl、3fasDelEnterfrommore.pl)来辅助实现,请求保护。
3.根据权利要求1所述的从批量contig中批量获取麦类植物LMW‑GS基因编码区的方法,其特征在于,步骤S2查找相应编码区的起始位置时本发明编写了3个perl程序来辅助实现,即fasFuzzyMatch‑tempPositionExtr.pl、consensusTempPositionExtrLMW‑GS‑notfind.pl、consensusTempPosition ExtrLMW‑GS‑RC‑notfind.pl,请求保护。
4.根据权利要求1所述的从批量contig中批量获取麦类植物LMW‑GS基因编码区的方法,其特征在于,步骤S3从SeqMan组装出来的LMW‑GS基因contig中批量提取出编码区序列时本发明编写了一个perl程序,即seqExtraByIDinFilenew‑twoNo.pl,来辅助实现,请求保护。