项目名称:SaAlign:基于后缀阵列的超大数据集和超长序列的多重DNA/RNA序列比对和系统发育树构建工具
团队成员:王子渊、夏琦妮、郭新宇、金书毅、曾佳怡、刘一佳
指导教师:刘志斌、蔡菁
项目简介:
多重序列比对于构建生物间进化关系有重要作用。而目前随着测序技术的发展,单次处理的数据平均长度、数量增加,导致计算所需的时间、空间大幅度上升,现有软件性能已经不足以满足研究需求。因此,本团队开发了一款能够进行大规模长序列比对的工具:SaAlign,该工具利用后缀数组改进传统Needleman-Wunsch算法,并结合Center star策略以适应分布式计算,有效实现了节省实验室计算资源。此项成果也已于2022年3月成功发布在杂志《COMPUTATIONAL AND STRUCTURAL BIOTECHNOLOGY JOURNAL》(IF 6.155)。
图1 本项目已发表的论文
图2 SaAlign运行流程图