现代栽培甘蔗组装(Pore-C)#
非整倍 (2n=114), 预估基因组大小 ~ 10 Gb
Pore-C数据处理#
由于Pore-C数据量大,我们将每个cell的Pore-C数据分别提交到不同的节点上进行比对,然后再合并成一个文件。
cphasing porec-merge
cphasing mapper sh_hifi.bp.p_utg.fasta porec-1.fastq.gz -t 40
cphasing mapper sh_hifi.bp.p_utg.fasta porec-2.fastq.gz -t 40
cphasing mapper sh_hifi.bp.p_utg.fasta porec-3.fastq.gz -t 40
cphasing mapper sh_hifi.bp.p_utg.fasta porec-4.fastq.gz -t 40
cphasing mapper sh_hifi.bp.p_utg.fasta porec-5.fastq.gz -t 40
组装流程#
现代栽培甘蔗属于非整倍体,不同同源染色体组内的染色体数量不同,因此我们倾向于先让程序自行分组看看(-n 0:0
)。