跳转至

HiC Mapper#

处理Hi-C数据

one cell#

cphasing hic mapper -f draft.asm.fasta -1 hic_R1.fastq.gz -2 hic_R2.fastq.gz -t 40

Note

如果基因组大小大于8Gb,应指定更高的kmer和window大小,例如-k 27 -w 14,避免chromap报错。

mutiple cells#

将不同cell的Hi-C 数据提交到集群#

  • 将多个脚本提交到不同的节点
    run_sample1.sh
    cphasing hic mapper -f draft.asm.fasta -1 hic-1_R1.fastq.gz -2 hic-1_R2.fastq.gz -t 40
    
    run_sample2.sh
    cphasing hic mapper -f draft.asm.fasta -1 hic-2_R1.fastq.gz -2 hic-2_R2.fastq.gz -t 40
    
    run_sample3.sh
    cphasing hic mapper -f draft.asm.fasta -1 hic-3_R1.fastq.gz -2 hic-3_R2.fastq.gz -t 40
    

Note

因为有一步创建索引的步骤,因此用户需要先提交一个任务,直到索引创建完成再提交剩下的任务,或者在不同的目录下分别提交。

  • 合并结果 将多个.pairs.gz文件合并成一个。
    cphasing pairs-merge hic-*.pairs.gz -o hic.merge.pairs.gz
    

Parameters#

 Usage: cphasing hic mapper [OPTIONS]                                                             

 Mapper for reads mapping.                                                                        

╭─ Options ──────────────────────────────────────────────────────────────────────────────────────╮
 *  --fasta,--reference  -f,-r     Path of reference fasta file.                                                                   (FILE)                                                                                          [required]                                                    *  --read1              -1        Path of read 1.                                                                                 (FILE)                                                                                          [required]                                                    *  --read2              -2        Path of read 2.                                                                                 (FILE)                                                                                          [required]                                                                            -k        kmer size for mapping.                                                                          (INT)                                                                                           [default: 17]                                                                         -w        minimizer window size for mapping.                                                              (INT)                                                                                           [default: 7]                                                     --mapq               -q        Minimum quality of mapping [0, 60].                                                             (INT)                                                                                           [default: 0; 0<=x<=60]                                           --aligner            -a        Aligner executable. _chromap is the modifed version in                                          C-Phasing, if you want to use the offical version you can                                       set aligner to chromap                                                                          (_chromap|chromap)                                                                              [default: _chromap]                                              --threads            -t        Number of threads.                                                                              (INT)                                                                                           [default: 4]                                                     --help               -h,-help  Show this message and exit.                                  ╰────────────────────────────────────────────────────────────────────────────────────────────────╯