跳转至

C-Phasing logo

C-Phasing

Phasing and scaffolding polyploid genomes based on Pore-C, Ultra-long, or Hi-C data

.

介绍#

使用Hi-C数据实现多倍体基因组分型挂载,存在主要问题之一是大量不明确的短读长比对,这容易导致高水平的交换或嵌合组装错误。现在,基于长读长的染色体构象捕获技术,如Pore-C,为克服这一问题提供了有效途径。在这里,我们开发了一个新的流程,即“C-Phasing”,它是专门为多倍体分型组装量身定制的,旨在充分利用Pore-C数据的优势。它也可用于Hi-C数据和二倍体基因组组装。

C-Phasing的优势:
- 快速.
- 更高的挂载率.
- 更高的分型组装质量.

安装#

从GitHub官网下载C-Phasing软件,并运行activate_cphasing激活环境。

git clone https://github.com/wangyibin/CPhasing.git

./CPhasing/bin/activate_cphasing

Note

第一次配置需要在有网络的情况下运行./CPhasing/bin/activate_cphasing.

Note

如果你的服务器不能访问anaconda的仓库,可以配置镜像源,如配置浙江大学的镜像源:
1. 打开配置文件

~/.pixi/bin/pixi config edit
2. 写入以下内容
[mirrors]
"https://conda.anaconda.org/conda-forge" = [
    "https://mirrors.zju.edu.cn/anaconda/cloud/conda-forge"
]

"https://conda.anaconda.org/bioconda" = [
    "https://mirrors.zju.edu.cn/anaconda/cloud/bioconda"
]
3. 按ctrl + X,然后再按Y, 保存退出

从GitHub官网下载C-Phasing软件,使用anaconda或者miniconda配置环境和激活环境。

git clone https://github.com/wangyibin/CPhasing.git

cd CPhasing
conda env create -f environment.yml
conda activate cphasing
接着配置以下命令道环境变量 .bash_profile或者.bashrc
~/.bash_profile
export PATH=/path/to/CPhasing/bin:$PATH
export PYTHONPATH=/path/to/CPhasing:$PYTHONPATH

Note

在比对Hi-C数据的时候,有用户遇到找不到GLIBCXX_3.4.29的报错,这种情况可以在运行cphasing命令前,配置以下命令:

run.sh
export LD_LIBRARY_PATH=/path/to/anaconda3/envs/cphasing/lib:$LD_LIBRARY_PATH

从GitHub下载CPhasing, 然后使用pip安装。#

## Download C-Phasing and install python dependencies
git clone https://github.com/wangyibin/CPhasing.git
cd CPhasing
pip install .
接着配置以下命令道环境变量 ~/.bash_profile 或者~/.bashrc
~/.bash_profile
export PATH=/path/to/CPhasing/bin:$PATH

第三方依赖包#

  1. 核心功能依赖:
    - bedtools
    - seqkit
    - pigz
  2. Pore-C流程依赖: - minimap2(>= v2.24)
  • 基本用法

    使用 pipeline命令开始运行cphasing.

    基本用法

  • 教程

    一些案例教你如何运行 cphasing.
    Tutorials