微信扫码
在线客服
热线电话
手机官网
返回顶部
CopyKAT分析
图片.png

  非整倍体肿瘤拷贝数核型分析(CopyKAT)用于估算高通量scRNA-seq基因组拷贝数谱,以区分肿瘤微环境中的正常细胞与恶性肿瘤细胞,识别主要的克隆亚群。

  分析流程

  在对获取的表达数据处理后,过滤掉低质量的细胞和基因,然后对基因进行注释,根据它们的基因位点进行排序。

  使用Freeman-Tukey变换稳定方差,使用多项式动态线性建模(DLM) 用于平滑单细胞UMI计数中的异常值。

  检测一个高度置信的二倍体细胞的子集,以推断正常2N细胞的拷贝数基线值。使用Ward linkage对归一化的单细胞数据进行层次聚类,使用高斯混合模型(GMM)估计一致性谱的方差。按照一个严格的分类标准,估计方差最小的类被定义为“高置信的二倍体细胞”。

  为了检测染色体断点,整合了泊松-伽马模型和马尔可夫链蒙特卡罗(MCMC)迭代来生成每个基因窗口的后验均值,然后应用Kolmogorov Smirnov (KS)检验来连接均值不存在显著差异的相邻窗口。

  分类肿瘤细胞和正常细胞。我们假设细胞群之间的主要遗传距离是二倍体和非整倍体基因组的差异,因此采用Ward连锁和欧氏距离分层聚类的方法将单细胞划分为两个主要群体。为了确定每个cluster的身份,我们将聚类结果与和之前识别的预定义的高置信的正常二倍体细胞相结合。预定义正常细胞显著富集的簇被定义为正常二倍体细胞簇。

  识别克隆亚结构。我们对单细胞拷贝数数据进行层次聚类,以确定克隆亚群体,并计算代表亚克隆基因型的一致性谱,以进一步分析它们的基因表达差异。