EN
新闻中心
BB贝搏ballbet官网平台 - 10×单细胞转录组常见Q&A(三)|数据质控专题
加载中... 日期:2023-01-24

列位教员各人好!第三期10×单细胞转录组常见 Q A准期所致。上两期中,咱们别离先容了单细胞试验开展前最需要相识的几年夜问题以及试验质控相干问题。本期将为各人先容单细胞转录组数据质控,质控就是为了包管数据的质量,而且检测细胞漫衍是否切合预期。单细胞数据质控重要看哪些指标呢?指标一 原始数据质控 单细胞转录组测序得到的原始数据为 fastq格局,每一个样本有 read1.fastq.gz 以及 read2.fastq.gz两个文件,此中read1 为 barcode 以及 UMI 信息,read2 为测序的 RNA 序列信息,后续按照序列标签信息可举行数据拆分及定量。在数据阐发历程中,咱们起首需要对于下机的原始数据举行一系列严酷的质控,去撤除低质量数据,保留高质量数据以确保后续数据阐发成果的真实性及靠得住性。FastQC软件可以快速对于测序数据举行总体统计及质量评估,直不雅地反应出测序数据的优劣。Q:单细胞转录组保举的测序数据量是几多?答:中科使用Single Cell 3' V3.1版试剂盒,官方建议最低测序量20K reads/cell。今朝,中科提供的数据量默许为90G/样,客户可依据详细的试验目的决议数据量的几多。Q:怎样判定测序数据的优劣?答:经由过程计较每一个碱基的质量值,对于测序的read 举行质量评估。碱基质量值 Q= -10×Log10(P),在生物物理学中是碱基辨认堕落几率的整数映照,用于阐发每一个碱基被辨认过错的几率,其值越高注解碱基辨认越靠得住。质控尺度中的 Q20 暗示该碱基过错的几率为 0.01,Q30 暗示过错率为0.001。一般Q20在85%以上,Q30在80%以上视为测序质量较好。 指标二 细胞过滤咱们在做单细胞测序的时辰,起首要做细胞分散。分散前提对于某些类型的细胞不顺应,造成细胞破碎或者凋亡,RNA溢出,致使线粒体基因比例上升,会滋扰细胞分群。是以,在Cell Ranger 天生表达矩阵以后,还需要进一步对于细胞举行过滤。Q:怎样判断线粒体的过滤尺度?答:细胞自己就需要能量,以是一定含有必然的线粒体基因。线粒体过滤的原则为,去除了线粒体基因含量太高的细胞,但不克不及年夜量丢掉样本的细胞信息。今朝统计的文章线粒体过滤阈值在5%~30%之间不等,可是一些非凡样本,如肿瘤构造、心脏样本、肌肉样本,因其自己的线粒体含量偏高,固定阈值筛选原则显然是分歧适的,故而此尺度需要举行调解。今朝,中科关于线粒体过滤接纳绝对于中位差。绝对于中位差是一种统计离差的丈量。并且,MAD是一种鲁棒统计量,比尺度差更能顺应数据集中的异样值。对于于尺度差,使用的是数据到均值的间隔平方,以是年夜的误差权重更年夜,异样值对于成果也会孕育发生主要影响。对于于MAD,少许的异样值不会影响终极的成果。且MAD是一个比样本方差或者者尺度差更鲁棒的器量,对于于不存在均值或者者方差的漫衍效果更好。 指标三 多样本批次矫合法触及多个样本举行比力阐发时,需要对于这些样本举行归并阐发以及批次矫正。今朝,中科接纳 Harmony 要领对于scRNA 数据举行多样本归并以及批次效应的校订。图1 Harmony道理图 Harmony道理:哄骗PCA将转录组表达谱嵌入到低维空间中,差别颜色暗示差别数据集,差别外形暗示差别的细胞类型,然后运用迭代历程去除了数据集独有的影响。A. Harmony几率性地将细胞分配给cluster,从而使每一个cluster内数据集的多样性最年夜化;B. Harmony计较每一个cluster的所有数据集的全局中央,和特定命据集的中央;C. 在每一个cluster中,Harmony基于中央为每一个数据集计较校订因子;D. 末了,Harmony使用基于C的特定于细胞的因子校订每一个细胞。因为Harmony使用软聚类,是以可以经由过程多个因子的线性组合对于其A中举行的软聚类分配举行线性校订,来批改每一个单细胞。反复步调A到D,直到收敛为止。聚类分配以及数据集之间的依靠性跟着每一一轮的削减而减小。Harmony算法与其他整合算法比拟的上风:整合数据的同时对于罕见细胞的敏感性依然很好;合适于更繁杂的单细胞阐发试验设计,可以比力来自差别供体,构造以及技能平台的细胞。总结本期分享到这里就竣事啦,经由过程这三期Q A内容的进修,信赖列位教员对于单细胞转录组已经经有了比力深切的相识,和怎样将单细胞技能运用于本身的课题也有了明确的标的目的。中科新生命单细胞多组学相干产物连续热销中,接待感乐趣的教员前来咨询。参考文献 Korsunsky I , Fan J , Slowikowski K , et al. Fast, sensitive, and flexible integration of single cell data with Harmony. Cold Spring Harbor Laboratory, 2018(12).往期保举