首页 > 化工知识 > TCGA数据分析实战:免疫细胞浸润分析

TCGA数据分析实战:免疫细胞浸润分析

时间:2021-10-18 来源: 浏览:

TCGA数据分析实战:免疫细胞浸润分析

原创 科研小Z 科研Z库
科研Z库

KY-ZCOOL

最前沿的科研资讯,最有料的科研资源,科研Z库帮你打通科研路上的第一步!

收录于话题

肿瘤具有很强的异质性,同一肿瘤在不同个体之间具有不同的免疫活性,而具有相似免疫活性状况的样本则可能处于相同的免疫微环境。肿瘤样本的转录组表达水平在一定程度反映了样本的免疫活性状况。 本次让你4步了解TCGA免疫细胞浸润分析

01、 数据准备

因为是通过mRNA表达数据,进而推算每个样本中免疫细胞的组成比例,因此,我们需要通过TCGA数据库下载mRNA表达数据,并且对数据进行整理及提取。首先下载获得基因表达数据,将表达数据解压后,采用perl将所有解压出的文件放到同一文件夹内。

将解压后的文件夹中的所有压缩包解压,然后用mRNA_merge脚本,将解压出的文件进行合并,获得mRNA矩阵,同时,获得正常样本和肿瘤样本的数目信息。这一步需要用下数据下载中下载的metadata文件

运行结束后,就可以获得整理好的表达矩阵文件,并且获得正常样本和肿瘤样本的数目信息。

随后,对表达矩阵中的ID进行转换,并提取mRNA的表达信息。

因为下载的原始数据没有经过标准化,不符合CIBERSORT算法的需求,因此需要对下载的原始数据进行标准化处理。标准化处理用的是limma包。

转换前后的表达值

02、 CIBERSORT

对数据整理完成后,就可以采用CIBERSORT法计算每个样本中的免疫细胞组成信息了。实际上,CIBERSORT官网提供了一个在线分析的网页,在这里,我们把这个工具源代码集成到了R中。在分析中,我们需要一个参考文件——ref,以及集成好的CIBERSORT源代码。

接下来,我们只要直接运行run.R中即可。安装好所需的包,随后修改运行路径就可以了。运行结束后,就可以获得一个CIBERSORT-Results文件。

随后,我们需要对这个结果进行一个过滤,去掉p值小于0.05,或者说是没有意义的样本结果。直接调用perl,然后运行filter即可进行过滤。在filter.pl的脚本中,可以修改过滤的阈值。在脚本运行完后,会给出过滤完后剩下的各类型的样本数目。过滤完后的文件中,就只保留了样本信息和免疫细胞信息。

结果可视

可视化主要包括柱状图,热图,相关性热图和小提琴图。 图形的绘制都直接通过脚本完成。输入文件均为过滤后的CIBERSORT文件。

在柱图中,横坐标表示了样本信息,纵坐标则表示免疫细胞的百分比,没根柱子中都会有多种不同的颜色,不同的颜色就代表了不同的免疫细胞类型。总的百分比加起来就是百分百。

热图的结果和之前的热图是类似的,不同的是右侧的直方图不是表示每个样本中的基因表达水平,是直接表示的每种免疫细胞在样本中的百分比。

相关性热图,没有给出具体的样本信息,只对所有的免疫细胞之间的相关性进行了计算。

小提琴图则是对肿瘤和正常样本中各个免疫细胞的表达情况进行分析,同时绘制了小提琴图,并给出了没中免疫细胞在正常样本和肿瘤样本中的差异p值。 样本类型的颜色图示可以在脚本中进行修改。

临床相关性分析

临床生存相关分析的数据整理,和临床数据的需求及整理方法都是类似的。

除生存分析外,还可以对每种免疫细胞与疾病的阶段的相关性进行分析

往期推荐
数据没造假也不行!赵静、张文宏正面回应被撤稿!
不做实验、不会生信,超全网络药理学套路,赶紧学起来
免费!中文界面!这款科研绘图软件,我要吹爆了
导师白送 SCI 一作,反被学生考虑撤稿?还有这种奇葩操作...

Tips:点击 “阅读原文” 领取最新更新资源包!

版权:如无特殊注明,文章转载自网络,侵权请联系cnmhg168#163.com删除!文件均为网友上传,仅供研究和学习使用,务必24小时内删除。
相关推荐