查看原文
其他

我就是用这神器随便挖一个TCGA

2016-11-17 右哉 实验万事屋

温馨提示:请点击标题下方蓝色“实验万事屋”,或者点击下面的指纹,添加关注后,发“嗯”可以查看我们之前的文章。


因为知道你们对挖掘数据也未必感兴趣,反正大家可能也已经有自己的课题了,对挖掘数据库也没什么想法,这个也推动不了科学进步哈,所我也就只是随便给你们讲一下这个网页版的神器吧。网页版的好处就是,无论Mac还是Windows,都能用。


这个神器是用来挖掘芯片和二代测序数据的,不用太在意啦,就只是可以随便挖一个GEO和TCGA的数据,不是必考题。



当然我比较感兴趣的是TCGA,因为另一栏里的GEO数据我都挖好久了,所以还是看看TCGA,这里也只有二十多个测序数据可以挖吧。



我就随便挖个乳腺癌算了,看着样本量挺大的800多个样本。



点击确认选定的星号样本,然后是确认选定的星号基因数据。



给要分析的数据编个名字,反正就是挖着玩,就叫123好了。



当然,会自动形成这个什么芯片的样本情况的PCA等等的图,这个不重要啦。



然后选择“Normalization”,把样本均一化一下,反正是自动整的。



接着把数据切换到已均一化的这个数据里。



分一下样本组吧,雌激素受体阳性的,和阴性的,按照实际数据来就行了。



然后可以分析差异基因了,我用了Voom,顺便也用了Limma来分析,这都是常用的二代测序数据的差异基因分析算法,你要是懂R语言的话,这个应该都很熟悉,但不懂耶没关系,就直接点一下就行,反着就是随便挖挖,好简单的不是么?



limma的有点慢,voom的先出来了,这就是Voom计算获得的结果。



这都是可以导出的,导出的结果和GEO2R差不多。



当然也会有热图,就是色系差了点。



Limma的数据出来后,还会多一个火山图,是不是似曾相识?



计算获得的差异基因,可以直接进行……GSEA分析,点一下右上角的GSEA就行了。



差不多是什么“activiation of ATR in response to replication stress”、“cell cycle”之类的标签得到了富集吧,反正我随便挖挖的,无所谓啦。



只有GSEA?当然不是,这个还能分析WGCNA,信号通路,GO分析。我就随便分析了一些信号通路。



信号通路大概就是这样的结果。



下面是列表,反正细胞周期的好像蛮多。



接着我又随便做了一下GO分析,大概是上图这样……



好奇心驱使下,我还分析了一下生存曲线。反正雌激素受体阳性的,存活率应该是高蛮多了吧。


…华丽丽的分割线…


李莫愁博士:这么多天下来,发觉大家对挖掘数据根本不感兴趣。所以这篇TCGA的数据,我就挖得很随意。因为估计大家也不想知道这个神器是啥,也不想让大家昧着良心来夸右叔,就隐去这个神器的名字了。ps:即使知道了也未必能正常使用,即使能正常使用,也未必能分析出结果,做这个,我也是失败了很多次,才摸索出这个神器使用方法的,根本不能看它自带的教程,走了不少弯路。除了分析TCGA,还能分析GEO,甚至是你自己的数据,它也能进行分析,只要Import就行了。


R语言固然好,但终究会被轻工具来取代的,就好比有了手机,谁还回去邮局发电报呢?这个神器,省了多少个R包呢?好了,有想挖数据的,那自己想办法去找右叔,今天就先策到这里吧。


万事屋出售的课程及服务(点击下方即可查看,客服微信号阿可:wsw76770309)


《meta简明教程》         

《SCI写作教程》          

《SCI制图》       

标书写作教程       

松哥统计教     

科研小软件应用》,即万事神器        

正版特价书



您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存