查看原文
其他

如何挖别人的数据,写自己的标书 II

2015-12-11 右哉 实验万事屋

温馨提示:请点击标题下方蓝色“实验万事屋”,或者点击下面的指纹,添加关注后,发“”可以查看我们之前的文章。


我叫骨头,我是万事屋的NPC,是林师兄的师妹……作为师妹,当然我也面临着林师兄一样的惨境。鲁老板要师兄做的是非肿瘤的疾病,而要我找的是肿瘤相关疾病的。相对来说还是简单点了……但是,这叫我要怎么来挖掘呢?


杀姐姐:挖掘肿瘤相关的数据就简单多了好么?一样是找GEO的DataSets(http://www.ncbi.nlm.nih.gov/gds)上的芯片,先按照昨天神师兄教的你来挖挖看芯片看。先随便搜一个肠癌的来看看。



肿瘤相关的芯片内容会有很多,我们就找一个肠癌发生的,里面涉及到的可变条件会稍微低一些,不像是耐药那种。这是一个肠癌早期发现的肿瘤和对照的芯片。



按照昨天神师兄的方法,我们先比较两个组别的差异,也就是比较健康组和肿瘤组的差异,选择表达数值差异两倍以上的基因。



我们搜到6000多个基因,那接下去怎么办呢?




接下去,我们就要用到一个M××××的数据库了。(别骂我,就是不告诉你是啥数据库,咩嚯嚯……下次再讲,你们就能记得住了。)这个数据库基本上就是简化版,还不用注册的Oncomine。然后我们输入这样几个基因,也就是我们搜出来的前20个:WFDC2,ZDHHC11,CORO6,NEXN,CCDC65,PRSS33,ZNF333,GAPT,ODF4,KLHL10,MEGF11,SCGB1C1,WDR88,ADAMTSL1,SERPINB11,MPP4,SLAMF6,GPBAR1,TMEM74,ATP6V1C2。



去掉芯片样本的标签,顺便给表达柱状图加一个颜色看看。



接下去就是分析的时间了,虽然可以直观的看到表达的柱状图,但是我们还是要选择做一个BoxPlot比较好,能更直接地看清楚。




接着就选出几个表达差异有预期潜质的基因来,也就是肿瘤中表达量高,对照中表达量低的样本。



因为GoPubmed最近好像上不去,我们就用另一个神器PubMed PubReMiner来分批搜一下这三个有潜质的基因。



差不多和肿瘤发生发展的研究都比较少,但也未必完全相关,所以还是需要有一定的表达分析或者免疫组化的预实验支持才能往下继续做的哦!


…华丽丽的分割线…


李莫愁博士:今天继续挖数据,和昨天一样,也挖了一个坑,昨天居然有个童鞋答对了那个数据库的名字,还真不错呢。好吧,今天大家就继续猜测吧……不管怎么样挖掘数据,都应该注意的就是必须要有预实验的研究支持,芯片数据和普通的结果不一样,即使你自己做出来的芯片,再验证也未必符合预期结果,更何况是别人研究的芯片呢?挖掘出来的数据,再做个qPCR的预实验或者WB的预实验才是王道。好了,今天就策到这里吧。


万事屋出售的课程及服务(点击下方飘黄部分即可查看)


分子生物学技术培训班 12月24-27日(客服阿可微信号:zz76770309, 联系电话李老师:18217651683)


《一分钟meta学习教程》(还有个meta讨论的群,点进去找阿可拉大家吧,优惠码也是问客服阿可:zz76770309)


万事屋文献合集(28元包邮,子里有购买流程,如果需要帮助请联系客服阿可,微信号:zz76770309)



您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存