查看原文
其他

WashU EpiGenome Browser的基本用法——跟着岳大师学ENCODE和RoadMap(四)

2016-08-31 郭大侠 实验万事屋

温馨提示:请点击标题下方蓝色“实验万事屋”,或者点击下面的指纹,添加关注后,发“嗯”可以查看我们之前的文章。


一转眼岳大师系列到了第四篇,郭大侠看了之前一些小伙伴的留言,结合本实验室师弟师妹的疑问,发现很多小伙伴对组蛋白表观修饰缺乏了解,很多人对组蛋白修饰的理解就是某修饰是激活转录的、某修饰是抑制转录的。郭大侠的某师妹对于特定位点一甲基化(me1)和三甲基化(me3)的理解搞的一塌糊涂,甚至不知道这两个修饰是由不同的酶催化生成,感觉有必要简单说明一下。早在2002年就有科学家提出了histone code的概念,认为在遗传信息传递过程中,组蛋白修饰也可以组成特定的密码修饰来影响转录:如活跃基因的转录起始位点通常会发生H3K4me3和H3K27ac的修饰;Gene body上的H3K36me3修饰可以促进基因转录;H3K9me3和H3K27me3在启动子区域的修饰会介导转录抑制;H3K4me1、H3K27me3和H3K27ac修饰常常出现在增强子(enhancer)区域,分别调控着enhancer待发(primed)、准备(poised)和活化(active)三种状态,H3K4me1修饰与增强子的三种状态均有关联,可以作为增强子的标记,当增强子处于准备状态时,会发生H3K27me3修饰;当增强子活化后则会擦除H3K27me3修饰,发生H3K27ac修饰。建议想系统学习的小伙伴买这本书看看入门,虽然书有点老(2007年出版),但是个人感觉不是做遗传学单纯拿表观遗传做机制这本书足够了。


 

图1


今天要介绍的数据库是WashU EpiGenome Browser,该数据库由圣路易斯华盛顿大学医学院的王艇教授小组(http://wang.wustl.edu/)创建维护。王艇教授的研究主要是通过干湿实验结合研究表观遗传调控机制,paper十分高产,此外还构建了UCSC Cancer Genomics Browser,绝对是大神级人物。相比于UCSCBrowser,WashU EpiGenome Browser在浏览表观遗传修饰数据中表现的更加专业,界面更加友好,容易上手学习,同时配色方案远优于UCSC;同时可以加载ENCDOE、RoadMap和用户自定义文件,实现数据的快速浏览比对。


WashU的主页链接:http://epgg-test.wustl.edu/。打开后如图2所示,2-1链接到WashU EpiGenomeBrowser,2-2链接到RoadMap EpiGenome Browser(我们会在岳大师第五篇中讲解该数据库使用)。2-3中有详细的教程,包含一份PDF说明文档(http://epigenomegateway.wustl.edu/support/2015IEC/2015_IEC_tutorial.pdf)和视频教程(需要翻墙看)。这里我们先只看WashU的用法,点击2-1进入。


 

图2


WashU的进入后会首先让用户选择参考基因组(图3),这里我们选择3-1红框中的hg19,这个参考基因组下数据量最大。做其他物种的也有相应的参考基因组数据,比如小鼠、斑马鱼,水稻等,可以在3-2中选择相应分组找到。

 

图3


进入后,系统提示hg19基因组已经加载(图4.A),并提示接下来加载何种track。有三种方式,“Custom tracks”按钮可以加载用户自己的文件,比如ChIP-Seq的bed文件或者bigwig文件;“PUBLIC hubs”可以加载GEO中的公共数据;“GENOME broeser”可以浏览整个基因组。这里多解释一下何谓track,其原始含义表示轨道,CD诞生后一首歌曲数据会存在一个音轨中,因此track也就表示一串储存好的信号文件;在WashU中每个数据信号会按照图4.B样通过数据波峰展示,因此加载一个ChIP-Seq文件也叫作加载一个track。这里我们使用Roadmap中的表观修饰数据,点击图4.C红框中的“Load”按钮,完成数据加载。

 

图4


加载后系统显示图5界面,系统默认加载模式细胞系IMR90(人胚肺成纤维细胞)的数据。5-1显示的是当前显示位置,点击蓝色方框可以输入染色体位置、基因名或SNP位点来跳转到特定位置。5-2是当前染色体位置,可以用鼠标在此拖拽选取查看特定区域。5-3是相关的组蛋白修饰tracks,从上往下依次是input数据、H3K4me3修饰信号(两次重复)、H3K4me1修饰信号(两次重复)、H3K9me3修饰信号(两次重复)、H3K27me3修饰信号(两次重复),在5-3中每个track中点击右键,可以设置显示方式(未展示)。5-4中显示了染色体状态与顺式调控元件,上面的各种颜色代表不同的信息,将鼠标移上去即可显示:如深灰色代表被PolyComb抑制表达区域,明黄色代表enhancer,红色代表活化的TSS(转录起始位点),绿色代表转录本。5-5中展示了甲基化测序数据,背景中灰色代表了该区域CpG的丰度,蓝色代表甲基化CpG丰度。5-6中主要说明了基因组上一些重复序列情况,如短散在元件(SINE)、长散在元件(LINE)、Alu序列等,这些重复序列具有调控基因表达的功能。5-7中显示的是转录本情况,箭头代表了转录方向。这个图大家可能在帖子里看不清楚,我把原始图上传到了网盘里:


图5


在此基础上我们可以往图5中增加自己感兴趣的数据,点击图5右上角Tracks按钮,可以弹出图6.A所示界面,在文本框中录入自己感兴趣的关键词,我们这里输入liver。出现如图6.B所示界面,可见在liver中有30个tracks,点击Add按钮。即可将图6.C中所示tracks加入。

 

图6.


这样一个基本的数据可视化过程就展示完毕。WashU中所生成的图可以直接放到paper 中,接下来我们看一下怎么导出。点击图5右上角APP按钮(在Tracks按钮右边),选择Screenshot(图7.A),弹出保存界面(图7.B),点击Take Screenshot按钮,即可生成SVG或PDF格式图片。


图7


…华丽丽的分割线…


李莫愁博士:大概郭大侠讲的表观遗传学的工具,大家都会觉得太难懂了。其实表观遗传很好理解,什么是表观遗传呢?就是在DNA不变的情况下,基因表达发生变化。那具体怎么发生的呢?就是通过染色质的修饰,正常的染色质大概就是这样的:



如果没有修饰的话,染色质是组蛋白搅和着DNA的一条链子。但是组蛋白如果有了修饰,就会导致染色质产生变化,比如,H3K9me3和H3K27me3修饰后,染色质就变得紧致了,转录因子无法插入(好羞涩)。H3K4me3和H3K27ac修饰后,染色质就变得很松散,转录因子和RNA聚合酶就更容易结合到DNA上,就像下面这样:



你要问这是啥?傻孩子,这就是课题啊,表达差异如果做到转录调控,那就需要做到更深层的表观遗传,这样才好报下来课题。呃,不要这么功利吧……好了,郭大腿也已经带你们上路了,能不能在这条路上撒欢,就看你们自己了,今天就策到这里吧。


万事屋出售的课程及服务(点击下方即可查看,客服微信号阿可:zz76770309)


正版特价书               《meta简明教程》         《SCI写作教程》          《SCI制图》     标书写作教程       万事神器       第30期全国SPSS统计软件研习班正式开始招生(上海,9月23-25日)




您可能也对以下帖子感兴趣

Dev Cell Voices:理解细胞如何在发育过程中保持时间的准确性
曲静/刘光慧/张维绮团队系统解码sirtuin长寿蛋白家族调控衰老的表观遗传机制 | Cell Press对话科学家
Cell Genomics:熊旭深/韩西坤合作揭示遗传介导的m⁶A与表观基因组跨层次相互调控 | Cell Press论文速递
武汉大学闫卫团队Trends in Genetics综述丨细胞外囊泡重塑表观遗传图谱
中国科学院微生物所刘晓团队Trends in Cell Biology综述丨环境信号通过表观遗传调控生物钟

文章有问题?点此查看未经处理的缓存