今天我们隆重推出第二种网络图绘制工具——权重网络图卖烟油的网站,可以将基因间卖烟油的网站的调控互作关系绘制成一个有权重的网络图,展示的是基因间的共表达关系以及相关性强弱关系。
权重网络图与有向网络图的主要区别在哪里?那么,我们做个简单的比较:
有向网络图更关心调控的方向,例如,miRNA对靶基因的调控作用;
权重网络图不关注调控关系的方向,关心的是调控关系的强弱。基因调控关系的强弱(也可以称为调控关系的权重)可以在图形中被充分展示。同时,在权重网络图中,基因的连通性(connectivity)可以使用节点(节点即代表基因)的颜色或大小来表示,从而有利于突出展示调控网络图中的处于调控枢纽位置的核心基因。
什么是基因连通性?
即网络图中的某个基因与其他基因的调控关系的数量或强弱程度之和。连通性越高,则说明该基因在该调控网络中处于核心(hub)的位置,潜在功能更重要。如下图所示,基因A在这个调控网络中连通性最高,处于网络图的核心位置,说明基因A在这个基因调控网络中可能具有重要的作用。
因此,我们的权重网络图工具可以画出如下面的图:
这个图展示的是草莓花托在发育过程中的基因表达调控网络。网络图中的结点(基因)越大、颜色越红,代表该基因在网络图中的连通性越大,即在调控网络中处于越重要的位置。我们可以看出,位于网络图核心位置的基因大部分为转录因子(TF),他们与其他基因的连通性最高,表明这些基因在基因表达调控网络中具有最重要的作用。
下面我们就来看看如何绘制这样的权重网络图:
步骤
01 进入工具
从OS Tools首页找到“权重网络图”工具,点击进入。进入后发现版面很简洁,只需要输入一个文件:边界文件,和设置两个参数:连通性方法和权重范围选择。而且边界文件也只有三列,那是因为与有向网络图一样,网络图的样式修改是在任务完成后再随意修改的,后面会详细介绍~
02 输入文件
需要输入一个边界文件作为作图数据。边界文件至少必须包含三列:
第一列和第二列为基因名称或基因ID,在同一行中,表示第一列的基因和第二列的基因有相互作用关系(没有方向的区分)。
第三列为权重(weight),即两个基因间的相关关系,在绘制出来的权重网络图中,基因间的权重将会平均分成四份,从权重小到大分别用点线、短虚线、长虚线、实线来表示。
这三列之后还可以有其他数据,比如基迪奥WGCNA结题报告中给出的cytoscape配置文件edge文件,总共有六列。因此,可以直接将这个edge配置文件输入,画出权重网络图。
要注意的是,边界文件必须包含表头,表头可以自定义,如:fromNode, toNode, weight。
03 参数设置
1.连通性方法
如上面所说,连通性指的是网络图中的某个基因与其他基因的调控关系的数量或强弱程度之和。连通性的计算方法有硬阈值和软阈值两种方法。这两种方法的区别粗暴地说就是有无和多少的区别。
硬阈值是简单地从“有无”来计算基因的连通性,即某个基因与多少个其他基因有关联,连通性即为多少。比如基因A总共与10个基因有相互作用,则基因A的连通性为10。而软阈值是从“多少”来计算基因的连通性的,是指一个基因与其他基因的相关系数(权重,weight)的总和。例如基因A与基因B的权重为0.2,与基因C的权重为0.3,与基因D的权重为0.5,则基因A的连通性为0.2+0.3+0.5=1。
不是很懂?那么小师妹用一个生动的例子来说明吧!基迪奥小师妹和基迪奥小师兄都各有10个朋友,那么我们对应的硬阈值连通性都是10。但是小师妹的10个朋友中,大部分都和小师妹感情很好,是亲密的闺蜜,而小师兄只有一个很好的哥们,其他的朋友都是点头之交。那么小师妹的软阈值连通性就要比小师兄高了,哈哈哈哈!
通常,选择软阈值来计算基因的连通性,要比硬阈值更能反应基因在调控网络图中的地位,WGCNA分析中模块中基因的连通性也是用软阈值方法来计算的。但你们也可以根据实际情况来选择不同的连通性计算方法。
2.权重范围
通常,在一个基因调控网络中,基因数目非常多,两两基因间都会算出一个权重(相关系数),因此,如果把整个文件所有基因和关系都用来做网络图,出来的图肯定密密麻麻什么都看不清。而且通常我们关注的是权重较大、相关关系较强的基因间共表达关系,一般情况下这类基因才具有生物学意义。因此没有必要把所有的共表达关系都画出来。所以,我们可以自行设置权重范围,展示特定权重范围下的基因间调控关系。比如选择权重范围在0.5-1.0之间的基因来作图。
注意:如果连通性方法选择的是硬阈值,系统运行时是先筛选权重范围再在这个范围内计算基因的连通性;如果连通性方法选择的是软阈值,则是先计算每个基因的连通性后再筛选权重范围进行画图展示。
举个例子:A基因和5个基因间存在调控关系,表达量相关系数的强弱(即权重值)分别是:0.1,0.3,0.5,0.6,0.9。
然后我们选择权重范围:0.5~1绘图。
那么,根据两种计算方式得出的A基因的连通性分别是:
硬阈值:3 (因为有3个调控关系位于这个范围)
软阈值: 0.1 + 0.3 + 0.5 + 0.6 + 0.9 =2.4(即使不在阈值范围内的调控关系,依然被保留和相加)
04 提交任务、查看结果
输入边界文件、设置好参数后,就可以提交任务了。任务是瞬间完成的~~点击“结果预览”,即可跳到网络图样式调整界面:
05 网络图样式调整
得到网络图后,接下来就对网络图进行样式调整。可以进行全局样式调整、结点连通性表现形式设置、边界的样式调整、结点的样式调整,也可以单击某个结点或某条边界进行单个结点或边界的样式调整。
1.全局样式调整
和有向网络图一样,可以调整网络图布局、是否显示结点标签、标签字体大小等。将刚才的网络图调整为“圆形”的网络布局:
合并边界:画出来的网络图的边界默认是根据权重大小分为四种线形的(如“2. 输入文件”所述),看上图就知道。如果不想展示基因间权重的不同,可以在“合并边界”这里选择“是”,那么所有的边界都变为实线了。
2.结点连通性设置
结点连通性的表现方式有两种:颜色和大小,可以任意选择其中一种表现方式,或两种都选或不选。可以自行设置颜色的渐变范围,和渐变的大小值。小师妹就喜欢颜色和大小都选择,这样更加直观地展示出哪些基因连通性高。这里我选择从白到红的颜色渐变,大小从18-35。
从图中我们可以看出,ENSOART00000018050等基因颜色最红、结点最大,说明连通性最高。
另外,基因连通性的颜色渐变图例可以另行下载为svg格式,后期可将图例和网络图PS在一起:
3.边界、结点样式设置
和有向网络图一样,可以对边界、结点的样式进行统一设置。
4.单独结点、边界设置
双击某结点、边界,可对单个结点、边界进行样式设置。
06 保存结果
调整好样式后,点击右上角的“保存网络图”,可保存为png, pdf, svg格式。记住:调整好样式后务必记得保存,因为系统是不会自动保存你调整过的样式的,如果把这网页结果关闭,重新打开时就需要重新调整了!那么你刚才的功夫都白费了!
来源:基迪奥生物
医学科研干货免费下载,请点击这里关注“肽度时界”公众号,关注后回复“指定数字”获取:
1.医学科研实验常用protocol--回复“001”领取
2.质粒图谱大全--回复“002”领取
3. 医生晋升方法/执业医生题库/晋升程序与制度/考试口诀等--回复“003”领取
4.中国互联网预约挂号服务市场专题研究报告2016--回复“004”领取
5. 科研必备软件(12大分类50款)免费下载 --回复“005”领取
6. 2016年全球二代基因测序行业投研报告 --回复“006”领取
7. lncRNA超级干货(68篇文献免费阅读) --回复“007“领取
8. SCI论文超级干货合集(SCI论文写作技巧+配图软件+施一公大咖经验+文献检索+SCI经验书籍) --回复“008” 领取
9. 中国移动医疗市场年度研究报告2016 --回复“009”领取
10.信号通路与信号转导系列文件+Cell网站细胞信号通路图(超多干货)--回复“010”领取