go分析r语言 aggregate r语言

GO、KEGG富集分析(一)有参情况

1、GO富集分析原理: 有一个term注释了100个差异表达基因参与了哪个过程,注释完之后(模式生物都有现成的注释包,不用我们自己注释),计算相对于背景它是否显著集中在某条通路、某一个细胞学定位、某一种生物学功能。

成都创新互联是一家集网站建设,安庆企业网站建设,安庆品牌网站建设,网站定制,安庆网站建设报价,网络营销,网络优化,安庆网站推广为一体的创新建站企业,帮助传统企业提升企业形象加强企业竞争力。可充分满足这一群体相比中小企业更为丰富、高端、多元的互联网需求。同时我们时刻保持专业、时尚、前沿,时刻以成就客户成长自我,坚持不断学习、思考、沉淀、净化自己,让我们为更多的企业打造出实用型网站。

2、例如,讨论这些差异基因主要映射到哪些GO或KEGG分类条目中,以说明基因表达的改变会导致哪些调控途径原有功能失调,进而与表型联系起来。通常称这种分析为GO、KEGG富集分析。

3、KEGG指的是京都基因与基因组百科全书,通常我们使用KEGG中的pathway模块,将基因映射到某些通路上,了解基因参与生物体中的代谢过程等。

4、尽管多重检验的校正可以减少假阳性,但并不能从根本上解决GO(或KEGG)富集的问题。GO富集的根本问题在于一个基因对应的GO term有多个,一个term对应多个gene,同时还有层级关系。

5、单细胞富集分析我最常用的是 分组GSVA ,但最近用到了GO分析,就复习一下GO和KEGG富集分析及绘图。载入无比熟悉的pbmc.3k数据集 (已注释好,数据准备见 monocle )pbmc3k数据集只有1个样本,没办法区分HC和病例组。

【R语言】解决GO富集分析绘图,标签重叠问题

最近有粉丝反映说,利用clusterProfiler这个包绘制GO富集分析气泡图和柱形图的时候,发现GO条目的名字都重叠在一起了。气泡图 柱形图 这个图别说美观了,简直不忍直视。经过我的认真研究,发现跟R版本有关。

但是该方法存在一个很大的问题,那就是当x轴标签数量很多时,那么就无法通过这样的方法进行解决了。方法二是方法一的逆向思路,既然可以调大画布,那么反过来,我们也可以调小x轴标签字体。

最近小Q在做自然选择分析,分析完之后简单粗暴的对候选基因做了富集分析,并做了展示,比起气泡图,我模仿了另一种作图方式,显示效果更佳。所以想在此分享一下如何用R语言画富集分析示意图(非气泡图)。

GO富集结果整体可视化

1、下面就来介绍一下simplifyEnrichment包是如何展示GO富集结果的。这里用该包中数据做一个演示。

2、默认展示circ 数据前10个GO Term,通过参数 nsub 调整需要展示的GO Term chord_dat ()将作图数据构建成GOChord() 要求的输入格式;一个二进制的关系矩阵, 1 表示基因属于该GO Term, 0 与之相反。

3、经过上游的生信分析我们会获得许多具有生物学意义的gene set,可以是差异表达基因,也可是正选择基因或者加速进化基因。通常,只要具有这些基因的gene symbol或者是geneid,都可以利用该软件进行分析。

4、富集分析结果的可视化无非就是柱状图和气泡图,但是公司默认出图实在是太丑,所以还是自己动手修改修改。常规柱状图(ggplot2)横轴为gene counts,或者用-logP也行,填充相应的用P值或者gene counts。


网页名称:go分析r语言 aggregate r语言
标题链接:http://myzitong.com/article/dsjicid.html