go分析r语言 aggregate r语言

GO、KEGG富集分析(一)有参情况

1、GO富集分析原理：有一个term注释了100个差异表达基因参与了哪个过程，注释完之后（模式生物都有现成的注释包，不用我们自己注释），计算相对于背景它是否显著集中在某条通路、某一个细胞学定位、某一种生物学功能。

成都创新互联是一家集网站建设,安庆企业网站建设,安庆品牌网站建设,网站定制,安庆网站建设报价,网络营销,网络优化,安庆网站推广为一体的创新建站企业，帮助传统企业提升企业形象加强企业竞争力。可充分满足这一群体相比中小企业更为丰富、高端、多元的互联网需求。同时我们时刻保持专业、时尚、前沿，时刻以成就客户成长自我，坚持不断学习、思考、沉淀、净化自己，让我们为更多的企业打造出实用型网站。

2、例如，讨论这些差异基因主要映射到哪些GO或KEGG分类条目中，以说明基因表达的改变会导致哪些调控途径原有功能失调，进而与表型联系起来。通常称这种分析为GO、KEGG富集分析。

3、KEGG指的是京都基因与基因组百科全书，通常我们使用KEGG中的pathway模块，将基因映射到某些通路上，了解基因参与生物体中的代谢过程等。

4、尽管多重检验的校正可以减少假阳性，但并不能从根本上解决GO（或KEGG）富集的问题。GO富集的根本问题在于一个基因对应的GO term有多个，一个term对应多个gene，同时还有层级关系。

5、单细胞富集分析我最常用的是分组GSVA ，但最近用到了GO分析，就复习一下GO和KEGG富集分析及绘图。载入无比熟悉的pbmc.3k数据集 (已注释好，数据准备见 monocle )pbmc3k数据集只有1个样本，没办法区分HC和病例组。

【R语言】解决GO富集分析绘图,标签重叠问题

最近有粉丝反映说，利用clusterProfiler这个包绘制GO富集分析气泡图和柱形图的时候，发现GO条目的名字都重叠在一起了。气泡图柱形图这个图别说美观了，简直不忍直视。经过我的认真研究，发现跟R版本有关。

但是该方法存在一个很大的问题，那就是当x轴标签数量很多时，那么就无法通过这样的方法进行解决了。方法二是方法一的逆向思路，既然可以调大画布，那么反过来，我们也可以调小x轴标签字体。

最近小Q在做自然选择分析，分析完之后简单粗暴的对候选基因做了富集分析，并做了展示，比起气泡图，我模仿了另一种作图方式，显示效果更佳。所以想在此分享一下如何用R语言画富集分析示意图（非气泡图）。

GO富集结果整体可视化

1、下面就来介绍一下simplifyEnrichment包是如何展示GO富集结果的。这里用该包中数据做一个演示。

2、默认展示circ 数据前10个GO Term，通过参数 nsub 调整需要展示的GO Term chord_dat ()将作图数据构建成GOChord() 要求的输入格式；一个二进制的关系矩阵， 1 表示基因属于该GO Term， 0 与之相反。

3、经过上游的生信分析我们会获得许多具有生物学意义的gene set，可以是差异表达基因，也可是正选择基因或者加速进化基因。通常，只要具有这些基因的gene symbol或者是geneid，都可以利用该软件进行分析。

4、富集分析结果的可视化无非就是柱状图和气泡图，但是公司默认出图实在是太丑，所以还是自己动手修改修改。常规柱状图（ggplot2）横轴为gene counts，或者用-logP也行，填充相应的用P值或者gene counts。

当前名称：go分析r语言 aggregate r语言
网页路径：http://myzitong.com/article/dsjicid.html

go分析r语言 aggregate r语言

GO、KEGG富集分析(一)有参情况

【R语言】解决GO富集分析绘图,标签重叠问题

GO富集结果整体可视化

其他资讯