GSEA软件的使用方法是什么

GSEA软件的使用方法是什么，针对这个问题，这篇文章详细介绍了相对应的分析和解答，希望可以帮助更多想解决这个问题的小伙伴找到更简单易行的方法。

娄底网站制作公司哪家好，找创新互联！从网页设计、网站建设、微信开发、APP开发、成都响应式网站建设公司等网站项目制作，到程序开发，运营维护。创新互联从2013年成立到现在10年的时间，我们拥有了丰富的建站经验和运维经验，来保证我们的工作的顺利进行。专注于网站建设就选创新互联。

Gene Set Enrichment Analysis是一种富集算法，由Broad Institute研究所的科学家提出，算法核心示意如下

GSEA软件的使用方法是什么

需要两个输入元素，一个就是排序好的基因列表，这里的排序的规则是展现两组间的差异，比如按照Foldchange的值进行排序，第二个就是基因的注释集合，然后运行KS检验计算Enrichment Score(ES),用置换检验评估ES的可靠性。

Broad Institute研究所的科学家同时还提供对应的分析软件GSEA，该软件是java语言开发的图形界面软件，简单易用，下载地址如下

http://software.broadinstitute.org/gsea/downloads.jsp

官网提供了多种下载方式，推荐直接下载jar文件，示意图如下

GSEA软件的使用方法是什么

如下所示，运行GSEA分析，需要两个基本元素，第一个就是表达谱数据，可以是芯片数据，也可以是rna-seq的定量结果，第二个就是基因集数据库，官网对于human提供了MSigDB数据库，当然你也可以自己定义基因集。

GSEA软件的使用方法是什么

在实际操作时，第一步首先是导入数据，有以下4种数据需要导入，由于在windows平台操作，通过特定的后缀来识别文件格式

1. expression datasets

表达量文件，可以是芯片，也可以是rna-seq的定量结果，后缀为gct, 示意如下

GSEA软件的使用方法是什么
该文件是\t分隔的纯文本文件，第一行内容总是为#1.2, 表示版本，第二行表示表达量矩阵的维度，第一个值对应探针探针/基因个数，第二个数值代表样本个数，第三行是表达量矩阵的表头，前两列固定是NAME和Description, NAME是基因ID或者探针ID,必须保证唯一，Description表示描述信息，如果没有，可以用na填充，后面每列对应一个样本。