motif中PFM矩阵是怎么样的
小编给大家分享一下motif中PFM矩阵是怎么样的,希望大家阅读完这篇文章之后都有所收获,下面让我们一起去探讨吧!
目前创新互联建站已为千余家的企业提供了网站建设、域名、网站空间、网站托管、服务器租用、企业网站设计、津南网站维护等服务,公司将坚持客户导向、应用为本的策略,正道将秉承"和谐、参与、激情"的文化,与客户和合作伙伴齐心协力一起成长,共同发展。
PFM全称为position frequency matrix, 用于代表motif的碱基分布频数,本身是一个很容易了解的概念,以下图所示的motif序列为例
根据以上8条序列可以统计出对应的碱基分布频数,如下所示
每行为一种碱基,每一列为motif的一个位置。
在描述motif信息时,除了一致性序列和sequence logo外,PFM矩阵也是一个常见的元素。不同软件会有不同的标准,理解这些格式就是本文的核心内容。
JASPAR是一个常用的转录因子motif数据库,在该数据库中,针对PFM矩阵有多种格式,如下图所示
1. RAW PFM
原始的PFM矩阵示意如下
第一行和fasta格式的序列标识符类似,>
开头,MA
开头的字符串为转录因子在JASPAR数据库中的编号,是唯一的,AGL3
表示该转录因子的名称。
接下来的4行依次表示A
, C
, G
, T
4种碱基在每个位置的频数分布。
2. JASPAR
JASPAR格式的PFM矩阵示意如下
和原始的PFM矩阵非常类似,只不过在每行的开头标注了对应的碱基,并且用[
和]
操作符将碱基频数矩阵括起来。
3. TRANSFAC
TRANSFAC格式的PFM矩阵示意如下
采用了TRANSFAC数据库中的文件标准,AC
表示motif编号,ID
表示motif的名称,PO
以及下面的行为对应的碱基分布频数。
4. MEME
MEME格式的PFM矩阵示意如下
ALPJABEAT
代表碱基的字符集,strands
代表链的方向性,+ -
代笔在使用meme预测motif时没有指定链的方向,Background
代表背景中的碱基组成频率,MOTIF
和以下的行为对应的碱基分布频率。
不同的软件和数据库对应的PFM矩阵的格式不同,在使用不同软件和数据库时需要注意。
看完了这篇文章,相信你对“motif中PFM矩阵是怎么样的”有了一定的了解,如果想了解更多相关知识,欢迎关注创新互联行业资讯频道,感谢各位的阅读!
分享标题:motif中PFM矩阵是怎么样的
地址分享:http://hbruida.cn/article/jscpds.html