蛋白质折叠速率与mRNA
李瑞芳 编著
前言
20世纪70年代初,Anfinsen提出蛋白质的氨基酸序列包含足够的信息决定其空间结构的假说,并因此获得诺贝尔奖。但是,一些研究者发现存在氨基酸序列相同但构象不同和构象相似而氨基酸序列相差显著的蛋白质。这说明氨基酸序列并不是决定蛋白质结构的充分条件,同时意味着除氨基酸序列以外的其他信息对蛋白质空间结构的形成也是非常重要的。但是这种信息到底储存在哪里?是通过什么途径来传递的?这些问题一直困扰着相关研究者们。如果我们能够找到mRNA除了编码氨基酸之外影响蛋白质结构的其他定性或定量结果,那就意味着我们找到了两者之间的一些联系,这是一项极具挑战性的工作。
如果除氨基酸之外确实还有一些影响蛋白质结构和功能的信息,这种信息很有可能存在于mRNA序列和结构中。但是,现有的报道中没有找到相关的定量描述。考虑到折叠速率包含一些蛋白质结构和功能的信息,那么蛋白质折叠速率与其相应mRNA序列之间的关系就会表明,蛋白质对应的mRNA序列除了编码氨基酸之外确实还携带一些影响蛋白质结构和功能的信息。而蛋白质折叠速率又与蛋白质结构有着非常密切的相关性。如果能找到有关mRNA序列和结构对蛋白质折叠速率影响的一些定量结果,也就意味着找到了mRNA序列和结构与蛋白质结构间相关性的定量结果。这是我们工作思路的出发点。
从最简单的单细胞生物到最高等的人类,其最基本最重要的组成物质是DNA、RNA和蛋白质,这些组成物质是生物体遗传信息的携带者。由于人类基因组计划的顺利实施以及各种后基因组计划的开展,人们获得了大量的生物分子数据。这些生物数据具有丰富的内涵,其背后隐藏着许多人类尚不清楚的生物学知识。利用数学、物理、化学等各种方法,通过大量数据分析来揭示生物分子数据中蕴含的生物信息是一项非常有意义的工作,也为我们的工作提供了研究方法。
基因组中mRNA序列被认为是一种遗传语言,它的词汇组成和语法结构中包含了绝大…