资讯正文

五个与生命有关的答案:生命是什么?

放大字体  缩小字体 2017-10-06 22:29:56  阅读:4285 来源:新浪科技 作者:何润东

  生命的语言  2014年WE大会的主题是“Nothing but the Future”,WE大会现场“星”光熠熠,华大基因董事合伙人王俊与11位国...

  生命的语言

  2014年WE大会的主题是“Nothing but the Future”,WE大会现场“星”光熠熠,华大基因董事合伙人王俊与11位国内外顶尖科学家和技术宅一同展示了未来畅想。那些创新、领先、疑似科幻的分享让在场的观众产生与未来无比接近的即视感,又因可见且能把握的未来而兴奋不已。

  王俊以“生命的语言”为题,和在座的嘉宾一起分享了阅读生命之书的价值和方法。“做了20多年基因研究,觉得上帝的语言和生命的语言其实是一套语言”。在科学家眼中,主宰生命的,就是身体里那些聪明的狡猾的自私的基因。我们的生与死,出生缺陷和肿瘤疾病,都在这看似小小的基因组合中。

  以下是演讲全文:

  我也有一个梦想,更好的理解生命的语言。

  今天非常高兴听到那么多有意思的讲座。很多讲座在讲计算机,有一些讲座在讲人机互动。我们今天还听到了更多外太空的事情。

  我只想讲一件事,我只想讲生命,回到人自身,回到我们自己。

  我演讲的题目来自于一本书的名字,这本书的作者是现任美国国立卫生院的院长Francis Collins,他是人类基因组计划的首席科学家,他还是一个基督徒。他这一辈子写了两本书,第一本书叫《生命的语言》,第二本书叫《上帝的语言》。这两本书都有中译本,大家感兴趣的话可以去看一下。看完这两本书,经过了近20年的基因研究,我越来越觉得这两套语言也许是一套语言。

  当我们想起语言的时候,我们当然可以想起唐诗宋词,做计算机的人,也许会想起C语言。那么生命的语言是什么呢?生命的语言到底有哪些特质,有哪些特质我们可以去理解,我们可以去应用。

  生命本身是数字化的。很有意思的是,当我们提起数字化,往往把它变成一种虚拟的东西,我们想不起来它是什么,我们很难把一个数字化的东西和一个活生生的人联系在一起。其实,在小到一个纳米级别的细胞里面,在每一个毫秒级别的生命过程,比如说一个蛋白质的折叠,一个激素的生成,所有的这些事情,都是由数字化精确调控的。这种精确调控的数字化过程,体现在生命的时间轴,也体现在生命的空间轴上。这是非常有意思的。如果生命本身是数字化的,如果我今天在这做演讲,我的每一个动作,我的每一个感情,如果都是带有数字化的特征,那我能不能有什么方法,去找到这个数字化的载体?

  有意思的是,生命的数字化信息,是传承,我们身上得来的DNA,是从父母来的,是从第一个细胞来的。第一个细胞里面,只有精子和卵子结合生成的受精卵。精子里面只有DNA,当然还有些能量物质。卵子里面还有些营养物质,所有的这些DNA,对于人来讲,是30亿个字母,这30亿个字母,蕴藏着人的所有的、未来的各种各样的可能性。而这样的一种生命体的生物信息的载体,就是在几十年前发现的双螺旋,那个DNA。也许未来的存储介质不应该是我们见到的硬盘、磁盘、光盘,也许应该是DNA。在只有间隔0.34纳米的字符间距里面,在只有1.5个皮克的DNA里面,蕴藏着30亿个字母。我们可以想象,我们可以把全世界的博物馆、图书馆所蕴藏的信息放在一个巴掌大的DNA载体里面,而且这个DNA载体可以不用担心,它可以一直维持上万年。

  谈到语言,它就有一种模块,就像我们读任何一本书它有单词一样。生命的语言的模块就是基因,而所有基因的组成单位是基因组。这个基因组是生命本身的预设程序。

  往前追述上亿年,当第一个基因产生的时候它是自私的,它希望不断的复制自己,它希望不断的扩张自己。走着走着,它突然发现,我一个基因也许不够,我需要联合其他的基因,所以很多很多的基因联合在了一起,选择了不同的基因的组合。物种,我们现在看见的大千世界的植物和动物,也许只是基因为了繁衍自身的一个载体。所以在我们自己的身上,看见了线虫基因的影子;在我们自己的身上,看见了老鼠基因的影子;在我们自己的身上,看见了猴子基因的影子。而所有的这些基因的不同组合,是谁来测试它这种组合是不是适合呢?是我们生存的这个环境。我们生存的这个环境告诉它说,这个组合是好的,它拥有更多的机会,去传递这个组合。

  对于人来讲,即使是一个物种,它仍然有这样的变化。这种变化,所谓有性繁殖,男人女人生这个孩子,这是一种基因的组合。我其中的一半和我夫人其中的一半组合起来,生了一个孩子。同时这个孩子和父母有60~100个基因的差异,这种差异,每一代都产生着,而每一代的这种差异又都受着环境的约束。所以这样的东西最终形成了我们对各种环境的适应。比如说西藏人,为什么说西藏人会对高原适应,为什么汉族人会不适应,是因为在其中的有一代,我们最近做出来,是第二次走出非洲的丹尼索瓦人,这些人身上有一些基因片段它是可以适应高原反应的。而这样的一个基因保存在了西藏人身上,并且扩散开来。如果我们在座的每一个人基因全部都测定了,在你的基因的30亿个字母里面,记录着什么时候这一个基因,在什么时候的哪一个时间段通过了什么样的变化变成了你现在的样子,全世界的人类迁徙史可以因此重写。我们可以知道到底曹操墓里面那个DNA是不是曹操,我们可以知道客家人到底是不是中原人的后代。当然我们现在已经知道了很多东西,比如说中国70%的汉族男人其实6000年前只有3个人,一个炎、一个黄、一个蚩尤,在你的DNA里都写着。每一个人都会有他自己的历史,每一个人的基因都蕴藏着这样的历史。

  基因组的程序告诉你什么?除了告诉你怎么进化来的,告诉你说在一个生活的环境里面,它会怎么去反应。它不会告诉你今天晚上吃什么,但一定会告诉你今天晚上吃了什么你的身体会有什么样的反应。而这样的一套预设的程序给你的生活、给你的未来的生命轨迹增加了一个边界,生活的环境在变化,基因的程序也在变化。

  有时候它是不完美的,因为这种变,必然会有代价。这种变让我们变得更加适应生存的这个环境,但同时它也有出错的时候。当它出错了,就是我们看见的各种各样的疾病。最简单的一种比较严肃的错误,它会发生在你很小的时候,就面临生命的威胁。昨天我参加了世界罕见病学大会,是在深圳召开的,我们前些日子看的那些(为)渐冻人浇冰桶的事实上都是一些罕见疾病。听起来这些罕见病很罕见,但如果把它加起来占到我们整个人群人口的5%左右。这些东西能不能够预防?自然界没有那么聪明,它并不是犯一次错就不再犯了,它经常犯,所以你可以利用这样的错误,不断的去做检测,在很早的时候发现这样的错误并且预防这样的错误。

  在你的生命周期里面,你会经历疾病。为什么会有疾病?你身体里的每一个细胞在不断繁殖,在每一次的繁殖过程当中你的基因都在变化。如果你太阳晒多了你就容易得皮肤癌,如果你在北京的雾霾天待久了你就容易得肺癌,如果你HPV感染,病毒感染你就有可能得宫颈癌。当然还有各种各样的环境因素和风险因素。在这样的环境压力和风险压力下,你的细胞程序发生着变化,这些细胞程序发生变化以后,有些时候虽然获得了它自身的适应性,不断地扩张,但在器官上却形成了肿瘤,这就是我们说的癌症。癌症的这种变化从出生的第一刻就已经开始形成。所以有人说因为你活得越久,身上积累的基因突变越多就越有可能有肿瘤,这种推论是正确的。

  所有人都想改变世界,所有人都想说我想好好把控自己的健康,但是在改变之前,我觉得你们要首先理解这个世界。如果我们真想改变生命本身的运行规则,我真想我自己不要往糖尿病走,走一个健康方向,你首先要理解这件事情。而你的理解在用计算机语言来讲是一件非常有意思的事。我们想象一下如果生命的语言是30亿个碱基字母的简单罗列,而它的程序运行结果是你得了糖尿病,或是我个子高,或者我很愚蠢,所有的这些东西,从那30亿个字母,推断到这样的一个表型,这个之间到底发生了什么?这种程序本身的编译规则和编译原理到底是什么东西?这样的一个公式能怎么撰写,怎么从基因最后变成那样的表现型?

1 2 下一页