首页>新闻事件>事件中心>

“科学大家谈” | 全球著名蛋白质工程学家——张阳

编者按:

他,是蛋白质结构领域“奥林匹克竞赛”——CASP(Critical Assessment of protein Structure Prediction)六连冠得主;他,是英国路透社评选的(15年和16年)“全球高引科学家”获得者;他,是横跨物理、生物、计算机的全球著名蛋白质工程学家;他,是在国际顶级学术期刊发表高水平学术论文百余篇的“高产、高引、高效”科学家;他,是敲得了架子鼓玩得了吉他的爵士乐行家……他便是美国密西根大学计算医学与生物信息系教授张阳。张阳教授早年就读于华中师范大学粒子物理学系,后赴德国、美国从事博士后研究,先后任教于美国堪萨斯大学及密西根大学,日前研究领域主要集中在科学前沿阵地的“蛋白质结构预测”和“蛋白质设计”。高精尖中心有幸对张教授进行了简短的采访,张教授朴素凝练的谈吐、低调内敛的态度以及富有哲理的话语无不给笔者留下了深刻的印象。



访谈实录:


问题1:张教授,我们了解到您的研究领域涉及计算医学、生物信息学、生物化学同时您还是著名的蛋白质工程专家,那么能否请您简单介绍一下您的研究领域与研究成果?

张阳:

我们的研究主要集中在两个方向:一是蛋白质结构预测;另一个是蛋白质设计。其中,蛋白质结构预测是我们一直在做的一个主要方向。我们知道,人体大概有两万条左右的基因,由于选择性剪接和转录后修饰的作用这些基因可以表达成大约100多万种不同的蛋白质。这些蛋白质在体内执行不同的生物学功能,许多与疾病相关的药物设计,最终都落在了如何改善和调节这些蛋白的功能上。因为蛋白质的功能最终是由它们的空间结构决定的,我们很想了解蛋白质在细胞中究竟是如何折叠的,以及它们为什么在不同的细胞环境中都能够折叠成唯一的一种结构。我的实验室主要利用计算机来预测蛋白质的结构,为此我们开发了一些软件,比如I-TASSER和QUARK。我们这个领域有一个叫CASP的奥林匹克比赛,每两年举办一次,目的是测试哪一种算法能够最准确的预测蛋白的结构。在这个比赛中,我们这两个软件过去十年来成绩一直不错,使用的人也非常多,现在已经有130多个国家的生化科学家注册使用这两个软件。2015年我们在Nature Methods发表了一篇论文,是关于结构预测软件I-TASSER的一个总结。这篇文章大概是这个杂志自2015年以来引用最多的一篇论文。


我们研究的第二个方向是利用计算机设计新的蛋白质。按照达尔文的进化论,人体基因以及所表达的蛋白质都是数百万年以来自然进化的结果。随着对蛋白及基因的了解以及计算机技术的发展,我们开始思考,能否用计算机设计出新的具有自然演化所没有的结构和功能的蛋白质?这本身就是一个重要的科学问题,因为它可以帮助我们了解蛋白质折叠以及蛋白相互作用的规律。另一方面,它也可能促使一种新的药物设计和开发途径的出现。目前绝大多数药物都是化合物,在分子层面上讲,蛋白质复杂多变的三维结构可能会比简单化合物提供更多的功能。

张阳 背板1_副本_副本.jpg

另外,我相信蛋白质折叠和蛋白质设计是两个互逆的过程,它们之间应该存在一个统一的原理。我们最近开发出一款新的蛋白质设计软件,试图从自然进化,而不是从常规的物理的角度来处理这个问题。简单来讲,物理力场公式是人发明的,不一定正确,而进化则是向自然学习。我们发现基于进化的方法的确比从物理出发的方法能够更加精确地设计蛋白的折叠结构,这个和我们在蛋白结构预测中的发现不谋而合。此外,我们实验室也在研究蛋白与蛋白之间的相互作用,以及基因突变和癌症之间的关系。但是总体来讲,我们的主要精力是在蛋白质的折叠和设计这两个互逆的过程的研究上。



问题2:您现在作为生物信息学、生物化学等研究领域的国际著名专家,但是,您早期的求学背景似乎是物理学,比如您在华中师范大学读博时的专业是理论物理,后来您是因何对生物学产生兴趣并决心投身于生物学的?

张阳:

从物理转向生物既有偶然的因素也有一个大的趋势。为什么说有一个大趋势呢?我读PHD的时候是在上个世纪,九几年的时候。那时候理论物理研究的进展很慢,如果你打开像Nature、Science这类报道学术前沿研究的杂志,你会发现很少有关于物理学特别是理论物理方面的文章,大部分都是关于生物学的,这实际上在一定程度上反应了生物学的快速发展。当时理论物理可供研究的新课题不多,一旦出现一个新的数据,相关的物理学家都跟上去了。反而,生物学起步时间短未知的东西太多,基本上每隔一段时间都会有新的突破出现,给人一种日新月异的感觉。


偶然的因素是什么呢?我读完PHD后到中科院理论物理研究所做博士后,我当时是打算到郝柏林教授的实验室做博士后,郝柏林老师是一位非常著名,研究工作非常扎实的物理学家。但是在博士后期间,我很偶然地读到了另外一位物理学家欧阳钟灿教授的一篇论文,论文研究的是血液中红细胞膜的形状,这是我生平第一次读到有关生物学的文章,当时很是吃惊。因为这么多年以来,我们学习和做物理的研究都是在处理各种很抽象的对象。比如,现代物理学中有一个很重要的概念——夸克,非常小的基本粒子,没有它理论物理的大厦构建不起来。但是,到目前为止,没有任何人直接看到过夸克。我们只能把电子或者质子加速到很高的能量,让他们进行高能碰撞,通过研究它的末态产物来间接地了解夸克的存在。这种大型高能碰撞实验,往往需要几个国家通力合作才能进行。我此前研究的就是这种和高能碰撞相关的理论物理课题,处理的对象看不见摸不着,非常间接,非常抽象。所以,当我读到欧阳老师这篇文章时,惊讶地发现可以通过简单的实验观测立刻验证理论推导的结果是否正确,关键是还可以清晰的看到研究对象的三维结构。当然,我们现在研究蛋白质,每天都接触各种来自生物实验的序列和结构,我想大部分做生物或者生物物理研究的人应该是习以为常了。但是,在当时,对于一个从本科到研究生一直在做理论物理,跟“间接”“抽象”理论打交道的人,当看到那些具体的、形象的东西后还是很受冲击的,甚至有些震撼,原来科学还可以这么做。所以,我当时就决定转做生物学。欧阳钟灿教授的这篇文章在很大程度上改变了我的科学研究轨迹。



问题3:我们了解到您自1996年至今已发表了150多篇高水平论文,并连续两年(15年和16年)获得路透社评选的“全球高引科学家”;此外,您从06年至今还参加了近百场的学术活动。请问您是如何做到“高产、高引、高效”的?

张阳:

我觉得我还算不上一个高产科学家。每个人都有他自己的工作方法和路径,但是我觉得做科研,最重要的一点是就是要脚踏实地,一步一个脚印!我看到有的实验室,文章做的很漂亮,idea也很fancy,我曾试图去重复,结果却发现重复不了,这样的论文发表以后,我想别人不会记得,更谈不上引用。所以,要想做到“高引”,自己做的工作一定要踏实,经得住检验。我经常跟我的学生讲,做一件事情一定要踏踏实实的去做。一旦你真正做出了好的东西(也不要是多么高大上的东西),那么你不用担心,一定会有人赏识。酒香不怕巷子深就是这个道理,解决一个问题,你花了精力,总会有收获。



问题4:科研数十年,您能不能谈一谈其中的甘苦?

张阳:

说实话我从来不觉得科研是一件很苦的事情,真正让我感到痛苦的反而是突然间无所事事;或者工作没什么效率;或者是目标不明确工作在低水平层面上重复,这几种情况才让我觉得痛苦。做科研,你要是真正做进去了,你会觉得跟读金庸小说或者玩游戏一样,只会觉得时间过得特别快,完全不觉得枯燥和煎熬。特别是当我看到自己做的工作有意义、有成效、有进展的时候,心情会愉悦而充实。



问题5:在您的科研道路上有没有遇到过“没有突破、没有进展、甚至感觉很灰暗”瓶颈期?那个时候,您是如何调整自己的情绪的?有没有让您印象特别深刻的事呢?

张阳:

这是一个很好的问题,这得从我刚开始转向做生物说起。我在美国做博士后的导师是Jeffrey Skolnick教授,他是蛋白质结构领域的一个大家。我刚去他实验室的时候其实对蛋白质是什么东西完全不了解,原来也没做过。导师在看过我在中科院时写的一篇关于计算机搜索引擎算法的论文后,觉得我在这方面有长处。他因此建议我用那个算法把他实验室已有的蛋白质模拟程序的搜索引擎部分做一个改善。这个程序是他和波兰的一个计算生物学家,他们一个团队在一起历经十几年的合作共同建立起来的,所以这个程序又大又长。当时他们实验室的研究生和博士后,一般都是在使用,但是从来没有人仔细去读这个程序的源代码。按照当时导师的建议,我的课题只涉及其中的一小段子程序。我只要把这个子程序熟悉,然后换上我自己的算法,测试一下应该就可以完成任务。但是我在修改那个子程序的过程中,对call一些自己未知的变量和子程序觉得碍手碍脚的,另外也是出于对一个新领域未知算法的兴趣,我于是花了大概半年的时间把这个程序源代码仔细读了一遍,然后把这个搜索引擎很快做了改善。当然这个过程中读别人的程序是很乏味的,但是我觉得很有意义,因为很多没有也不可能包含在论文中的一些关键思想在程序里面都一览无遗。


当时做蛋白质结构预测主要面临两个问题:一是怎么找到模板;二是找到模板后,如何将其优化。特别是模板优化问题,非常复杂。所以当我把这些程序读完并对这个领域的主要问题有一个了解以后,就开始研究这个问题。但是,真正做起来的时候,发现这个问题要比我想象的难得多,大概一年半的时间,我反复试验各种方法,基本上没有哪一种方法work。有时候我晚上睡觉的时候突然想到一个很奇妙的idea,很兴奋,然后兴冲冲的第二天去试,过了几天再看结果,发现并不work,绝大多数的时候发现新的结果往往比已有的方法更差。那时候我刚到美国,买了一辆小的丰田Corolla车,每天开着车从家里到办公室,一个来回是30分钟。早晨起来,晚上回去,来来回回,每天走的路都是一样的,所研究的问题的结果也是一样的,没有任何进展。那个时候觉得日子很灰暗,不知道什么时候有个尽头。这样一个过程持续了大概有一年半,当时我甚至觉得这个问题目前根本就不可能解决。但是,另一方面,从总体上我又坚信解决办法肯定是存在的!自然界中大多数蛋白质都能有一个唯一的结构,因此每个蛋白应该存在一条通往最终结构的折叠途径,只不过是我们人类还没有掌握。可能正是这种信念支持我一直在那儿坚持。


一年半之后也就是第2年开始才有一些进展,在后来的一篇论文中,我们第一次在大标度测试中显示出基于多模板的计算机模拟能够把单个模板拉近(而不是拉离)蛋白的天然结构。这一年半时间,可能就是你说的那种“没有突破、没有进展、甚至感觉很灰暗”的瓶颈期。在那个苦闷过程当中,我并没有预测这种坚持会有什么最后的结果。但是现在回过头来看,那一段时间的努力为后来博士后,以及现在的工作都打下坚实的基础。做蛋白质结构预测有时候就像开发一个完备的流水线工程,每一步都很关键。当时导师有一个很大的实验室,有4-5个博士后在做这一工程的不同部分,比如有些是做模板探测,有些做结构聚类,有些做模型优化,有些做模型选择,他们都写了一些程序,我自己项目部分要用到这些程序。但是我有个特点就是对我没有仔细检测过的程序用起来就不放心,所以,我仔细检查了他们的程序,发现在我看来都有这样或者那样的缺陷,于是就把那些程序一一重写。当你对这些问题的背景及原理熟悉之后,写起来其实挺快的。最后包括那个最长的主程序也用我自己的思路完全重新写了一遍。一方面,由于我对这个过程有系统的认识,我的程序往往都比现有的那些程序好用,结果,那些博士后后来都去作别的课题了。最后第三年基本上剩下我一个人在做这一个导师课题组最大的课题。第二方面,这对我也是一个锻炼,让我能够在后来自己建立实验室以后,对我的项目有一个统一的眼光,因此,似乎比很多别的博士后更有发展后劲。


从这一件事,我的感觉就是,做一件事情,无论一时的挫折,只要你真正付出了努力,最后总是会得到正面的回报。虽然我们的教科书总是这样教导我们,但是一旦你从生活中经历了这个过程,对它的体会会更加深一些。因此,我觉得科研上受挫折并不是一件坏事,反过来讲也是培养了一种后劲,因为做科研,有时候太顺了,特别是做一些浅显的,很容易出成果的研究,对能力的提高不是很大,这样的学生毕业以后也不一定有后劲。所以我说你这个问题为什么提的很好,瓶颈期这个过程是必须要经历的,同时也是一个培养能力、积蓄能量的过程。



问题6:在您看来,应该如何提高科研工作者尤其是博士生的科研兴趣?您有什么好的建议?

张阳:

这个问题我是这样理解的,当然不一定能回答这个问题。我觉得科研的兴趣与人生的经历和态度很相关,对科研有没有兴趣,到了博士这个阶段,就很难有什么根本性的改变。记得我们那个时候,我的很多同学同事都对科学研究有一种比较纯粹的爱好和信念,可能与当时的选择不多也有关。但是现在经济和社会发展很快,各种选择多了。有些学生选择了科学,比如念研究生,但是可能志并不在此。这些研究生有时候会想的很多,他会想这个方向容不容易找工作,将来的经济效益和前途如何,哪些地方有捷径等等,这样的人吧,他很难集中精力做一件事,尤其是遇到挫折的时候,很难坚持下去。所以,我觉得这样学生,与其反复想如何提高他的科研兴趣,倒不如让他去做自己感兴趣的事情。我也目睹过离开科研去社会上碰了壁,然后回到科研静心做研究的例子。


其实,科学家并不是越多越好,我觉得科学研究要有一种纯情和宁拙勿巧的心态,有这样一部分人来做科研,就够了,科学也就是靠这样一部分人来推动的。我回国经常碰到国内的一些PI,抱怨有些博士生留不住;有些博士生、硕士生潜质挺好的,但是不愿意做科研,所以需要他们反复进行说服工作,有时候也会让我帮着他们劝说。我觉得这是一种很不正常的状态,你看那些真正有建树的科学家、那些科学大家,哪些是因为被动接受别人的劝说才投身科研的?所以,我觉得做科研也还是要崇尚信念纯情讲究宁缺毋滥。



问题7:您从事科研的工作当中,有没有一些感悟或者是经验想分享给年轻的科研工作者? 

张阳:

这个有用吗(笑)?那我就说两条吧:首先,不要去追时髦的东西,没有简单的成功。科研是没有捷径的,没有轻轻松松的成功,你必须要脚踏实地!有些年轻科研人员,总是想着赶时髦,一有新的东西出现,就立刻去做什么,不停的跳来跳去,最终很难有大成。有时候很时髦的课题,你看到了别人也会看到,等你匆匆忙忙赶到的时候,往往很多人已经在那儿聚集多时,而且你不一定会比别人做的更好。这个时候不如选一个自己感兴趣和擅长的领域和方向,踏踏实实去做。


其次,对于任何有意义的课题,如果你真正做了努力,你所有的努力都会得到回报。就我自己而言,虽然很多事情都无法预测,但是到目前为止,还从来没有哪一件自己脚踏实地的去做了,最后没得到回报的。包括我原来学物理,我在物理上做的那些训练,其实在我后来做生物时都用上了,所有的训练和知识不会是没用的。相反,那些心气浮躁时候浅尝辄止的事情,往往没有什么结果,既浪费了精力又浪费了时间。



问题8:您在科研之外有什么兴趣爱好?平时不做科研的时候,喜欢做什么?

张阳:

我很喜欢音乐,尤其喜欢爵士。我在很小的时候就喜欢吉他,记得当年我第一次来美国的时候,没带什么东西,但是带了一把红棉吉他。我导师的助理来机场接我的时候,就看到我拿着一个很小的行李包却背着一把吉他,她当时很惊讶。(问:看起来更像个文艺青年吧?)是的。另外,我还喜欢架子鼓,我们密西根大学的几个老师组建了一个乐队,我在其中敲鼓,大家经常一起玩,基本每个周末都High一下,很有意思!我现在也经常去听爵士乐,所以我在上面谈到自己在很灰暗、很徘徊、没有进展的那段时期,我每天都会弹一会儿吉他。我觉得做科研的人有点兴趣爱好比较重要。我从来没有觉得这个耽搁了我的多少科研时间,但是可以让科研生活很有趣。

      

说一个小插曲。收到你的信的时候我正在科罗拉多一个叫做Breckenridge的小镇参加一个关于蛋白质稳定性的国际会议。那天下午会议之余,去了Main Street做了一回街边吉他手(如图)。有路人不停地向地上的帽子里投钱,大概演了一个半小时,挣了一夜的住宿费。后来碰到大会主席,科罗拉多大学的John Carpenter教授和我开玩笑说:“你应该在椅子后面拉一条横幅,上书几个大字‘昔日的科学家,现在的吉他手’,这样你会挣得更多。”旁边一位来自Malvern公司的研究科学家添油加醋道:“在标语下再加上一行小字,‘因NIH资金裁减,大学教授街头卖艺,补贴实验室科研费用’,那就更多了。” 

 


问题9:对未来您有什么计划? 

张阳:

其实我是一个特别不喜欢谈论未来计划的人(笑)。真要说起来,大的目标上,我们想解决的主要问题就是上面提到的,蛋白折叠和蛋白结构预测的问题,当然目前这是一种向往,不一定能做出来。不过,经历了很多年的徘徊,很多年的努力,最近还是有一些比较好的消息,比如,最近发现基于序列的contact-map预测有助于提高从头结构预测的精度;再有现在冷冻电镜技术的突破,也给这一领域带来新的机会,例如可以结合蛋白结构预测算法利用冷镜产生的低分辨率图像产生高精度蛋白结构。第二个计划跟蛋白质设计相关,我真的希望有一天,可以利用计算机设计的蛋白质大分子作为药物,来处理癌症,肥胖等重要的人类疾病。我觉得这在未来应该是可以实现的,只是现在人们对它的了解还很肤浅,毕竟蛋白质的功能要比普通的化合物强大得多。所以,我希望未来在这些方向上,做一些尝试。


中心地址:北京市海淀区清华大学