David Keyes是Mathematical and Computer Sciences and Engineering Division的dean,讲的是关于高性能计算(HPC)的东西,貌似在这个领域里面他算是大牛了吧。
具体的讲座上没有讲特别深的东西,先讲了一些关于学校里的那个BlueGene的一些东西,然后讲了很多关于HPC的概念性的东西,但都是重点。。。大概的内容听的差不多,不过计算机结构方面的知识欠缺太多了,所以对于有些数字、单位和缩写脑子里没有很深的概念。他讲了很多高性能计算在很多领域里的应用,在他举的很多例子中高的计算性能对于计算结果的精确有很大影响,比如地球物理方面去研究气候得到的图像的分辨率在不同计算性能上给出的结果差了好多。还有就是生物学方面的问题(主要是MD,DM方面的)也是高性能计算里面要解决的。
其实计算机模拟这些年越来越多的出现在各个领域里面,计算机模拟的好处不用我说了,这个也是各个领域里面学科发展的必然。在计算机模拟方面,应用到复杂问题的时候,比如生物学,一个是很多细节的东西并不是很明了,另外一个是问题本身的多维度多尺度导致了计算消耗非常大。如果屈就于低的计算性能,得到的结果不一定会精确,有时候对于整个结果的预测和结论的得出有很大的影响;但是如果有高的计算性能,没有好的模型和理论知识,也不会有好的结果(所谓的garbage in, garbage out.),所以现在很多生物学领域里面的Biomics得到了大量的data,实际上这些data一方面是给出的有用的information太少了,一方面是量太大了(可以说是性价比极低)。上面这种算是data-driven的研究,还有一种是mechanism-driven的研究,这个方面并不像物理化学领域在这个方面那么成熟,现在化学方面的计算机模拟可以说非常非常有用了。生物学领域里面,除了可以模拟分子动力学来模拟蛋白的fluctuations(这个是原子水平上)和简单的蛋白跟蛋白之间的反应(目前能得到的结果的时间尺度还是非常小的),就连protein folding也有些困难。当你深入挖掘的时候,你才知道如果不到达nano水平来解释分子水平甚至细胞水平的行为的话,是没办法知道很详细的机制的,当然现在有很多人在做结构生物学,得到了大量的蛋白结构,同时也有大部分计算生物学的人在做MD的研究,但是从nano level回到大分子水平,甚至到很多大分子之间的反应的时候,这种多尺度上的整合其实是个很大问题,因为从原子水平到分子水平再到细胞水平上,中间跨了好几个数量级(估计十个或十个以上吧)。可能有些人没有什么概念,假如你用一个自己的PC来跑程序,花了两天去模拟两个蛋白之间的反应(从计算每个原子的运动来得到整个蛋白的运动)可能也只能得到微秒级别的反应情况,这个估计也就是两个蛋白质的结构域转了个位置,而实际情况中这种动态行为每秒中都有成千上万个,更不用说在整个细胞水平上有成千上万个大分子在同时进行diffusion和interaction了。现在有很多文章关于corse-graining方法来减少复杂性,但是估计也最多是减少四五个数量级,再减模型就很难保证精确性了吧。所以高性能计算这时候就非常重要了,但是也是奢侈品啊。抛开这些不说,光这些机制我们不知道的还有很多很多,一个蛋白的结构需要四到五年的时间解析出来,现在可能可以缩短到两三年,等功能和机制研究清楚了也要五六年以后,几千个实验室也就才几千个蛋白,这啥时候能到头啊~~~所以说更多的理论和技术还需要挖掘和发展(我个人很看好荧光技术和计算技术的发展)。
在讲座上,他讲到的一个点我非常赞同,他把KAUST的logo中的四片叶子解释为Theory, Experiments, Data, Simulation。这个也是很多领域里面研究的主要的内容和方法,在生物學裡面也是開始試圖將這些方面整合起來的時候了。
作为一个钢丝,我引用一句话“振兴相声不是一两个人的事情,是全世界说相声的一起努力的事情”,囧