经产观察
IT资讯
IT产业动态
业界
网站运营
站长资讯
互联网
国际互联网新闻
国内互联网新闻
通信行业
通信设备
通信运营商
消费电子
数码
家电
通信运营商

私立研究院2年产出280篇论文:不做实验只靠算法的新型“科学帝国

作者:habao 来源: 日期:2018-9-8 3:29:33 人气:

  熨斗研究院 (Flatiron Institute) ,在成立不到 2 年的时间里,已经产出了无数分析程序和算法,完成了 280 多篇科学论文

  拜访一家科研中心,往往得从参观明星教授带队的实验室开始,十几个博士后通力合作进行各色实验,场面通常非常混乱。但近日我造访熨斗研究院 (the Flatiron Institute)时,却被直接带进了一间机房。机房里发出的唯一声音,来自嘶嘶作响的中央空调系统。之前我只在电影中看到过“科学计算核心” (scientific-computing core)这样的设施;该部门主任之一尼克·卡列罗 (Nick Carriero) 带我走过一排排服务器,并指着一台空机柜说:“我们还在等量子物理学家们搬进来。”

  熨斗研究院坐落于纽约曼哈顿下城,2017 年 9 月正式开张,专门从事计算机科学——利用算法分析海量科学数据并予以开发应用——的研究工作。近几十年来,大学研究人员收集数字信息的手段已经非常娴熟:来自人类基因组测序的数万亿碱基对,来自数十亿颗恒星的星光测量,都是例子。但由于这些科学家中很少有职业程序员,他们经常得利用外包给研究生编程的既定代码对这些数据进行分析。而熨斗研究院的目标,就是竭力向整个科学界的顶尖研究人员提供“量身定做”的算法,甚至可以从杂乱无章的数据中检测出最为微弱的规律。

  除了身为远近闻名的数学家,西蒙斯同时还是世界上最大的对冲基金之一——文艺复兴科技公司(Renaissance Technologies)的创始人。去年他的年收入是 16 亿美元,位居对冲基金行业榜首。你也许会以为他必须每天去“文艺复兴”上班才能赚到这笔钱,但现年 79 岁的西蒙斯早在 8 年前就从他创办的这家公司退休了。他的巨额收益,来源于手中持有的大量“文艺复兴”股权。“文艺复兴”的交易方法一直都严格对外保密,但他确实与我分享了成功投资的关键:他“从来不临阵修改模型 (never overrode the model) ”。一旦模型给出了操作窗口,他就会恪守交易纪律,亦步亦趋直到既定的窗口出现。

  可以说,熨斗研究院是复刻了西蒙斯在“文艺复兴”就建立起来的架构。在“文艺复兴”,他雇用研究人员分析大量股票和其他金融工具的相关数据,以便检测出以前所看不见的波动规律。正是这些发现,令西蒙斯立于“不败之地”。而在熨斗研究院这家非营利组织,其目标则是将“文艺复兴”的算法分析策略应用于拓宽知识、帮助人类的科研项目。该研究院目前有三大活跃部门——计算生物学,计算天文学和计算量子物理学——并计划增加第四个。

  西蒙斯自己的办公室,在研究院街对面西蒙斯基金会(Simons Foundation)所在大厦的顶楼。他的妻子玛丽莲 (Marilyn) 经营着基金会包括研究院在内的业务部门,办公室在楼下两层。西蒙斯吸烟从不间断,即使在封闭的会议室里也是如此。他还表示,不论抽烟最终的代价是什么,他都愿意去承担。

  在办公室的一面墙上,挂着一张装裱起来的陈-西蒙斯规范 (Chern-Simons theory) 的答辩幻灯片。他在三十出头的时候和著名数学家陈省身 (Shiing-Shen Chern) 合作创立了这一。这一捕捉了三维空间的细微特性,后来作为微分拓扑学的基础性理论,成为弦理论,量子计算和凝聚态物理学的基石。“必须指出的是,我从来都没想过会有这些应用,”西蒙斯表示,“我只做数学,而他们研究物理。”

  高等数学是属于年轻人的游戏——从业者往往会在 40 岁之前做出最重要的贡献——但年事已高的西蒙斯依然孜孜不倦地做着数学研究。2003 年他儿子 Nick 在巴厘岛溺亡后(西蒙斯在 1996 年在一次自行车事故中失去了另一个儿子 Paul),六十岁的他再次回到了数学当中。西蒙斯说:“一旦开始认真思考数学问题,你就会沉浸在自己的世界里。”

  西蒙斯后来在拓扑学上发表了一篇被广泛引用的论文“常微分上同调的化表征 (Axiomatic Characterization of Ordinary Differential Cohomology)”。他还向我介绍了他手头的一个课题:“问题在于,六维上是否存在着复杂结构?这是一个非常棒的问题,也是一个非常古老的问题,而且没有人知道答案。”玛丽莲曾告诉我,每当她的丈夫眼神开始磨下颌的时候,就知道他正在考虑数学问题了。

  我们讨论的话题转向了熨斗研究院。西蒙斯认为,“文艺复兴”成功的核心,就在于其先进的计算机架构;在大学里,编程写码往往是一个很不稳定的过程。外包处理这些编程工作的研究生和博士后当中,“有些人写得一手好代码,而其他人则能力欠佳。而当这批人毕业离开之后,就没有人去之前写出的程序了。”为了研究院的正常运转,他聘请了两位学术界顶尖的程序员:带我游览机房的卡列罗是从耶鲁招来的,在校期间就曾为生命科学系开发出高性能的计算能力;而伊恩·菲斯克(Ian Fisk) 曾在郊外的欧洲核子研究组织 (CERN) 工作。西蒙斯给了他们极高的权限和更高的酬薪,“他们是精英中的精英”。

  对于我们大多数人而言,这可能只是不起眼的后台运作,但这恰恰是西蒙斯所极力重视的,且与研究院独特的计算重点息息相关。熨斗研究院不会开展任何新的实验;在此工作的大多数研究人员与大学合作,从一线实验室——那些装备着培养皿、高压灭菌器和基因过的小白鼠的设施——当中采集新的数据。该研究院的算法和计算机模型,旨在帮助研究人员发现已采集数据中所隐含的信息:从时空扭曲的程度推断未发现新的;从染色体看似无用的部分中识别与突变有关的基因链。因此,研究院内部看起来并不像一个实验室,而更像一间普普通通的办公室:穿着随意的人整天坐在办公桌前,在高高的天花板下死死盯着屏幕。

  西蒙斯麾下拥有可媲美中等规模研究型大学计算机中心的数据处理能力,相当于六千台高端笔记本电脑的运算量总和。这虽然很强大,但并非可以四处夸耀的资本。正如卡列罗所承认的那样,它“并不能与亚马逊或谷歌全公司的资源相提并论”。不过,由于熨斗研究院的人员编制小得多,每个研究人员都可以随时调用巨大的计算能力。卡列罗表示,通过向科学家提供最顶尖的“算法指导”和“软件指导”,可以帮助他们专注于推动尖端科学的研究与发展。

  在“既然算法可以帮我发家致富,那也可以帮我征服基础科学”这个点子上,西蒙斯决定做一场豪赌。在过去两年中他雇了 91 名研究员,预计还将雇用逾二百名,使熨斗研究院可以与普林斯顿高等研究院 (Institute for Advanced Study) 相匹敌。他并不担心成本:“我原本以为每年要花7500 万,但现在我觉得预算还可以扩大到8000 万左右。”

  鉴于《福布斯》估算西蒙斯的净资产为185 亿美元,在财务方面支持熨斗研究院对西蒙斯来说小事一桩。 “文艺复兴给我带来过很多乐趣,”他告诉我, “研究院现在也很赞。”

  熨斗研究院是近来私人资助科学研究大潮中的一个显著案例。在美国,基础科学研究传统而言是由大学或来埋单的,但私立机构往往动作更快,投入更集中,当下的市场上又钱多得没处去。自从上世纪 90 年代硅谷开始“批量生产”亿万富翁以来,私立研究机构就在美国各地不断涌现出来。1997 年,甲骨文联合创始人拉里·埃里森(Larry Ellison)在湾区创立了埃里森医学基金会(Ellison Medical Foundation),研究抗衰老领域的生物学研究。六年后,微软联合创始人保罗·艾伦(Paul Allen)在西雅图创立了艾伦脑科学研究所(Allen Institute for Brain Science)。2010 年,谷歌执行董事长埃里克·施密特(Eric Schmidt)在帕洛阿托创立了施密特海洋研究所(Schmidt Ocean Institute)。

  这些研究所在相应领域取得了长足的发展,部分要归功于他们为研究者提供了替代品,摆脱日趋的科研系统:艾伦研究所帮助改变了神经科学的研究形式,通过采用自动化显微镜等先进工具加快了实验的速度。但私人基金会也有弊端;富有的金主们不可避免地会根据他们个人的偏好为特定课题投入重金。

  依照美国税制,基金会可以免除赋税,所以支持科研的私人资金,大部分原本应该进到的口袋里;而这些为研究课题捐助重金的富翁们,只需要于自己。私立研究机构的董事会人选往往由创始人亲自甄选,以确保创始人夙愿的持续推进,甚至在创始人过世后仍矢志不渝。斯坦福大学学教授、慈善专家罗布·赖克(Rob Reich)告诉我:“私人基金会是一种柏拉图式的架构,无处追责,运作不透明,以捐助者个人意志为导向,且享受巨额的税收补贴。这样一种机构组织形式在一个社会当中受到推崇,可以说是一大奇观了。”

  据《福布斯》,西蒙斯在美国财富排行榜上名列第 25 位,轻而易举就可以成为该国基础科学领域最大的私人出资方。他通过所谓的“国内非营利办公室”向熨斗研究院注资,而这个办公室有近 30 亿美元的可支配资金。在百慕大他还拥有一个更大的慈善实体,西蒙斯基金会(国际)(Simons Foundation International)。调查显示,西蒙斯基金会(国际)总计有约 80 亿美元资产,其中没有一分钱曾被征税。而这个庞大境外实体的出处也很神奇:上个世纪 70 年代末,就在西蒙斯创立“文艺复兴”前,他父母的一位朋友为他设立了该信托,并在其中注资十万美元。言及这份“大礼”,西蒙斯耸耸肩:“他当时很喜欢我。”

  南大学的教授兼税收政策专家爱德华·麦卡弗里(Edward McCaffery)在一封电子邮件中表示:“像西蒙斯,比尔·盖茨和巴菲特这样的党人,最终可能会把他们的全部或大部分财富捐给他们选择的慈善机构,但他们和他们的家庭仍然享受着巨大的,而所承担的赋税却很少。他们的慈善事业反映了他们个人的价值观,但并不一定会对普通纳税人有所帮助。”对 80 亿美元资产征收的税金,足以让建立很多所学校。

  西蒙斯对自己赚到的钱的反思,远超过他对避税的认识:“我认为美国当下的财富分配已经过度扭曲了,我觉得如果差距不是那么离谱,情况可能会好些。”不过,这种分配不均也有它积极的一面。西蒙斯说:“我是这一切的既得利益者,但对于慈善事业和科学研究而言,我认为这是一件非常好的事情;很简单,[因为手中更多的财富]我们可以去做其他人不能做的事情。当初所有的科学发展都是通过慈善事业来支持的。伽利略当年就有他的金主啊。”

  那是 7 月的一天,熨斗研究院的科学家们正在向他陈述进度报告。展示会在一个小型会议室里一组接一组地举行,西蒙斯坐在位子上,不吝赞美与之词,烟抽起来也是一根接一根。三位天文学家详细介绍了他们最近在,引力波和矮星系方面的工作。

  在得知天文学家们无法确认他们最复杂的模型是否准确时,西蒙斯很惊讶。解决同一个迷宫般等式的两个计算机程序,结果却给出两个完全不同的答案。他提出了:“好吧,既然本来采用的就是同样的物理原理,代码在执行时也应该遵从同样的物理定律,那它就不应该因程序而改变的呀!”虽然西蒙斯对于编程有着浓厚的兴趣,但他自己并非程序员。他用算法的逻辑形式去思考,但仅限于在白板上。

  “理想状态下确实是这样,”其中一位天文学家解释道,“但实际情况并非如此。”另一位科学家进一步指出:“底层算法都在不断地试图简化问题。我们永远没办出这些基本方程式——我们只能不断得出他们的估值。而不同的算法就会得出不同的估值。”在理想化的数学世界教育下成长起来的西蒙斯,明显有些懊恼。

  天文学家鱼贯而出,生物学家鱼贯而入。来自俄罗斯的遗传学家和计算机科学家 Olga Troyanskaya,同时也是普林斯顿大学的教授,向西蒙斯称述她开发的一套算法,可以预测特定细胞内特定突变的影响。她希望该方案最终能够提供针对特定患者 DNA 进行医学治疗的可能性。

  接下来开口的是 Dimitri Chklovskii,是西蒙斯从霍华德休斯医学研究所(Howard Hughes Medical Institute)招募来研究神经元网络(connectomes)的神家。他陈述了对意大利小蜂的神经元网络的绘制工作。对这种简单的研究,可以帮助人类大脑如何进行演算的复杂问题。

  应用数学家 Alex Barnett 讨论了该小组开发的用于分析神经元过程的几个程序。其中最有前途的一个是 MountainSort。该程序可以告诉你,在一只小白鼠移动之前,它究竟是在考虑向左转还是向右转。程序中使用的算法,也许可以帮助解析大脑究竟是如何控制行为的。熨斗研究院已经将该程序免费提供给其他实验室。(得克萨斯大学神经工程系的 Chong Xie 表示,MountainSort 是“迄今为止我们测试过的最好的波形分类工具”,数据分析的速度提高达百倍)

  熨斗研究院组织陈述的一大意义,就是尽快推进并发布诸如 MountainSort 这样的编程项目。论文完成数同样在迅速增加:在成立不到 2 年的时间里,熨斗研究院的科学家们目前已撰写或合著了超过 280 篇学术论文。“他们可是相当忙碌的一群人!”西蒙斯在电子邮件中如是说。

  玛丽莲告诉我,她的丈夫就是一个“信息处理器”,并称“不管是什么,他都来者不拒。”西蒙斯坦陈,比起生物学他更倾向于讨论天文学,起码天文学家的称述于他而言更容易理解与消化,但他似乎在两个领域都能自如地进行深入讨论。很显然,西蒙斯对应用面的偏好远超理论,而那些看似过分细致的交流则让他最为兴奋。

  根据西蒙斯的说法,他的治理方略就是聘用出类拔萃的,极富动力的人,然后放手让他们去做:“科学家不喜欢被命令做这个做那个。”西蒙斯穷尽其职业生涯磨练出一套特定的“算法”:如何用既让人感到愉快又能激励创造性的方式管理一群才华横溢的研究者。“我喜欢招人,我的管理风格一向以发现优秀人才,并让他们‘负重‘’奔跑见长。”

  在“文艺复兴”他会调试和完善不计其数的交易算法,而在熨斗研究院,他有时也会提出实质性的。Olga Troyanskaya 刚研究基因和孤独症症状之间的关联时,西蒙斯提出了对她正在开发的算法做出一项调整,以帮助它更高效地绘制信息,而且最终奏效了。Troyanskaya 提出要把他列为论文的联席作者,但是西蒙斯更喜欢待在灯火阑珊处。他礼貌地回绝了邀请。

  20 世纪 90 年代,吉姆和玛丽莲·西蒙斯设立了西蒙斯基金会,总价值达 25 亿美元。当西蒙斯从“文艺复兴”退休时,他当时已经很满足了,并不需要去找一份新的工作;但他确实想提高基金会在科学界的影响力。

  2012 年,他和玛丽莲在纽约州召开了一次非正式会议。这是西蒙斯的一种技巧:听取消息灵通者的,然后通过自己的直觉做出决定。“在科学上的品味非常重要,”西蒙斯强调,“能够区分什么是好问题,什么是大家压根不会关心答案的问题——这就是品位。我觉得我算是有很好的品味了。”

  西蒙斯作为知识的声誉,确保他的会上都是世界顶尖的科学头脑。“在我们眼里他并不是‘那个亿万富翁’,”一位参会人如是说,“他在数学界本来就是个传奇人物。”主持会议的是诺贝尔得主,理工学院前校长大卫·巴尔的摩(David Baltimore)。著名遗传学家埃里克·兰德(Eric Lander),和许多物理学家、数学家、生物学家和天文学家一道出席了会议。

  对于一些来说,这次提供了一个机会,将野心勃勃的新项目展示给一位潜在的资助者。这同样可以视作是科学界的一次“追根溯源”;在二战爆发前的几年里,像曼哈顿的洛克菲勒大学 (Rockefeller University) 和由班贝格百货公司 (Bambergers department store) 继承人资助的普林斯顿高等研究院 (Institute for Advanced Study)这样的私立机构一度非常兴盛。但到了 50 年代,美国国立卫生研究院 (NIH),国家科学基金会 (NSF) 和其他组织却成了美国绝大多数科学研究经费的来源。半个世纪以来,一直都是主要的科研出资者,但经过世纪之交,联邦科研经费逐渐减少,以硅谷亿万富豪为代表的慈善事业正卷土重来。2015 年,私人资金(包括企业捐款)自二战以来首次在基础科学研究中成为主要资金来源。

  国家科学基金会等资助机构,往往倾向于为增量研究 (incremental research) 提供资金。有着持续成就记录的科研者会更具优势;具有博士学位并首次从国立卫生研究院获得经费的科学家平均年龄是 43 岁。而风险较大的创新性项目通常会被机构回避。在西蒙斯的私人上,则被鼓励提出那些并不会“立竿见影”的项目。

  一位出席会议的学者,杜克大学数学教授英格丽·多贝西(Ingrid Daubechies),甚至计算了西蒙斯可能会觉得什么类型的项目最吸引人。她知晓西蒙斯的发家之,也知道科学界产生的数据量已经是天文数字。多贝西在会议上,也许基金会不应该资助全新的研究,而应竭力提供更好的工具机制,帮助科学家去理解目前已有的大量研究数据。一个新的研究中心,可以帮助“人们找到有趣的数据集并建设比现在好得多的分析架构,而又不会过于复杂以至于无解”。

  西蒙斯自己也清楚,科学家们正在被数据淹没。不论是光遗传学,还是红外成像、引力波探测装置和射电望远镜,都会源源不断地从生物体和中收集大量的数据流。研究人员经常在一次实验中获得数百 TB 的数据。多贝西表示,尽管在数据搜集上有这样性的进展,在如何完善数据计算分析方法上我们仍投入甚少。

  她的提议引起了西蒙斯的共鸣。“我越想越想越喜欢,而玛丽莲也喜欢它。” 多贝西曾经提出将新研发中心建在杜克大学,但西蒙斯夫妇有个不同的想法:就把中心设在位于曼哈顿的基金会总部旁边。

  西蒙斯希望熨斗研究院能够拥有贝尔实验室 (Bell Labs) 的广阔创意氛围。由通信巨头贝尔创立的这个传奇实验室,其鼎盛时期从上世纪 40 年代中期一直延续到 80 年代。研究人员在那里肆意追逐他们的热情与梦想,而则是八个诺贝尔和晶体管的关键发明。

  在创建“文艺复兴”时,西蒙斯首先确保的一点是,即便有着巨大的压力,他的公司仍然应该是一个令人愉悦鼓励员工自发探究的工作,并提供频繁的学术和外出团建。彼得·布朗,“文艺复兴”的现任 CEO 回忆道:“为吉姆[西蒙斯]工作,你会有一种‘我最好能产出点什么’的紧迫感,因为与他竭力帮你排除万难相比,你会连一条借口都找不到。”

  分享是“文艺复兴”文化的重要组成部分。西蒙斯希望信息也能畅通无阻地在熨斗研究院的这些团体内流动,因此在走廊、咖啡机、休息室等公共区域总是设置着很多黑板,随时可以供研究员“坐下来闲谈”,“为特定领域比如恒星分类设计更好的波形排序算法,就是在这样的下得到突破的。” 6 月的一天,我就曾过一块这样的黑板,写满了天文学部门负责卫·斯佩格尔(David Spergel)的方程式。它所的爆炸驱动银河风的形式,也同样能够用于阐述海洋波浪的运动形式,或者进一步联想到细胞内部的流体运动。

  熨斗研究院的研究人员不必教书讲课,也不需要申请经费,而这两项恰恰会消耗大部分学者的时间。几乎所有研究院的高级雇员都来自大学,而这些大学大部分都在纽约附近,这引起了一些不满情绪。

  熨斗研究院天文学部门负责人斯佩格尔说:“人们认为我们坐拥如此多的资源,称霸整个世界。”在一封电子邮件中,一位竞争对手向斯佩格尔抱怨熨斗研究院是“一只 1000 磅的大猩猩”,并称他最近试图招募的人选,几乎人人都有“你们发出的聘书”。另一位研究人员指出,尽管计算科学非常强大,它依然依赖于熨斗研究院所不资助的实验科学。这位研究员在电子邮件中指出:“计算预测的结果好坏,至多也只能和已经生成的实验数据质量一样好。”

  西蒙斯愿意比最精英的学术机构投入更多的钱,让很多人感到不安。负责运营学院院慈善和公益事业论坛的雷·马多夫 (Ray Madoff) 说:“这了很多人的质疑,即富人总是按照自己制订的规则行事。有钱人,而我们只能眼睁睁在他们的世界里做个过客。”

  不久之前,私人基金会还只能通过法案来设立,其中部分原因就是因为很多人认为这些机构对制度有害。乌鲁斯·西贾克(Uros Seljak),大学伯克利分校天文和物理系主任说,私人基金会可能会反复无常:“是的,他们当然有很多钱,他们可以投入很多钱,但他们也随时可以撤资,把钱投在别的地方。”

  汤姆·伊塞尔(Tom Insel)领导国家心理健康研究所 (NIMH) 已逾十年,则表达了另一种的担忧:“我担心吉姆·西蒙斯的将使我们其他人坐享其成。我们是否会因此觉得科学可以作为一种私人行为得到资助,却把我们用纳税人的钱来换取科学进步的承诺抛到了脑后?我们是否会因此忘记科学研究是一种投资,而不是成本?“

  西蒙斯基金会已经将数亿美元的资金投入自闭症研究——仅今年就投入了 7500 万美元。西蒙斯家族有一名正自闭症之苦,这并非巧合。尽管自闭症研究同样非常重要,但谁又能这数百万美元投入在另一种病症的研究上不会更好?要是另一种病症更接近实质性突破,或是能帮助更多的病人减轻痛苦甚至彻底治愈呢?西蒙斯并不这么想;他相信自己对科学的品味,“我们真的改变了医疗研究领域的面貌”。西蒙斯指出,他所资助的一些研究项目“已经通过运用数学方法,寻找以前从未见过的新基因”。

  秋天的一个下午,研究院三大部门的负责人与西蒙斯一道,坐在他办公室附近的一张会议桌旁,讨论增设第四大部门的问题。西蒙斯希望他的“左膀右臂”们畅所欲言。一位部门负责人进军计算流行病学 (computational epidemiology) 和公共健康领域,但是遭到了其他主管的反对。

  第二种可能性是计算神经科学 (computational neuroscience),但西蒙斯仍心存怀疑。“神经科学是一个非常庞大的领域,我不知道我们是否可以在这个领域做出什么重要的突破性。‘大脑如何运作’与‘如何形成’一样,是一个亘古难题。”于是这条也被搁置到一边。

  接下来是地球科学 (geosciences)。西蒙斯兴奋了起来。他对这个领域亟需解决的复杂问题很感兴趣。其他几位主管说,已经有数千名研究人员在研究气候变化问题了。西蒙斯还是己见。撇常的亲和力不谈,他手中确实握着具有决定性的一票。

  会议结束后,西蒙斯表示希望在 2018 年 9 月之前建立第四大部门。我不禁问他:为什么到那里就停止呢?为什么不建八个部门?为什么不建一个西蒙斯大学?毕竟他有的是钱啊。但西蒙斯认为,如果他想要一流的和协作的氛围,他自己只能忙得过来四个部门。他补充道,他得通过自己的“指点”管理这一切,目前而言这是必须的。

  西蒙斯明白,不管他设立的研究院结构如何,最终都得在没有他的监督的情况下运作良好。基金会已经为研究院的大楼上签下了长达 35 年的租约,条款中还可以再续签 15 年。只要税法没有发生什么戏剧性的变化,西蒙斯的财富足以让熨斗研究院永久性地开下去。测试你的前世今生

  文章由325棋牌提供发布

推荐文章