马丁·琼斯提前谈论公民科学
设计解释图像的程序是如此复杂,以至于在许多任务中,人类仍然优于机器。为了跟上科学产生的图像潮流,我们需要很多人,这就是公民科学发挥作用的地方。在今年的SpotOn会议上,Martin Jones在演讲之前讲述了让非专业志愿者参与科学和他自己的公民科学项目:蚀刻细胞的必要性。
观察是科学过程的关键部分。多年来,人们一直在努力捕捉单一的科学图像,从通过显微镜(如罗伯特·胡克的跳蚤草图)精心绘制的视图,到天文学中使用的照相底片。这些方法都相当缓慢,让科学家有足够的时间分析和解释每一幅图像。
然而,随着现代成像系统的出现,包括快速的数码相机和探测器、精确的运动控制和对巨大存储库的访问,图像数据的捕获速度在天文学上增长了。这意味着科学家们不再能够在每幅图像上花费大量的时间——事实上,在某些系统中,图像的生成速度如此之快,以至于没有一个人能够希望看到每幅图像,更不用说进行任何有意义的分析了。
在计算机时代,很明显我们应该编写一些软件来分析图像。然而,由于人类能够很容易地理解和解释图像中的含义,我们在历史上长期低估了这项任务的难度。在人工智能的早期,一个用软件构建“视觉系统的重要组成部分”的项目预计足以让一些学生在暑假里忙个不停。这是在1966年——快速前进了半个多世纪,我们仍然没有接近解决这个问题!
事实证明,人类是惊人的。我们可以在眨眼间完成无数的视觉处理任务,以帮助我们理解复杂的视觉场景的方式轻松地组合不同的概念。虽然人工智能的最新进展,特别是所谓的深度学习方法,最终将能够接近人类水平的图像处理技能,但许多任务仍然超出了即使是最大的超级计算机的能力。
公民科学的兴起
由于人类在许多视觉任务中始终优于机器,为了在特定工作中使用正确的工具,在人类处理能力仍然胜过所有其他方法的领域中使用人类处理能力是有意义的。
但是如果你有很多图像,你需要很多人类。协调大量非专业志愿者的工作被称为公民科学或众包。
这种方法在不断增长的科学领域中发挥了巨大的作用。早期的一个项目,银河动物园,来自一支平民科学家大军的众源努力,从望远镜图像中对大量星系的形状进行分类。在这一过程中,市民科学家甚至直接做出了全新的发现,如汉尼的Voorwerp星系和绿豌豆星系。
继Galaxy Zoo获得成功之后,该项目发展成为Zooniverse平台,现在承载了各种公民科学项目,包括我们自己的蚀刻细胞项目,我们要求人们帮助我们在一组电子显微镜图像中准确地找到核膜(核周围的膜)。这些图像是通过树脂中的许多不同细胞逐层拍摄的。
图像的性质意味着功能强大的计算机很难区分不同的结构,而受过少量训练的人能够高精度地识别和跟踪特定的结构。
我们用来捕捉这些图像的电子显微镜是一项技术奇迹,它能够精确地成像细胞之类的物体,可以看到几个纳米级的结构(纳米级是百万分之一毫米——一根头发的直径约为100000纳米)。
即使每个细胞都很小,它也可能被成像成成百上千个图像的序列,每个图像的大小可能是1亿像素。这可能需要许多GB甚至TB的存储空间。成像是自动进行的,把科学的瓶颈牢牢地放在图像分析阶段。我们希望,通过使用人类优越的视觉技能,我们将能够更有效地处理我们的数据,并培训未来几代计算算法,使之达到人类水平的精度。
除了帮助我们处理科学问题外,这类项目也是让公众参与研究的极好方式。我们发现,我们的蚀刻细胞项目的一个意想不到的好处是,一些教师在课堂上使用它作为一种更吸引人的方式来学习细胞。与老化教科书中使细胞看起来像煎蛋的简化线条图不同,学生们能够与真实、原始的科学数据进行交互。这让他们能够洞察研究过程的本质,而不仅仅是在发现后看到经过润色的新闻稿。