人工智能革命: 无标记姿态撷取技术颠覆影片录像

由 TIS Marketing 于 2019年8月9日 发表。

哪些神经回路驱动适应运动行为? 这些行为在神经编码中又如何表现呢? 哈佛大学罗兰研究中心(The Rowland Institute)马蒂斯实验室Mathis Lab研究人员透过脑/行为互动研究,揭示了这些问题的答案。 由马蒂斯Mackenzie Mathis博士所领导的团队「[目的]在于了解神经回路对于适应性运动行为所产生的影响」。 其研究的挑战在于将特定的行为与特定脑部活动相连结。以老鼠作为研究个体,这些科学家们使用The Imaging Source DMK 37BUX287相机进行高速录像,结合实验室自行开发的开源软件工具DeepLabCut所写成的机器学习算法,来追踪老鼠的行为事件及相应其脑部活动。

马蒂斯实验室(Mathis Lab)的研究人员藉由机器学习工具及光遗传学原理,了解神经回路对于适应性运动行为的影响。 照片来源: Cassandra Klos

就本质上,研究人员必须能够精确且全面地追踪老鼠的行为并提供定量数据,来描述动物的动态。 马蒂斯博士表示:「我们想了解动物们如何适应环境,而观察牠们的运动行为是一个很好的开始,以阐释大脑如何达成这些任务。 因此,研究计划的第一步就是在动物学习新任务时对其进行观察。」 其团队借重 DMK 37BUX287所构成的多相机影像追踪系统。他们的研究个体行动相当快速,马蒂斯博士接着表示:「…老鼠能够在大约200毫秒内快速地触及并抓取物体,因此我们必须采用高帧速率且优质分辨率的相机。」

影片录像是有效记录动物行为的一种方法,然而撷取姿态(即多个身体部位的几何构型) ,多年来一直是研究人员的一项难题。 在人体研究领域中,先进的动态捕捉可透过标记来追踪关节和四肢动作。 然而,基于种种因素,运用于研究动物体上,这种方法却不切实际。 也就是说,至今,人们仍然使用手动数字元录像方式来追踪动物行为 (即以人工方式逐帧编码标注影片) - 这种劳力密集的过程往往导致结果不够精确,且额外增加了数百甚或数千小时的研究时间。

近期,DeepLabCut装备两台DMK 37 BUX287相机以捕捉高速录像,并藉由其影像帧数进行无标记3D姿态撷取。 影像来源: Cassandra Klos

为了自动撷取研究个体的姿态,马蒂斯博士团队开发了DeepLabCut: 一套开源软件,由用户自定义身体部位的无标记姿态估算。根据(人体)姿态估计算法DeeperCut,研究人员使用基于深度卷积神经网络(CNN)的算法,专门针对此项任务进行训练。根据《Nature Neuroscience自然神经科学》期刊中所发表的一篇论文,作者表述该团队藉由「调整预训练过的模块运用至新的任务上[....过程经由] 即被称为迁移学习(transfer learning)的现象。」而得以显著地减少所必要的训练数据的数据量。 DeepLabCut编程库具稳健性且高效率,即使是相对少量的图像(约200),「其算法亦能达到极佳的追踪表现。」许多科学家们皆赞誉此软件套件是一项颠覆传统、完全崭新的发展。 马蒂斯实验室也使用了The Imaging Source 的IC Capture并增添The Imaging Source相机应用程序camera control API至GitHub。

DeepLabCut 自动追踪及标记(红、白、蓝点)老鼠的动态。 影像来源: Mackenzie Mathis