跟踪一个物体的运动是一种常见的人类和机器视觉的挑战。许多连续跟踪算法工作认识到同一个对象静态视频帧,而不是遵循该对象的独特时空轨迹在视频序列。这些策略是成功的,当目标对象展示独特的特性在大多数框架,但失败当目标周围是许多similar-appearing物品。我们引入一个新的跟踪视频序列的挑战,在一个点在多个相似的错误选择点移动,从一个显著的位置。目标是确定相同的点出现显著位置开始结束在另一个标记位置或遵循其他一些轨迹。面临的挑战是认知心理学中使用受到跟踪任务。使用我们的视频数据集,我们系统地评估的深度上优于视觉算法。我们希望我们的小说基准将鼓励发展的神经网络类似人类的跟踪能力,减少依赖低效的视觉策略,如重复识别对象的within-frame featural签名。我们可以设计算法,减少大多数当前神经网络的依赖非常大的数据集学习视觉任务。

(arXiv][网站][代码][数据集][人类的数据收集]

示例任务14错误选择方块。

积极实例2目标方块和14错误选择方格。小填充白色目标广场从一个更大的开放红场的视频,和另一个白色的小广场进入一个更大的开放的蓝色方块的视频。在积极的实例中,目标白色广场从较大的红场之前abritrary轨迹和以更大的蓝色的正方形。开放的广场被标记成红色和蓝色的开始和结束位置分别只出于演示的目的,而不是实际的视频用于实验的一部分。在实际的实验数据集,开放的广场都是灰色的颜色。








-实例与2目标广场和14个错误选择方块。小填充白色目标广场从一个更大的开放红场的视频,和另一个白色的小广场进入一个更大的开放的蓝色方块的视频。在消极的情况下,目标白色广场从较大的红场之前abritrary轨迹和结束在一个随机位置的视频,而另一个目标广场,从另一个随机位置,以更大的蓝色方块的视频。开放的广场被标记成红色和蓝色的开始和结束位置分别只出于演示的目的,而不是实际的视频用于实验的一部分。在实际的实验数据集,开放的广场都是灰色的颜色。