混合人工智能CLEVR够用吗
为了评估 NSCL,研究人员在CLEVR上进行了测试,这是一个用于视觉问答问题的数据集。CLEVR 提供了一组包含多个实体对象的图像,并对这些对象的内容和关系提出了问题。视觉问答是一个有趣的 AI 挑战,因为它需要处理图像数据和推理。
“视觉问答问题往往难以让神经网络解决的一个原因是它们从根本上是组合性的。我们生活的现实世界是组合复杂的,我们可以通过将不同的对象组合在一起来创建任意场景。如果你想训练一个神经网络来解决这样的系统,解决这样的任务,你可以做到,但它需要大量的数据,”考克斯说。
解决 CLEVR 的纯基于神经网络的方法尝试重新创建尽可能多的场景和组合,并在这些示例上训练他们的网络。即便如此,当 AI 面临边缘情况时,它也可能无法做出响应,这种情况不适合它所训练的示例的上下文。
相比之下,麻省理工学院和 IBM 的人工智能研究人员证明,NSCL 可以在 CLEVR 上实现 99.8% 的准确率,而训练数据要少得多。
“这归结为在问题的正确关节处雕刻。如果问题从根本上是组合问题,如果它从根本上与世界的结构有关,并且具有符号性质,那么如果你用符号处理的框架来解决问题,你可以用更少的数据来解决问题, ”考克斯说。