早期人类基于共同背景协调他们的行动和注意。但是以更复杂的方式协调——比如说,在合作时的各种意外情境中,扮演特定角色或者计划一系列的联合行动——要求一种新的合作交流形式。古代类人猿的手势和声音无法完成这种协调工作。它们无法完成的原因,首先是因为这些物种的构造完全是以服务自我为目的的,而这种方式恰恰不能适应朝向联合目标的互相合作。其次是因为它们只在直接调节他者的行为中尝试使用手势和声音,而这无法适应依据外界情境和实体来协调行为和意图的需要,如合作觅食的情境。
托马塞洛(Tomasello,2008)主张并举证说明,独特的人类合作交流的第一种形式是自然的指示手势与手势语,用以帮助他人、告知他们与之相关的情境。指示手势和手势语是人类普适的,甚至讲不同习俗语言的人也可以用它们来进行有效的交流,至少在有一些共同背景的情境下是如此。但是要做到这一点,需要有共同基础的背景,在其中有一套极其丰富而深刻的人际的意图和推理。如果我为你指示了一棵树的方向,或者打手势给你指了一棵树,但没有共同背景的话,你无从推测我试图要向你交流什么或者为何要交流这个。因此指示手势和手势语造成了早期人类社会协调的新问题——不只是在与他人协调行为之中需要,而且在协调意图状态之时也需要——解决这些新的协调问题需要新的思维方式。