Zoe puede representar seis emociones básicas (felicidad, tristeza, ternura, enojo, temor y neutralidad) que el propio usuario puede configurar o combinar modificando el tono, la velocidad y la profundidad de la voz, generando así una gran variedad de nuevas emociones.
Los ingenieros de Cambridge consideran que Zoe es un avatar de "realismo sin precedentes" y que puede marcar el inicio de una nueva era de interacción entre los ordenadores y el hombre. También aseguran que en el futuro Zoe será capaz de expresar una amplia gama de emociones humanas, pudiendo llegar a actuar como asistente personal digital o incluso a reemplazar a los mensajes de texto actuales. Además, se prevé que los usuarios puedan subir sus propios fotos y grabar su voz. Es muy probable que el programa aparezca en las pantallas de los móviles, ya que ocupa solo 10 Mb.