本发明以辅助视觉障碍人士对外界场景的理解为目的,提供一种基于RGB‐IR相机的声音编码交互系统,该系统通过实时获取两台RGB‐IR相机的RGB彩色图像和IR红外图像,在传统双目视觉的基础上结合红外激光笔,实时获得三维深度信息,再将三维图像转化为声音编码,通过耳机传输给使用者,使视觉障碍人士可以通过听觉感受到场景中的物体分布和方位。