图像标注-图像理解方面-图像多标签

我最近在看tagprop这篇文章《TagProp:Discriminative Metric Learning in Nearest Neighbor Models for Image Auto-Annotation》，看代码，没有弄懂训练和测试的输入和输出是什么？例如在learn 代码中NN ， ND数组是什么，代表的是什么意思？predict中的输入是什么？，而且这个紧邻是如何计算的？基于排序的近邻和基于距离的紧邻是不同的吧？如何找到这些紧邻？
文章连接http://vigir.missouri.edu/~gdesouza/Research/Conference_CDs/IEEE_ICCV_2009/contents/pdf/iccv2009_040.pdf
![![图片说明](https://img-ask.csdn.net/upload/201801/04/1515030920_68495.png)图片说明](https://img-ask.csdn.net/upload/201801/04/1515030912_422812.png)图片说明

字面上说，Nearest Neighbor就是NN，就是紧邻。具体什么意思，你要把文章贴出来啊。