图像标注-图像理解方面-图像多标签

我最近在看tagprop这篇文章《TagProp:Discriminative Metric Learning in Nearest Neighbor Models for Image Auto-Annotation》,看代码,没有弄懂训练和测试的输入和输出是什么?例如在learn 代码中NN , ND数组是什么,代表的是什么意思?predict中的输入是什么?, 而且这个紧邻是如何计算的?基于排序的近邻和基于距离的紧邻是不同的吧?如何找到这些紧邻?
文章连接http://vigir.missouri.edu/~gdesouza/Research/Conference_CDs/IEEE_ICCV_2009/contents/pdf/iccv2009_040.pdf
![![图片说明](https://img-ask.csdn.net/upload/201801/04/1515030920_68495.png)图片说明](https://img-ask.csdn.net/upload/201801/04/1515030912_422812.png)图片说明
图片说明
图片说明

字面上说,Nearest Neighbor就是NN,就是紧邻。具体什么意思,你要把文章贴出来啊。