如何使用神经网络来迅速得到数据集中具有代表性的数据标签

现在有一个任务,有三类数据,每类数据有5个维度,不知道每类数据的具体标签,其中还包含一些无效数据(离群点),如何通过神经网络的方式来得到每类数据的一个典型代表?