Elasticsearch大数据怎么去重

Elasticsearch大数据下怎么去重？

目前Elasticsearch集群中索引中有7亿条数据，1Tb,字段10个，要求对账号字段进行去重，返回全部的不重复账号。
使用Filnk或者spark全量扫描数据，对于集群压力太大，请问有别的方法吗

管道预处理，reindex一个去重字段为ID的索引