XGBoost 的并行化是怎么实现的

请问 XGBoost 的并行化是怎么实现的?

以及 XGBoost 论文里,data 是怎么进行压缩的?

对于缺失值,XGBoost 是怎么处理的?