Logistic回归数据预处理问题

我在做一个新闻数据集的分类,用Logistic回归模型。(数据集来源:http://archive.ics.uci.edu/ml/datasets/Online+News+Popularity)
这个数据集中的数据类型比较杂,有离散的数据也有连续的,有些范围在1以内,有些可以达到几十万,请问对这样的数据可以采用一些什么样的方法预处理,使之适用于Logistic回归?

可以把跨度大的按照四分位数间距或者中位数,改成分类变量,降低因为方差过大而引起的混杂