请问支持向量机怎么用来预测宫颈癌,有人能教教吗真的不会,找不到资料
逻辑回归是基于伯努利分布假设的概率模型,通过极大似然估计的假设,输出y=1的概率。逻辑回归也可以看做一个单层神经网络添加sigmoid函数进行分类。
逻辑回归严格来说属于广义线性模型,是非线性模型,但是在没有其他条件下只能对线性可分的数据进行分类。通过对数据进行升维(非线性映射),之后线性可分,可以使逻辑回归进行非线性分类。
逻辑回归是解决工业规模问题最流行的算法。但在工业界很少将连续值作为逻辑回归的模型的特征输入,而是将连续特征离散化为一系列0,1特征交给逻辑回归模型,这样做的优势有:
1、易于模型快速迭代
2、稀疏向量内积乘法运算速度快,计算结果方便存储,容易扩展
3、离散后的特征对异常数据有很强鲁棒性:比如大于30岁是1,300岁还是1
4、简化逻辑回归模型的作用,降低过拟合的风险
优点:
缺点:
支持向量机其实是一个二分类的模型。
这里有一份数据集你可以看一下
http://archive.ics.uci.edu/ml/datasets/Cervical+cancer+%28Risk+Factors%29
像年龄,烟龄这些都可以作为一个样本的特征来处理
在matlab里有一个台湾的团队做了一个不错的关于svm的包Libsvm,你可以看一下