如何通过已有数据来预测搬家费用?包括数据清洗等问题

我希望自己编写一个预测或是说计算搬家费用的程序,但是不知道具体该用什么方法实现,希望有思路的大神们可以提供一下援助,万分感谢!

需要用到的数据有:

搬家费用(Y)

搬家距离(X1,这里分为6种情况,处理数据是会用1-6数字代替)

搬运物品及数量(X2,这个数据应该会是一个list,还有要搬运的物品及对应数量)这里有个问题是,该如何处理这个list才能实现这个程序?

是否有电梯(X3,值为Y/N)

是否需要拆装(X4,值为Y/N)

然后Y的值是和这4个变量相关的,我现在如果想做一个程序,通过输入X1, X2, X3, X4的值来预测Y值,应该用什么样的方法呢?

可能会用python或R来解决这个问题,大概知道是个什么逻辑,但是具体该用什么方法不太清楚,希望大家可以提供一些思路,谢谢!

首先你要有足够数量的数据,按照你说的有x1 x2 x3 x4四列,以及标记y
然后可以用sklearn svm拟合
https://blog.csdn.net/fahail/article/details/76666967