这个数据可以用什么模型啊

img


这个数据可以用什么模型分析啊 我试了多元回归模型但是显示模型无效😭

该回答引用GPT与博主@晓码自在合作编写:

对于你在其他回答中提到的数据,我的建议模型如下:

  1. Logistic回归模型:
  • 把字符串映射为数字编码,与数字数据一起作为特征。
  • 由于数据量不大,Logistic回归是一个简单可行的模型。
  • 可以对字符串长度进行划分,作为类别标签,实现多分类Logistic回归。
  1. 决策树模型:
  • 决策树可以直接对字符串和数字混合的数据建模。
  • 不需要复杂的特征工程,自动学习特征之间的关系。
  • 树的层次结构可以发现字符串与类别之间的复杂映射关系。
  1. 随机森林模型:
  • 随机森林结合多个决策树,可以避免过拟合,提高模型鲁棒性。
  • 可以探索不同决策树之间的投票信息,找到更稳定的预测结果。
  • 随机森林的Out-Of-Bag Estimates可以实现内部验证,评估模型精度。
  1. LSTM神经网络:
  • LSTM网络可以学习字符串之间的时序和长期依赖信息。
  • 多个LSTM单元可以自动学习数据中的高维复杂模式。
  • 需要对字符串进行填充或截断,转化为固定长度的输入。
  • 需要较大的数据量,并且训练代价高,难以解释模型结果。

除神经网络模型外,其他方法较为简单可解释,更加适合你的数据集。我个人推荐尝试Logistic回归与决策树模型。它们易于实现,可以从多个角度探索数据的模式,验证不同想法。

多元线性回归模型:多元线性回归模型是多元回归模型中最基本的模型,它假定因变量与自变量之间存在线性关系
你的数据是需要去分析线性关系吗?如果不是,那可能就不行哦,方向找错了。

多个x对应一个y可以使用多元回归,如果你使用无效,可能是你的使用方法有问题,检查再查找写资料看看。你可以看下波士顿房屋价格预测的这个文章的代码,就是使用到了多元回归。