初学者做机器学习的大作业,想要做的复杂一些,除了大量调包套用不同的算法,还有什么办法?

我是大二物理专业的学生,在做计算物理课程的大作业。做的是kaggle竞赛的高能物理问题https://www.kaggle.com/c/flavours-of-physics/overview

我们现在通过调用sklearn的包,用好几种算法实现了分类,正确率比较高,也用了分类投票器。但是,我们并没有系统地学过机器学习,因而我们只是在手动地调整这些模型的参数,然后输出正确率随这些参数的变化关系,感觉缺少自己的创造性。请问对于这个问题有什么好的调参数的方法吗?以及,初学者怎样才能在大作业中做一些有创造性的东西?(目前只剩下约2周的时间,而且期末还有很多其它事情)

如果想有一些创新,最好先打好基础。看你在学这门课。那么第一步就是模仿。如果可以随心所欲模仿别人工作写一个类似的,这就算成功了。这里说的模仿不是直接调用,而是自己一层一层搭建一个网络。第二步,有点想法,就去看看别人论文,只看论文文字进行复现工作。这一步达到了,就小有成就。最后要自己创新,那就把前面论文中得方法融会贯通,提出自己的见解,实现并取得好的效果。这三步一步步来,就可以达到自己有所建树和创新的效果

想要有创造性的东西,那你可以研究一下正确率随参数变化的关系图背后的原因,比如这个参数为什么调整了一点对结果影响这么大?比如说k-means的k值大小对结果的影响,k值的选择是需要人工手动确认的还是说你可以做到让模型自动确认大小?你能够研究出来这个背后的原因,把这个原因写上就很加分了,并且你的调参就可以根据原因来调整。

再说说一些模型细节,你们的数据是如何收集的,怎么降噪去噪?分类标签是需要人工制作还是可以实现无监督自动学习?特征如何提取以及怎么确定哪种特征对结果影响最大及其原因?对于一个新的分类错误的数据,怎么样快速调整模型使之正确分类而不影响其他数据?分类结果如何测试正确率?ROC曲线如何,怎么评价模型结果(速度,正确率等等),过拟合怎么解决,解决方式不同导致结果是什么?等等太多了东西能将的了,纵向对比不行就横向对比啊。

然后是分类算法,有没有对比下单一的分类算法,比如逻辑回归,贝叶斯分类,决策树,SVM,KNN,CNN等分类算法结果对比,和你们自己的分类模型对比?对比评价指标是什么,对比结果如何。

所以,不是说调包就没有创造性,掉包只是为了节省时间。

您好,我是有问必答小助手,您的问题已经有小伙伴解答了,您看下是否解决,可以追评进行沟通哦~

如果有您比较满意的答案 / 帮您提供解决思路的答案,可以点击【采纳】按钮,给回答的小伙伴一些鼓励哦~~

ps:问答VIP仅需29元,即可享受5次/月 有问必答服务,了解详情>>>https://vip.csdn.net/askvip?utm_source=1146287632

如果想有一些创新,最好先打好基础。看你在学这门课。那么第一步就是模仿。如果可以随心所欲模仿别人工作写一个类似的,这就算成功了。这里说的模仿不是直接调用,而是自己一层一层搭建一个网络。第二步,有点想法,就去看看别人论文,只看论文文字进行复现工作。这一步达到了,就小有成就。最后要自己创新,那就把前面论文中得方法融会贯通,提出自己的见解,实现并取得好的效果。这三步一步步来,就可以达到自己有所建树和创新的效果。

想要有创造性的东西,那你可以研究一下正确率随参数变化的关系图背后的原因,比如这个参数为什么调整了一点对结果影响这么大?比如说k-means的k值大小对结果的影响,k值的选择是需要人工手动确认的还是说你可以做到让模型自动确认大小?你能够研究出来这个背后的原因,把这个原因写上就很加分了,并且你的调参就可以根据原因来调整。

再说说一些模型细节,你们的数据是如何收集的,怎么降噪去噪?分类标签是需要人工制作还是可以实现无监督自动学习?特征如何提取以及怎么确定哪种特征对结果影响最大及其原因?对于一个新的分类错误的数据,怎么样快速调整模型使之正确分类而不影响其他数据?分类结果如何测试正确率?ROC曲线如何,怎么评价模型结果(速度,正确率等等),过拟合怎么解决,解决方式不同导致结果是什么?等等太多了东西能将的了,纵向对比不行就横向对比啊。

然后是分类算法,有没有对比下单一的分类算法,比如逻辑回归,贝叶斯分类,决策树,SVM,KNN,CNN等分类算法结果对比,和你们自己的分类模型对比?对比评价指标是什么,对比结果如何。

所以,不是说调包就没有创造性,掉包只是为了节省时间。