目前有11组数据,要做参数拟合,想要得到更多的数据,但甲方也没有。能不能自己仿真制作一些数据呢?如果可以,有什么好的方法?
1、如果是常见的数据类型,比如是地址,ua,人名等,可以直接用faker包进行伪造
2、如果是专业性比较强的数据,建议先简单观察一些数据,然后把现有数据扔进一些比较常见的数据预测模型里面去做预测,用预测的数据来作为仿真数据。
3、业务层面的数据仿真,从业务已知的规律去生成数据,这个就和算法没有关系了
但其实不推荐第2种,因为本身数据拟合就是去找寻尽量满足的数据的数学表达式,你不管用何种方式进行算法层面数据仿真都会对最后的拟合效果进行人为干预
可以使用MATLAB的拟合工具箱
在里面你可以选择各种拟合方式,就算不知道是哪种拟合你也可以在里面点点点,找到一个拟合情况比较好的
模拟数据推荐第三方库 faker: pip install faker
参考文档:faker
这个比较简单,可以使用mock数据,引入后不影响开发,全局配置一个启动模拟数据的开关,里面的数据可以自己随意组合,十分方便前端开发