关于大数据分析想请教怎么做

E题:分析COVID-19疫情发展趋势,提出对策建议,新商业模式,或新产品设计
截至欧洲中部时间2022年7月8日17时33分,全球确诊病例较前一日增加938575例,达到551226298例;死亡病例增加1785例,达到6345595例。当地时间7月10日,根据美国约翰斯·霍普金斯大学(JHU)数据,截至美东时间当天17时20分,美国累计新冠肺炎确诊病例达88593875例,累计死亡1020861例。新冠确诊病例仍在不断增加,对新冠病例发展的预测是疫情防控的重要话题。数据3中包括美国州县的新冠确诊数据,请根据数据3回答以下问题。
问题1:根据数据3中包括美国州县的新冠确诊情况,对不同地区做聚类分析,探讨哪些地方因素会对疫情蔓延产生影响?
问题2:在数据3的基础上,预测未来一段时间各地方的新冠确诊病例增长情况,并对模型预测结果进行评估。
对于这种csv文件的聚类分析咋搞啊想求个代码例子

这个价格估计没有代码

可以推荐一个【算法课题-用聚类算法分析疫情分布特点-软件工程】视频课程学习,链接:https://www.bilibili.com/video/av625304284/
【这个主要是讲解代码,对你帮助理解应该有所帮助】

试试这个呢

数据科学与大数据分析之项目2-聚类_Jifu_M的博客-CSDN博客_聚类项目 聚类项目介绍项目开始项目介绍文件TreeDB.csv包含258个树种的描述。数据由XX市议会开放空间和环境服务部管理处提供。已提供数据集作为公共空间最佳树木选择合作项目的一部分。假设你是该项目团队的一员。进一步假设你决定参与聚类分析是更好地理解数据集属性的一部分。为了这个练习你应该只考虑特征(属性)“高度”、“宽度”、“表面积”和“盐”。描述您对此数据集的观察,例如示例的数量、特征的数量以及这些选定特征的含义。您还应该使用summary()函数来帮助您获得更多的理解。绘制此数据集选定属性的散 https://blog.csdn.net/Jifu_M/article/details/112104404

使用pandas 读取 处理后 使用聚类方法 或自己写一个密度聚类 还是中心点聚类,自己试试哪个能分析出答案了,至于预测,就拟合一下呗

大数据背景下信息系统在COVID-19疫情中的应用浅析
https://hanspub.org/journal/PaperInformation.aspx?paperID=39174