pandas如何实现,如excel数据透视的的自动分组,按起始,终止值,步长进行分组分类统计

img

如上图,有一个数据库,参数胎次和日龄均为数值型,想用pandas实现excel数据透视中的自动分组,设置起始点和终点以及步长
python小白,会使用groupby,但还不够定制化
希望实现,胎次分组[0,1,2,>3],日龄分组为每隔300,进行分组并进行后续统计(计数、平均值等)

Pandas可以通过使用cut函数实现数据的分组。在使用该函数时,你可以指定起始值、终止值和步长,以自动将数据分组。

例如,假设你有一个名为"data"的数据帧,它包含一个名为"score"的列,你可以使用以下代码将数据分为三个组:

import pandas as pd

# Create the data frame
data = pd.DataFrame({"score": [1, 2, 3, 4, 5, 6, 7, 8, 9, 10]})

# Use the cut function to divide the data into three groups
data["group"] = pd.cut(data["score"], bins=3, labels=["low", "medium", "high"])

这段代码将会创建一个新的"group"列,其中包含数据组的名称。你可以使用Pandas的groupby函数来对分组数据进行统计分析。

例如,你可以使用以下代码来计算每个组中数据的平均值:

# Calculate the mean for each group
data.groupby("group").mean()

输出结果应该是这样的:

        score
group         
low         4
medium      6
high        8

通过使用Pandas的cut和groupby函数,你可以实现Excel中的数据透视表的自动分组和统计功能。

您好,我是有问必答小助手,您的问题已经有小伙伴帮您解答,感谢您对有问必答的支持与关注!
PS:问答VIP年卡 【限时加赠:IT技术图书免费领】,了解详情>>> https://vip.csdn.net/askvip?utm_source=1146287632