如何在数据库中分辨数据是哪种概率分布?

例如二项分布、正态分布,需要怎么在数据库(有庞大的数据)操作(思路、方法)呢?求详解,写论文

你可以借助工具做分布检验,如minitab, spss, excel

分别假定二项分布、正态分布等,用算法拟合参数,这个过程最好用编程语言,比如python+sklearn完成,而不是数据库。
最后看所有的数据代入拟合后的分布公式,谁的方差最小。