如图,我有上图那些字段的一张数据表,每条流水单号里面都包含了相应的中类,我的目的是想统计每种中类的组合情况,比如说跟冷藏奶出现在同一张流水单里的频率最高是哪一种中类。
sql应该怎么写(我觉得应该要涉及sql中的循环或者游标语句的写法,但我不太懂,望赐教谢谢)
如果你能用mysq5.7,则可以使用虚拟列,不需要循环和游标。
先给你的表创建一个虚拟列(其实就是索引之类的东西):
alter table 订单
add column a
tinyint(1) generated always as(1) virtual;
然后执行sql得出结果:
select concat(left(count(1)/(select sum(a) from 订单
where 流水单号
in (select 流水单号
from 订单
where 种类
='冷藏奶'))*100,2),'%') as '频率',count(1) as '出现次数',种类
from 订单
where sex in (select sex from 订单
where 种类
='冷藏奶') group by 种类
order by count(1) desc;
in的效率可能比较低,自行优化下。
先理清思路:
1、冷藏奶->流水单号
2、流水单号->获得对应的记录
3、对应的记录->出现次数最多的中类
多次查询的sql如下(一次查询也许也可以)
1、select * from table__name where "中类"=“冷藏奶” //具体的根据表设置替换
根据返回的结果获得recordId
2、select * from table__name where "记录"=recordId
获得一个记录的List<你的bean>
3、遍历List<你的bean>得到出现频率最高的中类
这里纯粹就是List操作了
希望没有理解错你的意思!
select DISTINCT cs1.中类,
(select sum(数量) from testCS cs2 where cs2.中类 = cs1.中类)
from testCS cs1
用cs1的中类为关键字,在testCS中再搜索一遍,利用sum()函数求各列的和