如何统计关键字出现的频数以及概率,不像常见的int,double,char等数据,汉字怎么比较是否相同

8-1 贝叶斯分类算法
有 1 批垃圾邮件含有“点击, 获得, 更多,信息,购买, 最新,产品,获得,优惠,优惠,信息,点击,链接”等词,1批正常邮件含有关键词“明天,一起,开会,信息,详见,邮件,最新,竞品,信息”,一个新邮件内容为:最新, 产品,优惠,点击, 链接 ,请用贝叶斯过滤判断这封邮件是否为垃圾邮件。

img

img

img

img

img

img

img

汉字就是字符串,用字符串的比较方式。

//结果为0,则相等
strcmp(str1,str2);

首先将关键词定义一个字符串数组,然后从email字符串开头进行字符串比较,如果与某个关键词相同,则关键词计数,并且email指针向后移动关键词长度;否则email指针向后移动一个字节(如果是汉字,则移动2个字节)

您好,我是有问必答小助手,您的问题已经有小伙伴帮您解答,感谢您对有问必答的支持与关注!
PS:问答VIP年卡 【限时加赠:IT技术图书免费领】,了解详情>>> https://vip.csdn.net/askvip?utm_source=1146287632