d怎么用C实现鸢尾花分类

能教教我怎么实现吗

顺便能发下成功的源代码吗

都说了用python,C语言没谁有那个心思去搞这种吃力不讨好的事情。或者你自己照着python将源码抠出来实现C语言的。

python实现https://www.cnblogs.com/yszd/p/9167126.html

别的不说,c语言单单读取一张图片的代码都要一大段,各种的图片格式不同连读取的格式也不同,更不用说其他的机器学习算法了。

https://blog.csdn.net/qq_19591937/article/details/106379725,人家都给写好了,记得点赞人家哦,顺带点赞采纳我哦

 

#include <stdio.h>
#include <stdlib.h>
#include <string.h>
#include <math.h>
#include <time.h>
#define NUM 150 //总数据的数量
#define NUM1 50 //测试数据的数量
#define NUM2 100 //训练数据的数量
#define N 4 //特征数据的数量(维数)
#define KN 15//K的最大取值

typedef struct {
	double data;//距离
	char trainlabel;//用于链接训练标签

}Distance;

typedef struct {
	double data[N];//每种花的4个特征数据
	char label; //标签(花的种类)
	char name[20];//存放花的名字
}TestAndTrain;

TestAndTrain test[NUM1];//测试数据结构体数组
TestAndTrain train[NUM2];//训练数据结构体数组
TestAndTrain temp[NUM]; //临时存放数据结构体数组
Distance distance[NUM2];//存放距离结构体数组

void labelABC(char x[], char* p) { //把不同种类花的名字分别转化成 A B C 标签

	if (strcmp(x, "\"setosa\"") == 0)
		*p = 'A';
	else
		if (strcmp(x, "\"versicolor\"") == 0)
			*p = 'B';
		else
			if (strcmp(x, "\"virginica\"") == 0)
				*p = 'C';
}

void makerand(TestAndTrain a[],int n){ //函数功能:打乱存放标签后的结构体数组
	TestAndTrain t;
	int i,n1,n2;
	srand((unsigned int)time(NULL));//获取随机数的种子,百度查下用法
	for(i=0;i<n;i++){
		n1 = (rand() % n);//产生n以内的随机数  n是数组元素个数
		n2 = (rand() % n);
		if(n1 != n2){ //若两随机数不相等 则下标为这两随机数的数组进行交换
			t = a[n1];
			a[n1] = a[n2];
			a[n2] = t;
		}
	}
}

void tempdata(char filename[]){//临时存放数据  用于先存放150个数据后再打乱
	FILE* fp = NULL;
	fp = fopen(filename, "r");
	int i,j;
	for(i=0;i<NUM;i++){
		for(j=0;j<N;j++){
			fscanf(fp ,"%lf ",&temp[i].data[j]);
		}
		fscanf(fp, "%s",temp[i].name);
		labelABC(temp[i].name, &temp[i].label);
	}
	makerand(temp,NUM);//打乱所有数据
	fclose(fp);
	fp = NULL;
}

void loaddata() { //加载数据      分割:测试NUM1组   训练NUM2组
	int i, j, n = 0, m = 0;
	for (i = 0; i < NUM; i++) {
		if (i < NUM1) { //存入测试集
			for (j = 0; j < N; j++) {
				test[n].data[j] = temp[i].data[j]; //存入花的四个特征数据
			}
			test[n].label = temp[i].label;//存入花的标签
			n++;
		}
		else { //剩下的行数存入训练集
			for (j = 0; j < N; j++) {
				train[m].data[j] = temp[i].data[j];//存入花的四个特征数据
			}
			train[m].label = temp[i].label;//存入花的标签
			m++;
		}
	}
	printf("test:\n"); //把分割后的数据都打印出来  便于观察是否已经打乱
	for(i=0;i<NUM1;i++){
		for(j=0;j<N;j++){
			printf("%lf ",test[i].data[j]);
		}
		printf("%c\n",test[i].label);
	}
	printf("\n\ntrain:\n");
	for(i=0;i<NUM2;i++){
		for(j=0;j<N;j++){
			printf("%lf ",train[i].data[j]);
		}
		printf("%c\n",train[i].label);
	}
}

double computedistance(int n1,int n2) { //计算距离
	double sum = 0.0;
	int i;
	for (i = 0; i < N; i++) {
		sum += pow(test[n1].data[i] - train[n2].data[i], 2.0);
	}
	return sqrt(sum);//返回距离
}

char max(int a, int b, int c) { //找出频数最高的 测试数据就属于出现次数最高的
	if(a>b && a>c) return 'A';
	else
		if(b>c && b>a) return 'B';
		else
			if(c>a && c>b) return 'C';
	return '0';	
}

void countlabel(int* sum ,int k, int n) { //统计距离最邻近的k个标签出现的频数
	int i;
	int sumA = 0, sumB = 0, sumC = 0; //sumA sumB sumC 分别统计距离最邻近的三类标签出现的频数
	for (i = 0; i < k; i++) {
		switch (distance[i].trainlabel) { //用Distance结构体指针p来取K个距离最近的标签来进行判断
		case 'A':sumA++; break;
		case 'B':sumB++; break;
		case 'C':sumC++; break;
		}
	}
	if (max(sumA, sumB, sumC) == test[n].label) { //检测距离最近的k个标签与原测试标签是否符合  并统计
		(*sum)++; //统计符合的数量
	}
}

int cmp(const void* a, const void* b) { //快速排序qsort函数的cmp函数(判断函数)
	Distance A = *(Distance*)a;
	Distance B = *(Distance*)b;
	return A.data > B.data ? 1 : -1;
}

int main()
{
	tempdata("iris.txt");//加载临时数据->打乱数据
	loaddata();//加载打乱后的数据并分割
	int i, j;
	int k; //k值
	int sum = 0;//用于统计距离最近的k个标签与原测试标签符合的数量
	printf("\n\nCheck data:\n\n");
	for(k=1;k<=KN;k++){//k值:1--KN  KN是宏定义  请看预处理地方
		for (i = 0; i < NUM1; i++) {
			for (j = 0; j < NUM2; j++) {
				distance[j].data = computedistance(i,j);//把计算好的距离依次存入distance结构体数组中
				distance[j].trainlabel = train[j].label; //以上距离存入的同时也把训练集标签一起存入distance结构体数组中
			}
			qsort(distance, NUM2, sizeof(distance[0]), cmp); //用qsort函数从小到大排序测试数据与每组训练数据的距离
			countlabel(&sum, k, i); //统计距离测试集标签最近的标签出现频数
		}
		printf("K = %d     P = %.1lf%%\n", k,100.0*(sum)/NUM1); //打印每个K值对应的概率
		sum = 0;//每次统计完后都赋值0  便于下一个测试数据统计
	}
	return 0;
}

 

C语言实现KNN算法

步骤:
①读取数据,打乱数据(或者随机读取数据),并把标签(花名)别换成A,B,C
②分割数据(共150组,分50组为测试集,100组为训练集)
③遍历计算每一个测试数据对100个训练数据的距离(用欧几里得距离)
④排序距离,取前K个距离(即距离最近的三个邻居,K值是邻居数)统计三种标签中每种出现的次数,则出现次数最多的标签种类为预测标签的种类。
⑤检查最终每一个预测标签结果与每一个测试集标签的结果是否正确相等,统计相等的数量。
⑥计算正确的概率(预测标签正确的数量/测试集总数),计算每一个K值对应的每一个概率。

特征值的类别数:即花萼长度、花萼宽度、花瓣长度、花瓣宽度。
三种鸢尾花名:setosa、versicolor、virginica。
150组数据集(数据集来源于网络):
在这里插入图片描述在这里插入图片描述在这里插入图片描述在这里插入图片描述在这里插入图片描述

源码:

#include <stdio.h>
#include <stdlib.h>
#include <string.h>
#include <math.h>
#include <time.h>
#define NUM 150 //总数据的数量
#define NUM1 50 //测试数据的数量
#define NUM2 100 //训练数据的数量
#define N 4 //特征数据的数量(维数)
#define KN 15//K的最大取值

typedef struct {
	double data;//距离
	char trainlabel;//用于链接训练标签

}Distance;

typedef struct {
	double data[N];//每种花的4个特征数据
	char label; //标签(花的种类)
	char name[20];//存放花的名字
}TestAndTrain;

TestAndTrain test[NUM1];//测试数据结构体数组
TestAndTrain train[NUM2];//训练数据结构体数组
TestAndTrain temp[NUM]; //临时存放数据结构体数组
Distance distance[NUM2];//存放距离结构体数组

void labelABC(char x[], char* p) { //把不同种类花的名字分别转化成 A B C 标签

	if (strcmp(x, "\"setosa\"") == 0)
		*p = 'A';
	else
		if (strcmp(x, "\"versicolor\"") == 0)
			*p = 'B';
		else
			if (strcmp(x, "\"virginica\"") == 0)
				*p = 'C';
}

void makerand(TestAndTrain a[],int n){ //函数功能:打乱存放标签后的结构体数组
	TestAndTrain t;
	int i,n1,n2;
	srand((unsigned int)time(NULL));//获取随机数的种子,百度查下用法
	for(i=0;i<n;i++){
		n1 = (rand() % n);//产生n以内的随机数  n是数组元素个数
		n2 = (rand() % n);
		if(n1 != n2){ //若两随机数不相等 则下标为这两随机数的数组进行交换
			t = a[n1];
			a[n1] = a[n2];
			a[n2] = t;
		}
	}
}

void tempdata(char filename[]){//临时存放数据  用于先存放150个数据后再打乱
	FILE* fp = NULL;
	fp = fopen(filename, "r");
	int i,j;
	for(i=0;i<NUM;i++){
		for(j=0;j<N;j++){
			fscanf(fp ,"%lf ",&temp[i].data[j]);
		}
		fscanf(fp, "%s",temp[i].name);
		labelABC(temp[i].name, &temp[i].label);
	}
	makerand(temp,NUM);//打乱所有数据
	fclose(fp);
	fp = NULL;
}

void loaddata() { //加载数据      分割:测试NUM1组   训练NUM2组
	int i, j, n = 0, m = 0;
	for (i = 0; i < NUM; i++) {
		if (i < NUM1) { //存入测试集
			for (j = 0; j < N; j++) {
				test[n].data[j] = temp[i].data[j]; //存入花的四个特征数据
			}
			test[n].label = temp[i].label;//存入花的标签
			n++;
		}
		else { //剩下的行数存入训练集
			for (j = 0; j < N; j++) {
				train[m].data[j] = temp[i].data[j];//存入花的四个特征数据
			}
			train[m].label = temp[i].label;//存入花的标签
			m++;
		}
	}
	printf("test:\n"); //把分割后的数据都打印出来  便于观察是否已经打乱
	for(i=0;i<NUM1;i++){
		for(j=0;j<N;j++){
			printf("%lf ",test[i].data[j]);
		}
		printf("%c\n",test[i].label);
	}
	printf("\n\ntrain:\n");
	for(i=0;i<NUM2;i++){
		for(j=0;j<N;j++){
			printf("%lf ",train[i].data[j]);
		}
		printf("%c\n",train[i].label);
	}
}

double computedistance(int n1,int n2) { //计算距离
	double sum = 0.0;
	int i;
	for (i = 0; i < N; i++) {
		sum += pow(test[n1].data[i] - train[n2].data[i], 2.0);
	}
	return sqrt(sum);//返回距离
}

char max(int a, int b, int c) { //找出频数最高的 测试数据就属于出现次数最高的
	if(a>b && a>c) return 'A';
	else
		if(b>c && b>a) return 'B';
		else
			if(c>a && c>b) return 'C';
	return '0';	
}

void countlabel(int* sum ,int k, int n) { //统计距离最邻近的k个标签出现的频数
	int i;
	int sumA = 0, sumB = 0, sumC = 0; //sumA sumB sumC 分别统计距离最邻近的三类标签出现的频数
	for (i = 0; i < k; i++) {
		switch (distance[i].trainlabel) { //用Distance结构体指针p来取K个距离最近的标签来进行判断
		case 'A':sumA++; break;
		case 'B':sumB++; break;
		case 'C':sumC++; break;
		}
	}
	if (max(sumA, sumB, sumC) == test[n].label) { //检测距离最近的k个标签与原测试标签是否符合  并统计
		(*sum)++; //统计符合的数量
	}
}

int cmp(const void* a, const void* b) { //快速排序qsort函数的cmp函数(判断函数)
	Distance A = *(Distance*)a;
	Distance B = *(Distance*)b;
	return A.data > B.data ? 1 : -1;
}

int main()
{
	tempdata("iris.txt");//加载临时数据->打乱数据
	loaddata();//加载打乱后的数据并分割
	int i, j;
	int k; //k值
	int sum = 0;//用于统计距离最近的k个标签与原测试标签符合的数量
	printf("\n\nCheck data:\n\n");
	for(k=1;k<=KN;k++){//k值:1--KN  KN是宏定义  请看预处理地方
		for (i = 0; i < NUM1; i++) {
			for (j = 0; j < NUM2; j++) {
				distance[j].data = computedistance(i,j);//把计算好的距离依次存入distance结构体数组中
				distance[j].trainlabel = train[j].label; //以上距离存入的同时也把训练集标签一起存入distance结构体数组中
			}
			qsort(distance, NUM2, sizeof(distance[0]), cmp); //用qsort函数从小到大排序测试数据与每组训练数据的距离
			countlabel(&sum, k, i); //统计距离测试集标签最近的标签出现频数
		}
		printf("K = %d     P = %.1lf%%\n", k,100.0*(sum)/NUM1); //打印每个K值对应的概率
		sum = 0;//每次统计完后都赋值0  便于下一个测试数据统计
	}
	return 0;
}

C语言实现KNN算法

步骤:
①读取数据,打乱数据(或者随机读取数据),并把标签(花名)别换成A,B,C
②分割数据(共150组,分50组为测试集,100组为训练集)
③遍历计算每一个测试数据对100个训练数据的距离(用欧几里得距离)
④排序距离,取前K个距离(即距离最近的三个邻居,K值是邻居数)统计三种标签中每种出现的次数,则出现次数最多的标签种类为预测标签的种类。
⑤检查最终每一个预测标签结果与每一个测试集标签的结果是否正确相等,统计相等的数量。
⑥计算正确的概率(预测标签正确的数量/测试集总数),计算每一个K值对应的每一个概率。

特征值的类别数:即花萼长度、花萼宽度、花瓣长度、花瓣宽度。
三种鸢尾花名:setosa、versicolor、virginica。

源码:

#include <stdio.h>
#include <stdlib.h>
#include <string.h>
#include <math.h>
#include <time.h>
#define NUM 150 //总数据的数量
#define NUM1 50 //测试数据的数量
#define NUM2 100 //训练数据的数量
#define N 4 //特征数据的数量(维数)
#define KN 15//K的最大取值

typedef struct {
	double data;//距离
	char trainlabel;//用于链接训练标签

}Distance;

typedef struct {
	double data[N];//每种花的4个特征数据
	char label; //标签(花的种类)
	char name[20];//存放花的名字
}TestAndTrain;

TestAndTrain test[NUM1];//测试数据结构体数组
TestAndTrain train[NUM2];//训练数据结构体数组
TestAndTrain temp[NUM]; //临时存放数据结构体数组
Distance distance[NUM2];//存放距离结构体数组

void labelABC(char x[], char* p) { //把不同种类花的名字分别转化成 A B C 标签

	if (strcmp(x, "\"setosa\"") == 0)
		*p = 'A';
	else
		if (strcmp(x, "\"versicolor\"") == 0)
			*p = 'B';
		else
			if (strcmp(x, "\"virginica\"") == 0)
				*p = 'C';
}

void makerand(TestAndTrain a[],int n){ //函数功能:打乱存放标签后的结构体数组
	TestAndTrain t;
	int i,n1,n2;
	srand((unsigned int)time(NULL));//获取随机数的种子,百度查下用法
	for(i=0;i<n;i++){
		n1 = (rand() % n);//产生n以内的随机数  n是数组元素个数
		n2 = (rand() % n);
		if(n1 != n2){ //若两随机数不相等 则下标为这两随机数的数组进行交换
			t = a[n1];
			a[n1] = a[n2];
			a[n2] = t;
		}
	}
}

void tempdata(char filename[]){//临时存放数据  用于先存放150个数据后再打乱
	FILE* fp = NULL;
	fp = fopen(filename, "r");
	int i,j;
	for(i=0;i<NUM;i++){
		for(j=0;j<N;j++){
			fscanf(fp ,"%lf ",&temp[i].data[j]);
		}
		fscanf(fp, "%s",temp[i].name);
		labelABC(temp[i].name, &temp[i].label);
	}
	makerand(temp,NUM);//打乱所有数据
	fclose(fp);
	fp = NULL;
}

void loaddata() { //加载数据      分割:测试NUM1组   训练NUM2组
	int i, j, n = 0, m = 0;
	for (i = 0; i < NUM; i++) {
		if (i < NUM1) { //存入测试集
			for (j = 0; j < N; j++) {
				test[n].data[j] = temp[i].data[j]; //存入花的四个特征数据
			}
			test[n].label = temp[i].label;//存入花的标签
			n++;
		}
		else { //剩下的行数存入训练集
			for (j = 0; j < N; j++) {
				train[m].data[j] = temp[i].data[j];//存入花的四个特征数据
			}
			train[m].label = temp[i].label;//存入花的标签
			m++;
		}
	}
	printf("test:\n"); //把分割后的数据都打印出来  便于观察是否已经打乱
	for(i=0;i<NUM1;i++){
		for(j=0;j<N;j++){
			printf("%lf ",test[i].data[j]);
		}
		printf("%c\n",test[i].label);
	}
	printf("\n\ntrain:\n");
	for(i=0;i<NUM2;i++){
		for(j=0;j<N;j++){
			printf("%lf ",train[i].data[j]);
		}
		printf("%c\n",train[i].label);
	}
}

double computedistance(int n1,int n2) { //计算距离
	double sum = 0.0;
	int i;
	for (i = 0; i < N; i++) {
		sum += pow(test[n1].data[i] - train[n2].data[i], 2.0);
	}
	return sqrt(sum);//返回距离
}

char max(int a, int b, int c) { //找出频数最高的 测试数据就属于出现次数最高的
	if(a>b && a>c) return 'A';
	else
		if(b>c && b>a) return 'B';
		else
			if(c>a && c>b) return 'C';
	return '0';	
}

void countlabel(int* sum ,int k, int n) { //统计距离最邻近的k个标签出现的频数
	int i;
	int sumA = 0, sumB = 0, sumC = 0; //sumA sumB sumC 分别统计距离最邻近的三类标签出现的频数
	for (i = 0; i < k; i++) {
		switch (distance[i].trainlabel) { //用Distance结构体指针p来取K个距离最近的标签来进行判断
		case 'A':sumA++; break;
		case 'B':sumB++; break;
		case 'C':sumC++; break;
		}
	}
	if (max(sumA, sumB, sumC) == test[n].label) { //检测距离最近的k个标签与原测试标签是否符合  并统计
		(*sum)++; //统计符合的数量
	}
}

int cmp(const void* a, const void* b) { //快速排序qsort函数的cmp函数(判断函数)
	Distance A = *(Distance*)a;
	Distance B = *(Distance*)b;
	return A.data > B.data ? 1 : -1;
}

int main()
{
	tempdata("iris.txt");//加载临时数据->打乱数据
	loaddata();//加载打乱后的数据并分割
	int i, j;
	int k; //k值
	int sum = 0;//用于统计距离最近的k个标签与原测试标签符合的数量
	printf("\n\nCheck data:\n\n");
	for(k=1;k<=KN;k++){//k值:1--KN  KN是宏定义  请看预处理地方
		for (i = 0; i < NUM1; i++) {
			for (j = 0; j < NUM2; j++) {
				distance[j].data = computedistance(i,j);//把计算好的距离依次存入distance结构体数组中
				distance[j].trainlabel = train[j].label; //以上距离存入的同时也把训练集标签一起存入distance结构体数组中
			}
			qsort(distance, NUM2, sizeof(distance[0]), cmp); //用qsort函数从小到大排序测试数据与每组训练数据的距离
			countlabel(&sum, k, i); //统计距离测试集标签最近的标签出现频数
		}
		printf("K = %d     P = %.1lf%%\n", k,100.0*(sum)/NUM1); //打印每个K值对应的概率
		sum = 0;//每次统计完后都赋值0  便于下一个测试数据统计
	}
	return 0;
}