深度学习筛选标签训练

我现在训练我的模型,将数据集分为八类,现在想抽取其中的几类进行训练看看效果



```python
# 导入所需的库  
import numpy as np  
from keras.models import Sequential  
from keras.layers import Dense, Conv2D, MaxPooling2D, Flatten  
from keras.preprocessing.image import ImageDataGenerator  
from keras.optimizers import SGD  
from sklearn.model_selection import train_test_split  
  
# 加载数据集  
train_datagen = ImageDataGenerator(rescale=1./255)  
test_datagen = ImageDataGenerator(rescale=1./255)  
train_generator = train_datagen.flow_from_directory(  
        'train_dir',  
        target_size=(224, 224),  
        batch_size=32,  
        class_mode='categorical')  
test_generator = test_datagen.flow_from_directory(  
        'test_dir',  
        target_size=(224, 224),  
        batch_size=32,  
        class_mode='categorical')  
  
# 定义模型  
model = Sequential()  
model.add(Conv2D(32, (3, 3), activation='relu', input_shape=(224, 224, 3)))  
model.add(MaxPooling2D((2, 2)))  
model.add(Conv2D(64, (3, 3), activation='relu'))  
model.add(MaxPooling2D((2, 2)))  
model.add(Conv2D(64, (3, 3), activation='relu'))  
model.add(Flatten())  
model.add(Dense(64, activation='relu


```

不知道你这个问题是否已经解决, 如果还没有解决的话:
  • 你可以参考下这个问题的回答, 看看是否对你有帮助, 链接: https://ask.csdn.net/questions/7742367
  • 这篇博客你也可以参考下:模型选择,深度学习常用定理,单层感知器实现多元输入一元输出的线性回归问题
  • 除此之外, 这篇博客: 求解驾驶时间和等待时间,复现【城市纯电动汽车快速充电设施的布局选址优化模型研究】论文中的排队模型中的 问题思考 部分也许能够解决你的问题, 你可以仔细阅读以下内容或者直接跳转源博客中阅读:

    排队时间会出现负值?这种情况下,应当如何解释?

  • 您还可以看一下 任大勇老师的数据分析思维及方法课程中的 归集数据指标,数据指标拆解与确定数据维度小节, 巩固相关知识点
  • 以下回答来自chatgpt:

    针对该问题,你可以采用以下策略或思路:

    1. 确定任务和数据集基本信息: 首先需要分析和了解数据集的基本信息,例如有多少个观察组,有哪些特征,特征对应的数据类型是什么以及是否有目标变量等,这些信息有助于我们更好地理解数据集和任务。同时,需要将数据集分为八个类别,这样我们才能在这八个类别中抽取一些类别进行训练并测试它们的效果。

    2. 选择数据集:根据任务需求,在八个类别中选择相对应的数据集,这样可以使训练和测试更加准确。在选择完数据集之后,需要对其进行预处理,包括数据清洗、去重、缺失值填充等。

    3. 处理不均衡的数据:在分类问题中,经常会出现样本不均衡的情况,因此需要采取一些方法来处理。可以对占比较大的类别进行欠采样,对占比较小的类别进行过采样,或者采用集成学习等方法。

    4. 选择合适的评估指标:分类识别任务中,评估分类器的性能一般使用准确率、精确度、召回率、F1-score、AUC、P-R曲线等指标。

    5. 适当降低数据集的维度:如果数据集的维度过高,可能会增加算法的复杂性和运算量,因此需要将数据集的维度降低。但是要注意,降维过程中必然会丢失一些信息,因此需要权衡利弊,选择合适的降维算法和参数。

    6. 参数初始化:在机器学习中,参数初始化是一项重要的操作。要根据具体的算法和任务选择合适的参数初始化方法,以提高算法的效率和准确性。

    7. 异常值和缺省字段的处理:在数据集中,可能会包含一些异常极端的数据或缺省字段。为了避免这些数据影响算法的训练和测试,需要针对性地去除异常值或处理缺省字段。

    以上就是针对该问题可能的解决策略或思路,具体实施时需要结合具体的数据集和算法选择合适的方法和参数。


如果你已经解决了该问题, 非常希望你能够分享一下解决方案, 写成博客, 将相关链接放在评论区, 以帮助更多的人 ^-^