请问这个问题应该怎么解决

img


每次运行决策树的时候都会出现这个情况想问一下这是什么原因要怎么解决用的是PC软件

试一试这样


import numpy as np
import pandas as pd
from sklearn.tree import DecisionTreeClassifier

y = np.array(list("NYYYYYNYYN"))
print(y)

X = pd.DataFrame({"日志密度": list("ssimimmlms"), "好友密度": list("slmmmlsmss"), "真实头像": list("NYYYYNYYYY")})
X["日志密度"] = X["日志密度"].map({'s': 0, 'm': 1})
X["好友密度"] = X["好友密度"].map({'s': 0, 'm': 1})
X["真实头像"] = X["真实头像"].map({'N': 0, 'Y': 1})

model = DecisionTreeClassifier()
model.fit(X, y)

  • 你可以看下这个问题的回答https://ask.csdn.net/questions/7738959
  • 除此之外, 这篇博客: 从零入门机器学习之基础概念讲解:深入浅出讲解计算机基本概念中的 1.1 PC -> 服务器-> 集群 -> 云 部分也许能够解决你的问题, 你可以仔细阅读以下内容或跳转源博客中阅读:
  • 在这里插入图片描述

    思考:为什么服务器要放到机房里面?
    在这里插入图片描述

    • 思考:什么情况下适合使用集群进行计算?
      • 问题一:服务器配置相近或者强者带动弱者(配置有高有低),为什么?
      • 问题二:如果不考虑数据的传输,集群的运行时间取决于什么?

      大数据与云计算是两个很重要的概念。那么它们的含义又是什么呢?

      大数据负责存储和处理数据,而云提供的是可靠的、容错的、可用的、可伸缩的环境,因此大数据系统能够运转(Hashem et al., 2014)。

      大数据本质上是通过对海量数据进行处理和分析,从而进行模式识别和预测未来。个人认为它和机器学习的目的是相同的,机器学习本质上是大数据的重要工具之一。大数据可以概括为5个V(Sakr & Gaber, 2014),数据量大(Volume)、速度快(Velocity)、多样性(Variety)、Value(价值)、真实性(Veracity)。多样性和多模态学习的目的也是不谋而合的。

      云计算的本质是按需服务、按量付费。本质上是通过虚拟化硬件来实现的,能够为客户节省大量成本。思考:比较好的应用场景是哪些呢?在这些场景下,能够节约哪些成本呢?以下是三种最经典的服务方式:

    1. 基础设施即服务(IaaS),比如阿里云、亚马逊提供的云服务器。
    2. 平台即服务(PaaS),比如Google Colab。
    3. 软件即服务(SaaS),比如飞书(Office Automation系统)。
      在这里插入图片描述
  • 您还可以看一下 李月喜老师的企业微信开发自建内部应用开发篇课程中的 身份验证,PC网站企业微信扫码授权登录小节, 巩固相关知识点