试一试这样
import numpy as np
import pandas as pd
from sklearn.tree import DecisionTreeClassifier
y = np.array(list("NYYYYYNYYN"))
print(y)
X = pd.DataFrame({"日志密度": list("ssimimmlms"), "好友密度": list("slmmmlsmss"), "真实头像": list("NYYYYNYYYY")})
X["日志密度"] = X["日志密度"].map({'s': 0, 'm': 1})
X["好友密度"] = X["好友密度"].map({'s': 0, 'm': 1})
X["真实头像"] = X["真实头像"].map({'N': 0, 'Y': 1})
model = DecisionTreeClassifier()
model.fit(X, y)
思考:为什么服务器要放到机房里面?
大数据与云计算是两个很重要的概念。那么它们的含义又是什么呢?
大数据负责存储和处理数据,而云提供的是可靠的、容错的、可用的、可伸缩的环境,因此大数据系统能够运转(Hashem et al., 2014)。
大数据本质上是通过对海量数据进行处理和分析,从而进行模式识别和预测未来。个人认为它和机器学习的目的是相同的,机器学习本质上是大数据的重要工具之一。大数据可以概括为5个V(Sakr & Gaber, 2014),数据量大(Volume)、速度快(Velocity)、多样性(Variety)、Value(价值)、真实性(Veracity)。多样性和多模态学习的目的也是不谋而合的。
云计算的本质是按需服务、按量付费。本质上是通过虚拟化硬件来实现的,能够为客户节省大量成本。思考:比较好的应用场景是哪些呢?在这些场景下,能够节约哪些成本呢?以下是三种最经典的服务方式: