离差标准化出错invalid non-printable character U+00A0
3、小数定标标准化
消除单位影响
基本公式为:
其中j=lg(max(x)即以10为底的x的绝对值最大的对数
x'=x/10A1
实现代码为!
#!/user/bin/envpython
#-*-coding:utf-8-*
#author:M10
import numpy as np
import pandasaspd
importmatplotlib.pylabasplt
importmysgl.connector
conn=mysgl.connector.connect(host=localhost
user'root'
passwd='123456
db=python#链接本地数据库
sgl='selectprice.commentfromtaob#sql语句
data=pd.readsql(sql.conn)#获取数据
#标准差标准化
j=np.ceil(np.og10(data.abs0.max0))#进一取整,abs0为取绝对值
data1=data/10**]
print(data1)
上面是转自网友的代码(python数据分析数据标准化及离散化详解 - 刘小子 - 博客园 https://www.cnblogs.com/amengduo/p/9586288.html%EF%BC%89%EF%BC%8C%E6%88%91%E7%9A%84%E8%BF%90%E8%A1%8C%E7%BB%93%E6%9E%9C%E5%8D%B4%E6%98%AF%E4%B8%8B%E9%9D%A2%E7%9A%84%E6%A0%B7%E5%AD%90%EF%BC%9A
https://blog.csdn.net/weixin_43335392/article/details/124701008
您好,这是mysql.connector构建数据库连接的博客。
我自己试了一下,要注意这里得有本地已经启动好的mysql服务
而且端口,用户名和密码以及数据库名,表名都得保持一致。
然后对代码进行调整,就能够建立数据库连接,获取对应表的数据
我这里是改用pymysql库了,平常用的比较多。
import numpy as np
import pandas as pd
import matplotlib.pylab as plt
import pymysql
conn = pymysql.connect(host='localhost',user='root' , passwd = '123456', db = 'demo01')
# 链接本地数据库
sql = 'select * from tb' #sql语句
data = pd.read_sql(sql,conn) # 获取数据
# 标准差标准化
result=data['分数'].tolist()
print(result)
结果截图
至于后面求离散绝对值就不演示了,希望对您有所帮助