服务器使用率突然很高 请看图片 可又解决办法

问题遇到的现象和发生背景 这个是不是流量攻击 可有解决办法
问题相关代码,请勿粘贴截图
运行结果及报错内容
我的解答思路和尝试过的方法
我想要达到的结果服务器供应商那边说流量不是从服务器进来的查不到原因 请看图片

img

img

img

img

我这边给到的排除建议是,看看对你有帮助否
1、查看一下系统各日志,看看能否有找到什么有价值的东西
2、程序的bug或者部署不当,触发之后耗尽资源
(用htop和top命令监控CPU、内存使用大的进程。先看看哪个进程消耗资源较多,用户态、内核态、内存、IO……同时sar -b查io的历史定时抽样。)
3、网络攻击(统计tcp连接数,看看有没有DDOS攻击。)
综合来看,建议先登录服务器上去看看,如果是容器部署的,非办公时间,把容器服务重启下

出现问题,首先看日志。如果是线上的,先想办法恢复服务再排查。

看看登录日志,访问日志是否有异常,确定是否有人扫机器。

看性能监控图表,分析机器的状况,以及问题发生的规律。

看是否有服务被系统kill。一般系统日志都会记录kill之前的进程列表,可以很好的分析哪些进程资源占用多。

如果还是没找到原因,那就只能抓网络数据。通过记录的网络数据在测试环境中复现线上问题。

根据监控图片的时间点,可以查看服务器使用率高的时间点对应的日志文件,分析下对应的接口调用情况,从而判断是什么原因造成的

记录变高的时间,长时间记录,分析一下是否有规律。然后回到服务器的使用率高的时刻,查看是否有异常的事物。

需要结合业务日志来看看吧,看看对真实业务的访问是否可信,是不是搜索引擎爬虫

检查服务器日志 这个时间段的来访ip ,分析下做了什么,如果大部分不是按你的业务逻辑走的可能是攻击(直接把ip段禁了),如果都是正常访问逻辑,那就是你该升级服务器配置了(好事)

可以跑个内存和cpu监控程序,得到实时的信息,像spotlight这些都可以。

是不是有人爬你的数据😀

看看ip访问量吧,这个网站日志可以查到,或许是某个定时爬虫弄的

这个只是突发了一下,可能是DDOS攻击。如果只是一次临时的,你服务又没有受太大影响那就没有关系。
如果想安全防护DDOS攻击:
1、可以购买阿里云的DDOS防护服务,不过这3万连接数并不是很高,暂时没有必要;
2、安全加固你的服务,比如如果是接口服务,配置IP白名单、需要token验证等。
另外可以做一些日志检查:
1、查看访问应用的日志记录是否大量IP访问?某些IP大量访问?如果是部分IP可以将其加入黑名单。
2、如果日志记录没有这些则需要配置好相关服务的日志记录。

查看日志,看一下那段时间大量请求是请求的什么,如果是同一请求可能就是被蜘蛛获取你的数据了,或者是被恶意攻击,写一些反扒机制,还有就是控制ip的访问限制频率。

1.图片外链
2.使用CDN加速
3.找到业务处理瓶颈

偶尔搞一下挺正常的事

题主有无考虑过安全问题?比如说 被人下了挖矿木马,或者是内部有人在拿服务器进行挖矿的操作?我司之前也存在类似的问题,最后查出来是新来的运维在机器上挖矿。

服务器问题,无非就是资源不合理的使用,造成服务器内存,cpu,io,流量等相关资源出现非常不正常的波动,资源使用率飙升。对于服务器性能问题的排查,没有其他比较好的办法,只能是通过重现复盘去改进。特别是如果服务器上跑的东西比较多,一个个的排查相当痛苦。

出现问题,首先看日志。如果是线上的,先想办法恢复服务再排查。

看看登录日志,访问日志是否有异常,确定是否有人扫机器。

看性能监控图表,分析机器的状况,以及问题发生的规律。

看是否有服务被系统kill。一般系统日志都会记录kill之前的进程列表,可以很好的分析哪些进程资源占用多。

如果还是没找到原因,那就只能抓网络数据。通过记录的网络数据在测试环境中复现线上问题。

查看日志,如果找不到问题。就重启服务器,看看哪些进程有问题。

结合日志来看看吧,可能是爬虫的影响,也有可能是网络攻击。希望对题主有所帮助!

某个时刻请求量大了呗,又没有一直cpu过高。

看一下日志是哪个进程占用的cpu高,然后看看这个进程是干啥的,推断出是哪部分业务导致的。