散点图通过边界线进行数据分类

怎么计算下图中的黄色上边界线条，且不包含红色箭头附近的非正常点，实现数据的自动分类。

帮你找了个相似的问题, 你可以看下: https://ask.csdn.net/questions/7503048
你也可以参考下这篇文章：已存入数组中的数据值已经按由小到大的顺序存放，现从键盘输入一个数据，把它插入到数组中，要求插入新数据以后，数组数据仍然保持有序。请编写一个程序实现上述功能。
除此之外, 这篇博客: 机器学习中的准确率与召回率的理解和总结中的 作为遇到偏斜类问题评估度量值，在很多应用中我们希望保证查准率和召回率的相对平衡。 部分也许能够解决你的问题, 你可以仔细阅读以下内容或跳转源博客中阅读:
准确率是我们最常见的评价指标，而且很容易理解，就是被分对的样本数除以所有的样本数，通常来说，正确率越高，分类器越好。
准确率确实是一个很好很直观的评价指标，但是有时候准确率高并不能代表一个算法就好。比如某个地区某天地震的预测，假设我们有一堆的特征作为地震分类的属性，类别只有两个：0：不发生地震、1：发生地震。一个不加思考的分类器，对每一个测试用例都将类别划分为0，那那么它就可能达到99%的准确率，但真的地震来临时，这个分类器毫无察觉，这个分类带来的损失是巨大的。为什么99%的准确率的分类器却不是我们想要的，因为这里数据分布不均衡，类别1的数据太少，完全错分类别1依然可以达到很高的准确率却忽视了我们关注的东西。再举个例子说明下。在正负样本不平衡的情况下，准确率这个评价指标有很大的缺陷。比如在互联网广告里面，点击的数量是很少的，一般只有千分之几，如果用acc，即使全部预测成负类（不点击）acc也有 99% 以上，没有意义。因此，单纯靠准确率来评价一个算法模型是远远不够科学全面的。
您还可以看一下刘建萍老师的人工智能系列课程零基础讲解知识点和实例应用线性回归梯度下降逻辑回归课程中的讲解机器学中会涉及到的有关数学方面的知识储备有哪些小节, 巩固相关知识点