如何大致计算一张图片中有人群的区域的实际面积?

在计算机视觉问题中,如图所示为人群公开数据集中的任意图片,这些图片存在透视变形等。由于是人群数据集,我认为可以选用人的头部作为参照物,假设人头部宽度实际是15cm, 如何设计一种方法实现大致计算出该场景有人群区域的实际面积?有一些针对特定图片的方案,最好是能有通用性的方案,给出任意一张人群图片,计算出该场景的实际面积。图片说明图片说明

https://zhidao.baidu.com/question/351454851.html