负载均衡如何实现请求和响应分离

最近刚开始学习负载均衡,目前我看的有四层的LVS,七层的HAProxy,nginx。但是,看了一篇文章,里面无意提了一个事,但是却没有解决方案。
说的是 负载均衡 可以实现 请求的时候 经过前置机分发 但是 响应的时候 却直接将数据响应给客户端
这个怎么实现的哈 如果实现 对于LB主机来讲 性能会提升太多 小白求教

一般是加入cache机制,负载均衡查询到数据在cache中,直接从cache中捞取数据,然后返回给客户端,而不是再让应用服务器处理。

将请求业务和应答结果放入两个不同的前置机里。负责处理请求业务的前置机在获取请求之后不做任何处理直接交给业务系统进行处理。前置机中做获取
业务结果的数据key。将这个key直接发给请求端。同时通知业务系统进行业务处理。当业务系统处理完成具体的业务逻辑生成业务数据之后放入缓存中。
同时通知应答的前置机业务执行完成。让请求方拿着请求前置机提供的数据key进行数据的读取。这样就可以将请求和应答在逻辑上进行分类。业务处理
的时候最好直接交给kafka或者相关的mq系统。业务系统由mq中间件进行调起。当业务系统处理完成。将数据放入指定业务系统中的redis或者其他cache
的队里中。然后让应答前置机通过数据key进行数据的读取。