hadoop小白想请各位师兄师姐指点指点……

题目是，

基于S3a的Hadoop大数据分析软件，基于hadoop框架开发S3a插件，提供读缓存能力，大幅提升大数据分析带宽（>300M/s）。这到底是要我做啥，我刚搭好hadoop完全分布式环境，其他啥也不懂，想请各位师兄师姐给我点思路，这么个东西怎么下手去做。

s3应该是Amazon s3，一个文件存储服务。s3a应该是在hadoop2.7及之后版本推荐的s3客户端，你可以去hadoop wiki上查查。至于开发的插件用于读缓存，这个我不清楚具体要求，你可以和你导师详细交流一下。