题目是,基于S3a的Hadoop大数据分析软件,基于hadoop框架开发S3a插件,提供读缓存能力,大幅提升大数据分析带宽(>300M/s)。这到底是要我做啥,我刚搭好hadoop完全分布式环境,其他啥也不懂,想请各位师兄师姐给我点思路,这么个东西怎么下手去做。
s3应该是Amazon s3,一个文件存储服务。s3a应该是在hadoop2.7及之后版本推荐的s3客户端,你可以去hadoop wiki上查查。至于开发的插件用于读缓存,这个我不清楚具体要求,你可以和你导师详细交流一下。