hadoop是如何将各种数据标准化的

就是可以将各种数据变成一种自己制定格式的数据。求具体步骤。希望大神可以解答

http://blog.csdn.net/dongzhumao86/article/details/43850459

你想问的应该是自定义一种可以序列化的数据类型吧,你可以自定义一个writable接口的子类,实现其中的序列化与反序列化方法,自定义的数据类型你可以
自定义其中的字段,举个例子
public class TextPair implements WritableComparable{
private String first;
private String second;
public String getFirst() {
return first;
}

public void setFirst(String first) {
    this.first = first;
}

public String getSecond() {
    return second;
}

public void setSecond(String second) {
    this.second = second;
}

public void write(DataOutput out) throws IOException {
    out.writeUTF(first);
    out.writeUTF(second);
}

public void readFields(DataInput in) throws IOException {
    first = in.readUTF();
    second = in.readUTF();
}

public int compareTo(TextPair o) {
    if(!this.first.equals(o.first)){
        return this.first.compareTo(o.first);
    }else{
        return this.second.compareTo(o.second);
    }
}

@Override
public String toString() {
    return first+"\t"+second ;
}

},