文本内容 文本内容如下 是一个list
{ 个人简介, 姓名, 张三, 年龄, 15, 职位, 接生婆, 额外数据, 的手法首发, 姓名 , 张三, 年龄, 15, 职位 接生婆, 额外数据, 的手法首发, 标题, 士大夫, 意向, 士大夫石帆胜丰, 已婚, 否, 相别, 男, 住址, 西方极乐世界,【【 注意:这个元素有可能也是住址总的一部分】】】】, 爱好, 士大夫十分发士大, 个人详情, 我我我嚄我我我我 }
注: 属性名有可能不完全一样:需要配置
例如:职位这个词有可能为职业 要配位到下面的职位
住址:有可能为地址 要匹配到下面的住址
最后要的效果 过滤文本中的内容 要达到如下的效果
姓名:张三 年龄:15 职位:接生婆
住址:西方极乐世界
爱好:接生
个人详情:我我我我我我我我我我我我我我我我我我我我我我我我我我我我我我我我我我我我我我我我我我我我我我我我我我我我我我我我我我我我我我我我我我我我我我我我我我我我我我我我我我我我我我我我我我我我我我我我我我我我我我我我我我我我我我我我我我我我我我我我我我我我我我
通过配置对应字段和特殊字段来匹配合适的数据
如:aaaa:bbbbb
配置aaaa对应的所有相关近义词达到匹配的目的
这个你过滤掉的和上边的也不对应啊!
正常写代码提取呗,逗号作为分隔符
不是个list吗,for循环取每一项,判断每一项的内容,匹配后获取下一项作为内容填充到实体类
如果都是 k,v,k,v这种文本结构是很好处理,你的难点在于同义词处理; 简单点可以配置几个同义词对应同一个属性就可以了
个人觉得,这种比较简单(词比较少)的情况可以自己维护一张同义词表(可以是表格,数据库,甚至是集合)
可以用数据库来实现,而且可能会更好
通过字符串通过逗号分隔,得到字符串数组,采用Map方式进行存储,之后通过遍历,拿到value
根据我的观察 属性值应该是紧跟在属性后面
你说数据是保存在list中的 姑且不管你是怎么放到list中的 就按照list作为数据源处理
1.属性名不一定固定 需要配置 可以先从配置文件读取到需要的所有的属性名放到Map中作为key存在
2.循环这个map 在list中找到key的下标index 那么key对应的value就是list.get(index+1) 即 map.put(key,list.get(index+1))
3.循环输出map key+“:”+map.get(key) 得到的就是你想要的了