我爱占星网 我爱占星网
首页
编程
java
php
前端
首页 编程 java php 前端

Spark RDD和HDFS数据一致性问题

这里想问个问题。

我用Spark SQL从HDFS load上来了一张表。
然后我现在有如下两种情况:

  1. 新增数据都是通过Spark SQL load进去的
    • 这时候我HDFS和RDD上面的数据是否一致
  2. 我数据是直接load到了HDFS上面(例如是个分区表,增加了一个分区)
    • 这时候我HDFS和RDD上面的数据是否一致

麻烦给出详细的原理过程或者参考链接

近期文章

  • oracle 创建触发器问题
  • Android中关于HttpClient的问题
  • c# 使用继承选择器 时 无法加载程序集
  • 新手提问,关于C语言共用体字节数
  • vs 2010 无法启动程序,拒绝访问怎么办
  • 冒泡排序用app动态演示怎么实现?
  • BeanUtils.populate不能赋值带下划线的吗?
  • C++初学遇到Access Violation,求助
  • eclipse中做一个主界面,但有个button控件问题
  • 以下代码在运行时报以下错误
  • vc++6.0编译总是出现一个错误
  • sqlserver查询相同的子物料,就是查bom相同的物料
  • db2 sql0010n 一个错误
  • C++中一个数据结构的问题,想着用数组实现下,但,请看问题出在哪了
  • 谁要能解决这个问题我直播吃屎!!!!
  • 程序在全屏幕状态运行的时候,怎么给程序增加一个“调音台”?
  • C# 关于 xombox 的问题
  • mfc编程出现了错误,小生刚接触,大家指点指点
  • ORACLE的instr函数,想了一下午,求大神解惑,不胜感激!!!
  • JAVA huffman树统计字符出现的次数(权值)

Copyright ©2022 我爱占星 All Rights Reserved.

浙ICP备2022030071号-1

部分图文来自网络,如有侵犯您的版权,请告诉我们删除

友情链接:代码精华