doris和sr有什么关系

doris和sr是同一个研发团队吗,它们有什么差异、分别有什么优势、以及分别应用于什么场景呢?

如果apache doris和starRocks做对比选型,优选doris

  • 历史
    apache doris和starRocks都是师出同门【百度Palo】
    apache doris遵守的是Apache License协议(可以简单理解为“真开源”)
    starRocks遵守的是Elastic License协议(可以简单理解为“假开源”)
    starRocks前身叫DorisDB,可以简单理解为:fork至apache doris,并打着apache doris的名义招兵买马,但却不做任何回馈给apache doris,偶尔还会耍个回马枪…可以看官方的说明:https://mp.weixin.qq.com/s/QnJ6LFaMOpLasdRpFzGFJA
  • 现状
    如果将国内mpp领域比作一个江湖的话,那么apache doris就是大势所趋,而starRocks就类似那啥…奈何我读书少,只能屮艸芔茻简单表述一番;
  • 模块
    功能模块大致一样,毕竟是师出同门;
    但是doris2.0发版后,很多商业化的功能也开源了、比如ccr和存算分离等功能~ddd
  • 性能
    为了打消高层想引进starRocks的念头,这边有做过1T-TPCDS压测和一些性能评估;虽然starRocks对部分sql会相对快些,但整体稳定性较差,更容易oom,可能是因为我对比的是"开源"的starRocks的原因吧;不过doris2.0的性能可谓提升明显,愈发强大!
  • 总结
    一个人可能走的更快,但一群人会走的更远。

研发团队:StarRocks(SR)之前被称为Apache Doris,后经过重命名和品牌重塑,成为了StarRocks。因此,它们本质上是同一个项目,只是在某个时间点发生了名称更改。所以,可以说它们来自同一个研发团队,但在名称和品牌更改后,可能会有团队组成的变化或者策略上的调整。

差异:由于StarRocks是Doris的继任者,其核心架构和功能可能与早期的Doris非常相似。但随着时间的推移,StarRocks可能引入了新的特性、优化和改进。具体的差异需要参考它们各自的版本更新记录和文档。

优势:

Doris:在它的时代,Doris被设计为一个高性能的MPP分析数据库,支持实时数据更新。它的优势包括低延迟的查询、高并发、易于扩展、支持PB级数据以及列式存储。
StarRocks:由于它是Doris的继任者,它继承了Doris的许多优势,并可能引入了新的特性和性能优化。
应用场景:

Doris:适用于需要高并发、低延迟查询的大数据分析场景,如在线分析处理(OLAP)、商业智能(BI)、报告生成等。
StarRocks:由于它继承了Doris的功能,所以它同样适用于上述场景。但随着新特性的引入,StarRocks可能更适用于某些特定的、高级的分析需求或其他特定场景。

参考结合GPT4.0、文心一言,如有帮助,恭请采纳。
回复:不是一个团队,但他们源出一家公司,并且Apache Doris和StarRocks都是基于Mpp架构的分布式SQL数据库,但它们并非由同一个团队开发。Apache Doris是由百度团队开发的,而StarRocks是由前百度Doris团队成员离职后创立的公司开发的

Apache Doris是一个分布式的列式存储系统,它的设计目标是提供大规模数据处理的可靠性和高性能。Doris采用了集群方式,通过将数据分布在多个机器上进行处理来提高性能,并提供了SQL查询接口方便用户使用。

StarRocks是一个分布式存储系统,它建立在Apache Hadoop之上,旨在为大型超级计算机提供结构化数据存储解决方案。StarRocks采用了列式存储模型,并利用Hadoop的分布式计算框架来管理数据和提供高性能的数据处理。

因此,Doris和StarRocks的主要区别在于:

底层架构不同:Doris是一个独立的分布式存储系统,而StarRocks是建立在Hadoop之上的。

存储模型不同:Doris使用列式存储模型,而StarRocks使用Hadoop中的HDFS文件系统来存储数据。

处理能力不同:Doris提供高性能的数据处理能力,而StarRocks利用Hadoop的分布式计算框架来处理数据。

apache doris Apache License协议
starRocks Elastic License协议

援引讯飞星火:

StarRocks和Doris是来自同一个研发团队的项目,但名称和品牌有所更改。它们在核心架构和功能上可能非常相似,但随着时间推移,StarRocks可能引入了新的特性、优化和改进。Doris被设计为一个高性能的MPP分析数据库,支持实时数据更新,具有低延迟查询、高并发、易于扩展、支持PB级数据以及列式存储等优势。StarRocks作为Doris的继任者,继承了这些优势,并可能引入了新的特性和性能优化。它们都适用于大数据分析场景,如OLAP、BI、报告生成等,但随着新特性的引入,StarRocks可能更适用于某些特定的高级分析需求或其他特定场景。

Doris 和 StarRocks 的主要区别在于:
底层架构不同: Doris 是一个独立的分布式存储系统,而 StarRocks 是建立在 Hadoop 之上的。
存储模型不同: Doris 使用列式存储模型,而 StarRocks 使用 Hadoop 中的 HDFS 文件系统来存储数据。
处理能力不同: Doris 提供高性能的数据处理能力,而 StarRocks 利用 Hadoop 的分布式计算框架来处理数据。

差异:
架构和存储方式: Doris使用了基于列存储的存储引擎,而StarRocks则是基于列存和行存混合存储引擎。
数据模型: Doris使用了Star Schema和Snowflake Schema等多维模型,而StarRocks更注重OLAP查询,适用于更加复杂的数据模型。
查询优化: 两者的查询引擎和优化器有所不同,因此在一些特定的查询场景下,可能会有性能上的差异。

优势:
Doris优势: Doris在一些大数据OLAP查询场景下表现优秀,特别适用于复杂的多维数据分析,支持实时数据同步和查询。
StarRocks优势: StarRocks在一些特定的查询场景下具有较好的性能,尤其是对于交互式查询、大规模数据聚合分析等。

应用场景:
Doris应用场景: Doris适用于需要多维分析、复杂数据模型、实时查询等场景,比如在线广告数据分析、监控数据分析等。
StarRocks应用场景: StarRocks适用于需要快速查询大规模数据、交互式分析、数据仓库等场景,比如大数据分析、OLAP查询等。

参考gpt:
结合自己分析给你如下建议:
Doris 是一个分布式的列式存储系统,它的设计目标是提供大规模数据处理的可靠性和高性能。Doris 采用了集群方式,通过将数据分布在多个机器上进行处理来提高性能,并提供了 SQL 查询接口方便用户使用。Doris 的核心特性包括:
支持实时流式数据导入和查询,实现数据的秒级到达和分析。
支持多维分析,通过预聚合和 Bitmap 等技术实现快速的聚合查询。
支持多种存储格式,包括行存、列存、星型模型等,满足不同场景的需求。
支持多租户和多副本,保证数据的安全性和可用性。
支持向量化执行引擎,提升计算效率和资源利用率。
SR 是一个分布式存储系统,它建立在 Apache Hadoop 之上,旨在为大型超级计算机提供结构化数据的高效存储和分析。SR 的核心特性包括:
支持混合存储模式,结合内存、SSD 和 HDD 的优势,实现数据的快速访问和低成本存储。
支持自适应编码,根据数据的特征选择最合适的压缩算法,节省存储空间和网络带宽。
支持并行计算框架,利用 Spark、Flink 等大数据平台进行批量或流式数据处理。
支持机器学习框架,集成 TensorFlow、PyTorch 等深度学习工具,实现数据的智能化分析。