如图两列数据 疾病对应基因 如何用R语言将不同疾病两两组合 对比出共用的基因数量 并输出一个新表?

A病对应基因有 a b c d e

B病对应基因有 a c e

C病对应基因有 b d

A与B共用基因有a c e 3个

A与C共用基因有b d 2个

C与B没有共用基因 0个

img

dplyr包的 full_joint inner_jiont left_jiont 那些看下就会。这问题还价值50元啊?

博主参考一下下面链接

R语言零基础基因/数据差异分析(一)_Frms的博客-CSDN博客_r语言做差异分析 文章目录介绍环境搭建软件下载结果展示基因数据下载流程基因数据处理利用GEO分析绘制拟火山图注意,本 系列 有连贯性,每一步都很详细,每一步都很重要,请耐心读完!!介绍 本系列文主要依据真实论文制图流程,详细说明制图过程, 其中包括: 1. 基因数据下载2. 制图所需数据格式 3. 火山图制作流程 4. 聚类热图制作流程环境搭建软件下载移步至此学习结果展示基因数据处理注意删除末行注释基因数据下载流程以GSE137578基因为例,先下载 如图所示文件,并解压如图。 https://blog.csdn.net/qq_39751227/article/details/118757653?ops_request_misc=&request_id=&biz_id=102&utm_term=%E5%A6%82%E5%9B%BE%E4%B8%A4%E5%88%97%E6%95%B0%E6%8D%AE%20%E7%96%BE%E7%97%85%E5%AF%B9%E5%BA%94%E5%9F%BA%E5%9B%A0%20%E5%A6%82%E4%BD%95%E7%94%A8R%E8%AF%AD%E8%A8%80%E5%B0%86%E4%B8%8D%E5%90%8C%E7%96%BE%E7%97%85%E4%B8%A4%E4%B8%A4%E7%BB%84%E5%90%88%20&utm_medium=distribute.pc_search_result.none-task-blog-2~blog~sobaiduweb~default-0-118757653.nonecase&spm=1018.2226.3001.4450

R语言零基础基因/数据差异分析(二)_Frms的博客-CSDN博客_r 差异分析 文章目录结果展示安装ggplot2包制作方法注意,本 系列 有连贯性,每一步都很详细,每一步都很重要,请耐心读完!!结果展示安装ggplot2包如图操作找到并勾上即可。制作方法关于 基因啊选定标准,即logFC和FDR,请仔细阅读代码修改即可,这里给出的标准是:|log2(FC)| > 1 且 FDR < 0.01```r#选择文件df=read.csv(file.choose(),header = T #是否有标题,T表示有,F反之)#加载包(反正多余 https://blog.csdn.net/qq_39751227/article/details/118759858?ops_request_misc=&request_id=&biz_id=102&utm_term=%E5%A6%82%E5%9B%BE%E4%B8%A4%E5%88%97%E6%95%B0%E6%8D%AE%20%E7%96%BE%E7%97%85%E5%AF%B9%E5%BA%94%E5%9F%BA%E5%9B%A0%20%E5%A6%82%E4%BD%95%E7%94%A8R%E8%AF%AD%E8%A8%80%E5%B0%86%E4%B8%8D%E5%90%8C%E7%96%BE%E7%97%85%E4%B8%A4%E4%B8%A4%E7%BB%84%E5%90%88%20&utm_medium=distribute.pc_search_result.none-task-blog-2~blog~sobaiduweb~default-2-118759858.nonecase&spm=1018.2226.3001.4450

这个看看

R语言零基础基因/数据差异分析(一)_Frms的博客-CSDN博客_r语言做差异分析 文章目录介绍环境搭建软件下载结果展示基因数据下载流程基因数据处理利用GEO分析绘制拟火山图注意,本 系列 有连贯性,每一步都很详细,每一步都很重要,请耐心读完!!介绍 本系列文主要依据真实论文制图流程,详细说明制图过程, 其中包括: 1. 基因数据下载2. 制图所需数据格式 3. 火山图制作流程 4. 聚类热图制作流程环境搭建软件下载移步至此学习结果展示基因数据处理注意删除末行注释基因数据下载流程以GSE137578基因为例,先下载 如图所示文件,并解压如图。 https://blog.csdn.net/qq_39751227/article/details/118757653?ops_request_misc=&request_id=&biz_id=102&utm_term=%E5%A6%82%E5%9B%BE%E4%B8%A4%E5%88%97%E6%95%B0%E6%8D%AE%20%E7%96%BE%E7%97%85%E5%AF%B9%E5%BA%94%E5%9F%BA%E5%9B%A0%20%E5%A6%82%E4%BD%95%E7%94%A8R%E8%AF%AD%E8%A8%80%E5%B0%86%E4%B8%8D%E5%90%8C%E7%96%BE%E7%97%85%E4%B8%A4%E4%B8%A4%E7%BB%84%E5%90%88%20&utm_medium=distribute.pc_search_result.none-task-blog-2~blog~sobaiduweb~default-0-118757653.nonecase&spm=1018.2226.3001.4450

这样比较容易理解,先分每个疾病一个矩阵,然后根据疾病取交集

> library(dplyr)
> dat
   disease gene
1        a    1
2        a    2
3        a    3
4        a    4
5        a    5
6        a    6
7        b    1
8        b    3
9        b    4
10       b    6
11       b    7
12       b    9
13       b   10
14       b   11
15       c   11
16       c    6
17       c    3
18       c    4
19       c   13
> a <- dat[dat$disease=="a",]
> b <- dat[dat$disease=="b",]
> b
   disease gene
7        b    1
8        b    3
9        b    4
10       b    6
11       b    7
12       b    9
13       b   10
14       b   11
> ab <- inner_join(a,b,by="gene")
> ab
  disease.x gene disease.y
1         a    1         b
2         a    3         b
3         a    4         b
4         a    6         b

如果没人会的话我来试试

参考这个文章
R语言零基础基因/数据差异分析