——HIV患者结核病诊断标记物feature selection
人类免疫缺陷病毒(HIV)与结核病(TB)双重感染者为结核病的诊断和治疗带来了挑战。尽管最近已将几种转录特征确定为有希望的结核病诊断工具,但在晚期 HIV 患者中的数据有限。现有一种思路,即根据测定、分析标记物的基因表达值来找到最有效的标记物,使该标记物基因表达值对HIV患者结核病的识别效果最好,从而能够对HIV、TB双重感染者进行结核病诊断。
现有一组用于晚期HIV患者结核病诊断的双基因标记的基因表达数据。要求根据所给基因表达原始数据,运用random forest(和/或其他模型),挖掘基因表达数据中最有用的feature(标记物),并通过所划分的test数据计算performance。
数据下载链接:
https://filedn.com/lL2xsyY8teiHHTk3wYqUmVu/sdu_summerclass/RNA/GSE162164_RAW.zip