刊名 | 《预防医学研究》 | ||||
作者 | 柴志远 | 英文名 | 年,卷(期) | 2025年,第10期 | |
主办单位 | 环宇科学出版社主办;华文科学出版社主管 | 刊号 | 2705-0459 | DOI |
目的:糖尿病是全球影响广泛的代谢性疾病,早期诊断对预防和控制至关重要。本研究旨在通过分析公开的糖尿病基因表达数据集,筛 选糖尿病的特征基因,并利用机器学习方法构建糖尿病的诊断预测模型,为早期诊断提供新的思路和技术支持。方法:我们从 GEO 数据库获取了 GSE71416 和 GSE78721 两个糖尿病相关基因表达数据集,并进行了差异基因表达分析。通过 GO 与 KEGG 功能富集分析探讨了这些基因的生物学功能和信号通路。 随后,基于文献中的机器学习算法组合,使用支持向量机、随机森林和 LASSO 回归等经典机器学习算法筛选出了糖尿病的潜在特征基因,并构建了糖尿 病诊断预测模型。结果:差异基因分析筛选出了在糖尿病患者和正常对照组之间存在显著差异的基因。GO 与 KEGG 分析表明,这些差异基因与 RNA 剪接、 mRNA 代谢及细胞信号转导等生物学过程密切相关,并在糖尿病的相关信号通路中发挥作用。通过机器学习方法,筛选出了关键特征基因,并构建的诊 断模型在训练集和验证集上表现出较高的准确性。结论:本研究成功构建了基于基因表达的糖尿病诊断预测模型,证明了机器学习方法在糖尿病早期诊 断中的潜力。该模型为临床早期干预和个性化治疗提供了新的思路,具有较高的应用价值。 【关键词】糖尿病;基因表达;差异基因;功能富集分析;机器学习
营业时间:9;00-11:30 13:30-17:00
地址:总部:香港湾仔骆克道315-321号幸运广场23楼C室;分部:香港九龍新蒲崗太子道東704號新時代工貿商業中心31樓5-11室A03單位
邮箱:gjkzxtg@126.com
客服QQ:3577400288