新闻动态

RDA冗余分析出错案例——过拟合丨TomatoSCI分析日记

“ RDA冗余分析并不适合只有一个因变量的数据,强行使用 RDA会造成假的完美拟合。”前面介绍过冗余分析中变量消失的问题(RDA冗余分析出错案例——变量消失)。这是第二个许多朋友在做冗余分析(带你从0学分析之——冗余分析(RDA))时经常出现的问题,我们先来看看图中有问题的地方。✱图上箭头基本和坐标轴重叠;✱百分比数值高得离谱。这就是典型的数据输入问题,导致过拟合。我们可以看到,代表自变量的红色箭头有7个,但是代表因变量的黑色箭头只有1个,说明数据的因变量只有1列数据,强行用RDA分析,这也是解释度百分比加起来达到100%的原因。这是冗余分析常见的误区,冗余分析要求自变量和因变量都至少要两个以上,像上面提到的例子,1个因变量、多个自变量的情况下适合回归分析(传送门:带你从0学分析之—线性回归模型篇(1);带你从0学分析之—线性回归模型篇(2)),只有因变量和自变量都有2个以上的情况下才可能考虑冗余分析。 多说两句关于过拟合的内容,过拟合通俗地说就是过于完美,做统计分析基本不存在完美拟合、完全理想的情况,一般出现R方过高、解释度百分百、相关系数接近1或-1这种情况就要考虑是不是数据有问题,比如数据造假、输入的变量可以互相换算等。过拟合与共线性通常都会一起出现,两者都会导致分析结果的可靠性下降。TomatoSCITomatoSCI 数据分析平台官方运营号38篇原创内容 公众号 ,TomatoSCI科研数据分析平台(www.tomatosci.com),陪你过完最后一关!✅ 冗余分析一键完成 ✅ 免登录 ✅ 实时专业答疑 ✅ 附赠参考资料。本人长期深耕数据分析与科研成果排版,支持个性化定制分析方案与整理研究成果。亲自服务,无中介外包。欢迎咨询。



Powered by 足球资讯 @2013-2022 RSS地图 HTML地图

Copyright Powered by365建站 © 2013-2024