大数据的整合分析方法
- 期刊名字:统计研究
- 文件大小:
- 论文作者:马双鸽,王小燕,方匡南
- 作者单位:美国耶鲁大学生物统计系,湖南大学金融与统计学院,厦门大学经济学院
- 更新时间:2022-10-09
- 下载次数:次
论文简介
大数据具有数据来源差异性、高维性及稀疏性等特点,如何挖掘数据集间的异质性和共同性并降维去噪是大数据分析的目标与挑战之一.整合分析(Integrative Analysis)同时分析多个独立数据集,避免因地域、时间等因素造成的样本差异而引起模型不稳定,是研究大数据差异性的有效方法.它的特点是将每个解释变量在所有数据集中的系数视为一组,通过惩罚函数对系数组进行压缩,研究变量间的关联性并实现降维.本文从同构数据整合分析、异构数据整合分析以及考虑网络结构的整合分析三方面梳理了惩罚整合分析方法的原理、算法和研究现状.统计模拟发现,在弱相关、一般相关和强相关三种情形下,L1 Group Bridge、L1 Group MCP、Composite MCP都表现良好,其中L1Group Bridge的假阳数最低且最稳定.最后,将整合分析用于研究具有来源差异性的新农合家庭医疗支出,以及具有超高维、小样本等大数据典型特征的癌症基因数据,得到了一些有意义的结论.
论文截图
上一条:统计信息质量提高方法分析
下一条:利益概念的分析方法
版权:如无特殊注明,文章转载自网络,侵权请联系cnmhg168#163.com删除!文件均为网友上传,仅供研究和学习使用,务必24小时内删除。
热门推荐
-
C4烯烃制丙烯催化剂 2022-10-09
-
煤基聚乙醇酸技术进展 2022-10-09
-
生物质能的应用工程 2022-10-09
-
我国甲醇工业现状 2022-10-09
-
JB/T 11699-2013 高处作业吊篮安装、拆卸、使用技术规程 2022-10-09
-
石油化工设备腐蚀与防护参考书十本免费下载,绝版珍藏 2022-10-09
-
四喷嘴水煤浆气化炉工业应用情况简介 2022-10-09
-
Lurgi和ICI低压甲醇合成工艺比较 2022-10-09
-
甲醇制芳烃研究进展 2022-10-09
-
精甲醇及MTO级甲醇精馏工艺技术进展 2022-10-09
