因果推断
因果推断是机器学习和统计学中一个非常重要和具有挑战性的领域。它试图从观察数据中发现因果关系,而不仅仅是相关性。以下是一些常用的因果推断框架和原理:
- 做出条件独立性假设的框架:
- 结构因果模型(Structural Causal Models, SCMs)
- 无向加性噪声模型(Non-Gaussian Additive Noise Models)
- 线性非高斯混合模型(Linear Non-Gaussian Acyclic Models)
- 潜在结果框架(Potential Outcomes Framework):
- 为了估计因果效应,需要考虑反事实(counterfactuals)
- 基于随机对照试验的Rubin因果模型
- 基于机器学习的因果发现算法:
- 基于约束的算法(PC, FCI等)
- 基于得分的算法(GES, GIES)
- 功能因果模型(Functional Causal Models)
- 启发式原理:
- 蒙工操控标准(Manipulation Criterion)
- 时间先驱标准(Time Precedence Criterion)
- 统计相关标准(Statistical Relevance Criterion)
- 域适应和样本选择偏差调整:
- 重要编码(Importance Weighting)
- 协方差平移修正(Covariate Shift Correction)
- 因果图模型与d-分离原理
- 基于无向无环图和d-分离准则的因果推断
- 利用可观测到的边上的d-分离关系推断隐藏变量
这些框架和原理从不同角度处理因果推断问题,每种都有其适用场景和优缺点。合理结合多种框架可提高因果发现的质量和可信度。值得注意的是,因果推断仍是一个极具挑战的领域,需要满足一些基本假设。