在大数据环境下,大部分数据集不但是多源异构的,而且往往是高维的,包含成千上万的特征属性。高维数据所带来的挑战,不但包括高维问题,而且还包括噪音问题、冗余特征问题、不平衡问题和混合类型数据问题。为了解决上述瓶颈问题,申报团队通过研究面向高维数据的集成学习算法,在大数据分析和机器学习理论等基础性问题上取得创新性成果,为高维数据智能处理的深入研究以及集成学习算法在高维数据分析的应用提供基础性的方法,从而推动集成学习基础理论在高维数据智能处理领域更深入的应用。
余志文、陈俊龙、马千里、杨楷翔、施一帆