随着大数据时代的到来,稀疏性成为研究大数据的重要手段。随着计算机和信息技术的普及与应用,特别是互联网技术、通信技术、数字技术和云计算等行业应用规模的迅速扩大,各行业所产生的数据量呈爆炸性增长,时刻都会产生大量的、多样化的、结构复杂的、冗余的、高维的海量数据。然而,这些数据中蕴含着非常有价值的信息,但又无法通过常规手段直接观察到。因此,大规模数据分析是现代科学技术与工程应用等领域内处理大数据科学问题的关键课题之一。
本书在酉不变范数意义下,通过矩阵的广义逆分解理论,利用矩阵的相关投影性质,研究了矩阵低秩分解的扰动理论;基于受限等距性质,在理想情况下研究了矩阵低秩稀疏分解的性质,并给出了稀疏矩阵精确重构的充分条件:在噪声情况下,分析了稀疏矩阵恢复的鲁棒性,给出了误差上界;基于鲁棒主成分分析模型(RPCA),提出了矩阵低秩稀疏分解的可分离替代函数法,并设计了近似点迭代阈值算法(PPIT)和基于不精确的增广拉格朗日方法(IALM)的可分离替代函数算法(SSF-IALM)求解RPCA模型;最后本书提出了矩阵的稀疏低秩因子分解模型(SLRF),并设计了两种求解此模型的算法:惩罚函数法(PFM)和增广拉格朗日方法(ALMM)。
展开