1. 研究目的与意义
背景:大数据(Big Data),指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。大数据分析是当前热门话题之一,它是信息计算、统计分析、计算机科学和管理科学等学科交叉的一个分支,且与人工智能、数据挖掘和数学建模等领域相关。
目的:本课题意在通过文献资料检索来更多地了解和理解大数据及其与我们日常生活和相关学科间的关系,并希望结合数学与应用数学、信息计算、数学建模和计算机编程与软件计算,研究大数据的数据生成和结构、数据预处理、数据分析和数据的可视化,进一步通过一些实例掌握高维大数据的处理方法。
意义:数据分析可以让人们对数据产生更加优质的诠释,而具有预知意义的分析可以让人们根据可视化分析和数据分析后的结果做出一些预测性的推断。2. 研究内容和预期目标
1. 研究内容:
本设计主要通过matlab软件,结合数据分析、线性代数和信息计算等理论,来熟悉大数据的数据存贮、数据分析和分类与识别。通过matlab的数据处理、统计分析与数据可视化等方法来实现数据的导入、数据的预处理和矩阵生成。运用matlab中的图像处理工具函数与数据降维,结合矩阵分解实现数据主成分分析和数据预测。
2. 预期目标:
3. 研究的方法与步骤
1. 研究方法:
a) 数据收集;
b) 数学模型、线性回归、统计方法与数据拟合;
4. 参考文献
[1]armour f, kaisler s, espinosa a. introduction to big dataanalytics: concepts, methods,
techniques minitrack[j]. 2015.
[2]friedman j h . on bias, variance, 0/1-loss, and the curse of dimensionality[j].data
5. 计划与进度安排
1-2周2022年11/16-02/28: 任务书,导师讲授选题状况和要求等;
2-3周2022年02/24-03/07: 开题报告,导师修改审定开题报告
4-14周2022年03/10-05/23: 毕业论文写作,学生按开题报告撰写论文
