数理统计在数据分析中的应用
摘要:社会经济的发展和科技的的进步加快了生产生活方式的变革,互联网信息技术的发展和普及使得数据分析的作用日渐凸显,数理统计可以为数据分析提供重要的基础,目前数理统计在数据分析中的应用日渐广泛,投资风险控制、企业管理决策、产品质量控制及保险学等相关的数据分析中都需要数理统计的参与。本文结合数理统计的概念和特点,就数理统计在数据分析中的具体应用进行了分析探讨。
关键词:数理统计;数据分析;应用
前言
科技的发展推动了互联网信息技术的普及推广,各个行业的工作人员通过数据资料的收集分析可以为日常工作和决策的制定提供参考和依据。数学统计方法的应用是数据处理分析的基础,数据分析离不开数理统计方法的参与。伴随着科技的进步和经济的发展,数据分析在社会生产和人们的日常生活中发挥着越来越重要的作用。
一、数理统计概述
对需要分析的随机现象或者事件进行有限次数的试验和观测,并对所得数据采取科学的方法进行归纳分析,找出这些有限数据的规律性并以此为依据制定科学的可以对随机现象进行判断或推断的学科即数理统计。
数理统计的特点主要表现在研究对象、研究方法、研究基础等方面。数理统计的研究对象必须是随机事件或者是数量,对于已经确定的研究对象的情况无法采用数理统计的方法进行分析,数理统计可以说是一种数据分析方法,但是数理统计的研究结果往往较为浅层,无法满足对数据的深层分析的要求,只是在数量上对研究对象的数据变化情况进行反映。数理统计的主要数学研究方法为归纳法,在以数理统计为基础的数据分析中,需要对整体研究样本进行抽样处理,并将抽取到的样本事件进行归纳分析,通过对样本反映的数据规律的分析推断整体样本对象的数据规律。概率论是数理统计的理论基础,因而数理统计得出的数据结果呈现出普遍性规律特征,但是数理统计的计算结果无法保证完全的准确性,且在抽取样本时也需要注意,样本应分多次抽取,且所抽取的样本需要具有一定的代表性,单次抽取的样本往往会存在较大的局限性。在实际的数据分析过程中,经济条件允许的情况下应尽可能地增大采取样本的数量以保证样本的代表性和数理统计计算结果的准确性。
二、数理统计在数据分析中的具体应用
1.区间估计及假设检验。区间即数轴上的任意一段距离或者是一个数据区间,区间估计根据所提供的条件对其可能的区间进行推断,这一区间被称作置信区间。通过对相关数据分布情况的分析可以进行置信区间的计算,一般来说区间范围应当尽可能小,具体的置信区间范围可以通过不等式变形得到。在进行区间估计时首先需要根据相应的标准对某个点进行估计,从而对相关数据的分布情况进行了解,之后便可以进行区间的计算,在此过程中要求给定研究对象的置信水平,一般来说区间计算的范围要尽量小一点,确保区间估计的精确性。最后经过不等式变形便可以得到区间估计的结果。假设检验在数理统计中十分常见,首先要对置信系数的区间估计进行假设,分别进行原假设和备选架设的设置。如果某个数据的集合为一个区间,即可以视其为一个置信区间,也是这个集合的置信系数。
2.时间序列及多元统计。时间序列法与多元统计方法在实际操作中存在较大的差别。时间序列法多用作某段数据的处理中,主要目的是对该段数据中不同数字的出现顺序进行强调。多元统计方法多用于某一时点组成的数据群的处理中。在实际的应用中需要采取时序分析法进行处理计算时首先需要进行相应的模型的构建,以此获得所研究系统的运行状态,通过该模型可以进行系统的控制预测以实现数据质量修正和数据计算控制统计的目标。可以通过数理统计方法的应用进行数据质量的重审。例如在进行人文发展指数的分析中,可以对成人识字率、出生预期寿命及实际人均GDP三相指标的相关数据进行分析,如果发现上述指标存在不协调的地方便可以通过宏观调控进行处理以促进人文发展目标的实现。
3.产品质量控制中应用。方差分析、非参数估计以及总体分布形态判断等常见的数理统计方法的应用越来越广泛,涉及人们工作生活的方方面面。在数理统计支持下的数据分析应用于工业生产中可以进行产品的质量检验控制,促进企业生产水平和整体市场竞争力的提升。现代化企业经营管理及生產工序具有较高的复杂性,通过科学的数据分析可以及时找出企业生产中存在的问题,确保产品生产的质量,维护企业的社会形象。现代化的工业生产中,质量标准的建立和完善对于行业的发展具有重要的作用,因而可以利用数理统计方法进行生产数据的处理分析,通过对研究数据的标准偏差及均值的计算处理,并将其绘制为数据图表等更为直观的表现形式,可以将产品的生产质量准确显示出来,为产品质量影响因素的分析及生产管理措施的调整提供依据。产品质量会对企业的发展产生决定性的影响,为了提高自身的核心竞争力,企业必须要加强产品质量控制,重视数据分析在生产决策制定中的指导性作用,利用数据分析明确不同因素对产品质量的影响规律,通过对产品质量影响因素相关性的分析促进产品质量的提升。
4.保险学中的应用。大数定律是数理统计及数据分析的基础,在保险学中通过数理统计的方差分析、相关与回归分析、假设检验、总体分布形态以及正交设计等方法的应用会实际工作产生显著的影响。在保险学分析中除了需要应用到方差及协方差等数据分析的相关概念,研究人员还需要充分掌握概率论的相关理论,加强切比雪夫大数法则的应用,明确随机游走、域等概念对于概率论的意义。同时在实际的研究分析中发现当承保标数量达到相应的限度时可以实现参与保险人员缴纳保险费用与获赔期望值的平衡。数理统计的应用可以为保险学理论和相关的保险经营提供重要的依据。
5.投资风险中的应用。市场经济的发展推动了金融体系的变革,在各种因素的影响下投资风险越来越高,为了提高投资风险的控制水平,实现风险的有效规避,需要充分发挥数理统计对于投资决策的指导作用。期望值在某些情况下可以对事件的发展趋势进行反映,从股票投资人的角度来看,金融服务人员需要将市盈率、红利等数据作为依据进行相应的数据分析,为投资人的决策提供参考意见,指导后续的投资操作。通过数理统计的应用可以进行对股票市场平均数或者是某个股的数据的对比分析,实现股票价格走势的预判。
6.企业管理决策中的应用。数理统计中的正态概率分布在现代企业经营管理中发挥着重要的作用。当企业的管理者制定某项决策需要以特定应用问题的概率信息内容作为依据时,相关的财务管理人员可以根据该问题创建一个概率分布模型,尽管该方式无法直接向管理者提供决策的参考信息,但是管理者可以通过直观的概率分布情况对不同决策对企业经营发展的影响进行分析,明确管理决策可能造成的风险,降低错误决策的发生。
三、结束语
综上所述,在科学技术进步的影响下,数理统计相关理论日渐完善,分析方法的准确性也随之提升,数理统计在数据分析中发挥着越来越重要的作用,以数理统计为基础的数据分析在现代化企业经营管理中具有重要的指导意义。现代信息技术的发展推动了数据收集处理模式的变革,数理统计的应用对于社会经济的发展有着重要的推动作用。
参考文献:
[1]张学新.数学建模思想与方法融入数理统计课堂教学的研究与实践[J].新疆师范大学学报(自然科学版),2016,(01):63-71.
[2]费绍金,纪燕霞,王丽,等.大数据背景下信息与计算科学专业数理统计课程教学改革与实践[J].高师理科学刊,2017, (10):72-75
上一篇:小概率事件原理及其应用