当前位置:首页 > 培训职业 > 正文

统计学词汇汇总

统计学是研究数据收集、分析、解释和呈现的科学。在统计学中,有一些基本术语和概念是构建理解统计分析的基础。

母体(population)指的是研究或调查中包含的所有个体或对象的集合。样本(sample)则代表从母体中选取的一部分,用以推断母体的特征。

普查(census)是对母体中所有个体的全面调查。抽样(sampling)则是从母体中选取样本的过程,旨在以较小的规模来估计母体的特征。

量的(quantitative)数据可以进行数学运算,如数值数据;质的(qualitative/categorical)数据则描述属性或类别,如性别或颜色。

离散的(discrete)数据只能取有限的值,而连续的(continuous)数据可以取任何值。

母体参数(population parameters)描述了母体的总体特征,而样本统计量(sample statistics)是根据样本计算出的值,用于估计母体参数。

叙述统计学(descriptive statistics)用于总结数据的特征,包括平均数、中位数、众数等。推论统计学(inferential statistics)则用样本信息来推断母体的特征。

衡量尺度(levels of measurement)包括名目尺度、顺序尺度、区间尺度和比例尺度,这些不同的尺度影响了数据的分析方式。

次数分配(frequency distribution)、相对次数(relative frequency)、全距(range)等概念用于描述数据分布。组中点(class midpoint)、组限(class limits)、组界(class boundaries)和组距(class width)则用于数据分组。

累计次数(cumulative frequency)、累加次数(decumulative frequency)、直方图(histogram)、饼图(pie chart)、肩形图(ogive)、多边形图(frequency polygon)、累加次数多边形图(cumulative frequency polygon)、盒须图(box plot)和枝叶图(stem and leaf plot)是数据可视化工具。

中央趋势量数(measures of central tendency),如平均数、中位数、众数,描述数据的中心位置。位置量数(location measures),如百分位数、四分位数、十分位数,提供数据分布的特定位置信息。分散量数(dispersion measures),如全距、四分位距、平均绝对离差、变异数、标准差、变异系数,描述数据的分散程度。

数据的偏斜性描述了数据分布的形状,包括左偏(left-skewed)、负偏(negative-skewed)、右偏(right-skewed)、正偏(positive-skewed)。

列联表(contingency table)用于展示两个或更多类别变量之间的关系。抽样分布(sampling distribution)描述了某个统计量在不同样本中的分布情况。

点估计值(point estimate)、点估计式(point estimator)、不偏点估计式(unbiased estimator)、有效点估计式(efficient estimator)、一致点估计式(consistent estimator)是统计推断中的关键概念。

信赖水准(confidence level)和信赖区间(confidence interval)用于表达对估计值的不确定性。虚无假设(null hypothesis)和对立假设(alternative hypothesis)是假设检验的基本组成部分。

检定统计量(test statistic)、临界值(critical value)用于假设检验,以判断样本数据是否支持或反对虚无假设。

多重随机标签

猜你喜欢文章