样本是什么意思?
抽样总体,简称样本,是从全及总体中随机抽取出来,代表全及总体部分单位的集合体。抽样总体的单位数通常用小写英文字母n表示。对于全及总体单位数N来说,n是个很小的数,它可以是N的几十分之一,几百分之一,几千分之一,几万分之一。
样本含义又称子样。按一定方式从总体中抽取的若干个体,用于提供总体的信息及由此对总体作统计推断。用样本对总体作推断时,常利用样本的某个或某些特定的函数,例如样本均值、样本方差、样本极差等。这种不包含总体分布中任何未知参数的样本函数称为统计量,用样本推断总体,常通过统计量来实现。
通常情况下,目标总体是指所研究对象的全部个体构成的集合(即全集),而抽样总体是指从目标总体中抽取的一部分个体所组成的集合(即子集),抽样总体指的就是完全的样本自身。
而抽样总体是目标总体的某些方面或者本身,比如研究某市个体商业经营单位,目标总体就是该市所有个体商业经营单位,而抽样总体可以是营业执照,即可以将该市所有个体商业经营单位的营业执照记录作为抽样总体。
总体:包含所研究的全部个体(数据)的集合。
样本:从总体中抽取出来的,作为总体的代表,由部分单位组成的集合体“例如考察某厂生产的灯泡的使用寿命,该厂生产的所有灯泡的使用寿命为总体,每个灯泡的使用寿命为一个个体,从总体中抽取若干个体(100个)灯泡做实验,这100个灯泡就是样本。”?总体和样本关系:1)样本的单位必须取自总体;2)?一个总体可以抽取多个样本;3)确保样本的客观性与代表性
统计量:? 是统计理论中用来对数据进行分析、检验的变量。从样本推断整体性质,我们通常是通过统计量来推断的,比如上面这个例子我们通过计算100个灯泡的使用寿命平均值推断总体这个工厂生产出灯泡的使用寿命长短。常见的统计量有:样本均值、样本方差、样本矩、样本K阶中心距、样本偏度、样本峰度等分布:在统计分组的基础上,将总体中的所有单位按组归类整理,形成总体单位在各组间的分布。常见的分布类型有:T分布、F分布、卡方分布假设检验(单侧检验和双侧检验):又称统计假设检验,是用来判断样本与样本、样本与总体的差异是由抽样误差引起还是本质差别造成的统计推断方法。对应不同应用场景,服从不同分布形式,对应不同检验:T检验、F检验、卡方检验等。这里先说一下如何提出假设,这里分单侧检验和双侧检验。
举例:考虑某工厂袋装盐的重量(服从正态分布),总体均值为
第Ⅰ类错误和第 II 类错误第Ⅰ类错误(alpha类错误):原假设是正确的,但拒绝了原假设(弃真)
第 II 类错误(beta类错误):原假设是错误的,但没有拒绝原假设(存伪)
以上弃真,存伪都是从原假设出发的。放弃原假设就可能发生”弃真”,接受原假设有可能“存伪”。
这里我们举个简单的例子说明这个问题,假设我们从某个指标一组检测结果判断某个人是否是肝病病人。原假设:健康人,备择假设:肝病病人。那么,当这组数据表明应该拒绝原假设,那么,我们可能会犯第Ⅰ类错误,将健康人误诊为肝病病人(图中**部分)。但是如果我们接受了原假设,认为该人为健康人,我们有可能会犯第II类错误,将肝病病人认为是健康人(图中红色部分),因为有一部分肝病病人该指标的表现和正常人类似,从数据无法判断。
鹏仔微信 15129739599 鹏仔QQ344225443 鹏仔前端 pjxi.com 共享博客 sharedbk.com
图片声明:本站部分配图来自网络。本站只作为美观性配图使用,无任何非法侵犯第三方意图,一切解释权归图片著作权方,本站不承担任何责任。如有恶意碰瓷者,必当奉陪到底严惩不贷!