.
;.
概率與統計
一、統計
1
.三種抽樣方法的比較
類別
共同點
特點
相互聯系
適用范圍
簡
單
隨
機
抽樣
①抽樣過程中每
個個體被抽到的
可能性相等;②
每次抽出個體后
不再放回,即不
放回抽樣
.
從總體中逐個抽
取
.
總
體
個
數
較少
.
系統抽樣
將總體平均分成
幾部分,按預先
制定的規則在各
部分中抽取
1
個
個體
.
系統
:
在
起始
部分
取樣時,
采
用
簡
單
隨
機抽樣,
其余
部分等距抽。
分層
:
各層抽
樣時,
采用簡
單
隨
機
抽
樣
或
系
統
抽
樣
(
層
的
容
量
大
時
可
用
系
統抽樣)
.
總
體
個
數
較多
.
分層抽樣
將
總
體
分
成
幾
層,按各層個體
數之比抽取
.
總體由差
異
明
顯
的
幾
部
分
組
成
.
2
.常用的統計圖表:一“表”
(頻率分布表)
;兩“圖”
(頻率分布直方圖和莖葉圖)
(1)
頻率分布直方圖
①小長方形的面積
=
組距×
頻率
組距
=
頻率;
②各小長方形的面積之和等于
1
;
③小長方形的高
=
頻率
組距
,所有小長方形的高的和為
1
組距
.
【注意】
直方圖的縱軸(小長方形的高)一般是
頻率除以組距的商(而不是頻率)
,橫軸一
.
;.
般是
數據的大小
,小長方形的面積表示頻率.
(2)
莖葉圖
在樣本數據較少時,用莖葉圖表示數據的效果較好.
3
.用樣本的數字特征估計總體的數字特征
(1)
眾數、中位數、平均數
數字特征
樣本數據
頻率分布直方圖
眾數
出現次數最多的數據
取最高的小長方形
底邊中點
的橫坐標
中位數
將數據
按大小依次排列
,處
在最中間位置的一個數據
(或
最中間兩個數據的平均數)
把頻率分布直方圖劃分成
左
右兩個面積相等
的
分界線與
x
軸交點的橫坐標
平均數
樣本數據的
算術平均
數
每個小長方形的面積
乘以小
長方形
底邊中點的橫坐標
之
和
(2)
平均數
1
2
1
(
)
n
x
x
x
x
n
?
?
?
????
.
方差
2
2
2
2
1
2
1
[(
)
(
)
(
)
]
n
s
x
x
x
x
x
x
n
?
?
?
?
?
????
?
.
標準差
2
2
2
1
2
1
[(
)
(
)
(
)
]
n
s
x
x
x
x
x
x
n
?
?
?
?
?
???
?
?
.
【提醒】
標準差、方差越大,數據的離散程度越大,越不穩定.
4
.變量間的相關關系
知識點分析
1
、線性回歸方程:
a
x
b
y
?
?
?
?
?
(
x
叫做解釋變量,
y
叫做預報變量)
線性回歸方程系數公式:
(
公式說明:
回歸直線過樣本的中心點
)
(
y
x
,
,
也就是平均值點
)
2
、相關系數公式