第三章:敘述統計 I列表法與圖示法

( Descriptive Statistics ITabular and Graphical methods )

本章內容包含:

3.1 計質資料(qualitative data)分析法概述

    資料或變數可分為計質與計量兩種。計質資料是指由諸如政黨(國民黨、民進黨、新黨)、宗教(佛教、道教、天主教、基督教、回教)或性別(1=男、2=女)等所組成的計質資料,資料可以是數字的也可以是非數字的。當資料是非數字的,通常直接用名稱(names)或稱呼(labels)代表每個元素所屬類別;當資料是數字的,如1代表男生、2 代表女生,這些數字本身沒有數量的意義,1、2 也只代表所屬類別而巳。

     若資料是計質資料時,我們可用下面這些圖表法來概述資料:

1. 次數分配表(frequency distribution table)

2. 相對次數分配表(relative frequency distribution table)

3. 長條圖(bar graph)

4. 單圓圖(pie chart)

     當應用在計質資料時,次數分配表是由資料的類別及其對應的次數(frequencies)所組成,而相對次數分配表則需先將各類別的出現次數除以總次數得到相對次數(relative frequencies)再由資料的類別及其對應的相對次數所組成。有了次數分配表,我們可以知道每一類別出現的次數,由相對次數分配表,我們可以知道每一類別出現的比例或百分比。而長條圖主要就是將次數分配表用條狀圖形來表示之,每一長條,代表一種類別,長條的長度代表類別出現的次數。而單圓圖主要就是將相對次數分配表用圓形圖來表示,圖依類別分割成很多塊,每一塊的大小代表每一類別出現的百分比。

3.2 計量資料(quantitative data)分析法概述

     計量資料是指由計數(counting)或測量所得的數字所組成的數量資料,如收入、身高、體重、家庭小孩數…等。計量資料一定是數字的,而且這些數字有數量的意義。 若資料是計量資料時,我們可用下面這些圖表法來概述資料:

1. 次數分配表(frequency distribution table)

2. 相對次數分配表(relative frequency distribution table)

3. 莖葉圖(stem and leaf display)

4. 直方圖(histogram)

     當應用在計量資料時,次數分配表是由數值的組別與其對應的次數(frequencies)所組成,而相對次數分配表則需先將各組出現的次數除以總次數得到相對次數(relative frequencies) ,再由組別與其對應的相對次數所組成。有了次數分配表,我們可以知道資料的分佈情形,落在每一組的次數。而由相對次數分配表,我們可以知道資料落在每一組的比例或百分比。而直方圖主要就是將每組對應的相對次數或比例用圖形表示之。而莖葉圖則是另一種呈現資料分配的方法。先將資料由小到大排好,各數值的最右邊的數字作為葉(leaves),另外的部分為莖(stem) ,再將莖的部份由上到下由小到大垂直排好,再畫一垂直線,最後將葉子按大小歸入所屬莖類別內。

3.3 如何使用SPSS來作計質資料的分析

為了使大家更容易了解如何使用SPSS來做計質資料的分析,我們將使用下面的例題作示範:

美國人最愛的飲料是什麼?今日心理雜誌社(198810月)提供了有關牛奶(M)、果汁(F)、清涼飲料(S)、啤酒(B)與礦泉水(C)的消費量資料。該社隨機訪問30人,要求他們選擇最常喝的飲料,結果如下:

M   F   S   S   B   S   C   M   M   S   S   S   F   B   B

S   B   S   M   S   M   F   S   S   C   B   S   F   S   B

1. 建立飲料的次數分配與相對次數分配表。

2. 建立飲料的長條圖(Bar graph)。

3. 建立飲料的單圓圖(Pie chart)。

4. 根據此樣本,美國人最愛的飲料為何?

  1. Data下選擇Define VariableVariable Name輸入drink。
  2. Change settingLabelsVariable Label輸入drink
  3. 接著輸入Value   1 Value Labelmilk Add

    再接著輸入Value2 Value Labeljuice Add

    再接著輸入Value3 Value Labelsoft drink Add

    再接著輸入Value4 Value Labelbeer Add

    再接著輸入Value5 Value Labelmineral water Add。

  4. 完成後按Continue。
  5. 再按OK然後輸入資料輸入時不是輸入英文字母而是輸入數字M輸入1F輸入2S輸入3B輸入4C輸入5資料輸入完後如下
 

drink

1

1

2

2

3

3

4

3

5

4

6

3

7

5

8

1

9

1

10

3

11

3

12

3

13

2

14

4

15

4

16

3

17

4

18

3

19

1

20

3

21

1

22

2

23

3

24

3

25

5

26

4

27

3

28

2

29

3

30

4

  1. Statistics下選擇Summarize再向右選Frequencies」。
  2. 在左上角按變數drink再按「 」,drink移至右方的Variable(s):」方格內並    選取Display frequency tables。
  3. 在下方按Format…,Order by下選取Ascending valuesPageFormat下選取Standard。
  4. 完成後按Continue。
  5. 再按OK即得到下面的次數分配與相對次數分配表
  6.                                                 
                                               Valid      Cum
    Value Label    Value  Frequency  Percent  Percent  Percent
    
    Milk              1         5      16.7     16.7      16.7
    Juice             2         4      13.3     13.3      30.0
    Soft drink        3        13      43.3     43.3      73.3
    Beer              4         6      20.0     20.0      93.3
    Mineral water     5         2       6.7      6.7     100.0
          
                            -------  -------  ------- 
                     Total     30     100.0     100.0
    

  7. 報表中最後一行Cum Percent 代表累積的百分比
  1. Graphs下選擇BarSimple」,再按Define。
  2. 在左上角按變數drink再按「 」,drink移至右方的Category axis:」方格內
  3. 在右下角按Titles…, Line 1中輸入Bar graph of drink完成後按Continue。
  4. 再按OK即出現Bar graph
  1. Edit對圖形作編輯。
  2. Attributes下選Bar Label Style」,再選Framed (目的是要將次數印在長條圖上) Apply All再按Close

c. 要使,軸及上方的標題對中,只要在標題上用滑鼠按二下,等出現Title JustificationCenter再按OK即可。完成後的Bar graph如《圖3.3-1》。

ch3agraph1.jpg (24075 bytes)

  1. Graphs下選擇Pie,按Summaries for groups of cases」。
  2. 再按DefineSlices Represent」,中選取 % of cases
  3. 在左上角按變數drink再按「 」,drink移至右方的Define
  4. Slices by方格內

  5. 在右下角按Titles…,Line 1中輸入Pie chart of drink完成後按
  6. Continue

  7. 再按OK即出現Pie chart
  1. Edit對圖形作編輯。
  2. Chart下選Options」,Labels內選TextPercents (目的是要印出單圓圖的每一部份所代表的類別與所佔的百分比)。
  3. Chart下選Outer Frame」,將圖形加外框。
  4. 再按OK即完成Pie chart3.3-2》。

ch3agraph2.jpg (24733 bytes)

 

《圖3.3-2

3.4 如何使用SPSS來作計量資料的分析

下述資料是在一個月期間,某診所的病人在急診室的等候時間(單位:分鐘):

2  5  10  12   4  4  5  17  11  8

9  8  12  21  6  8   7  13  18  3

利用組別0-45-910-1415-1920-24回答下面問題。

1. 建立次數分配與相對次數分配表。

2. 建立直方圖(histogram)

3. 有多少比例的急診病人的等候時間不多於9分鐘?

4. 建立莖葉圖(stem and leaf display)

  1. Data下選擇Define Variable…,然後在Variable Name:中輸入time
  2. Change Settings方格內按Labels…,然後在Variable Labels:中輸入time
  3. 完成後按Continue
  4. 再按OK然後輸入資料資料輸入完後如下

 

 

time

1

2

2

5

3

10

20

3

  1. Transform下選擇Recode再向右選Into Different Variables…」。
  2. 在左上角按變數time再按「 」,time移至右方的Input VariableOutput Variable:方格內
  3. 在右邊Output VariableName:下輸入groupChange
  4. 再按Old and New Values…,Old Value中選取Range:且輸入 0 through 4 然後在New Value中選取Value:且輸入1在下方按Add
  5. 同理,在Range:輸入 5 through 9 Value:輸入2Add
  6. Range:輸入 10 through 14 Value:輸入3Add

    Range:輸入 15 through 19 Value:輸入4Add

    Range:輸入 20 through 24 Value:輸入5Add

  7. 完成後按Continue再按OK這時資料視窗出現:
 

time

Group

1

2

1

2

5

2

3

10

3

4

12

3

20

3

1

  1. 在資料視窗中的變數group上按一下。
  2. Data下選擇Define Variable
  3. Change Setting內輸入group接著輸入
  4. Value: 1 Value Label: 0-4 Add

    Value: 2 Value Label: 5-9 Add

    Value: 3 Value Label: 10-14 Add

    Value: 4 Value Label: 15-19 Add

    Value: 5 Value Label: 20-24 Add

  5. 完成後按Continue再按OK

a. 在Statistics下選擇Summarize再向右選Frequencies」。

b. 在左上角按變數group再按「 」,group移至右方的Variable(s):方格內。並選取Display frequency tables

c. 在下方按Format…,Order by中選取Ascending valuesPageFormat下選取Standard

d. 完成後按Continue

  1. 再按OK即得到下面的次數分配與相對次數分配表。
  2. GROUP group                                                
                                              Valid      Cum
    Value Label    Value  Frequency  Percent  Percent  Percent
    
    0-4              1         4      20.0     20.0      20.0
    5-9              2         8      40.0     40.0      60.0
    10-14            3         5      25.0     25.0      85.0
    15-19            4         2      10.0     10.0      95.0
    20-24            5         1       5.0      5.0     100.0
          
                            -------  -------  ------- 
                    Total     20     100.0    100.0
    

  3. 報表中的最後一行Cum percent 代表累積的百分比。
  1. >Graphs下選擇Histogram…。
  2. 在左上角按變數time再按「 」,time移至右方的Variable:方格內

   c.在下面選擇Display Normal Curve

   d.在右下角按Titles…,Line1:中輸入Histogram of time完成後按Continue

   e.再按OK即出現histogram

  1. Edit對圖形作編輯。
  2. Chart下選Axis再按Interval然後按OK
  3. Title Justification:內選Center
  4. Intervals內按Custom再按Define…,# of intervals改為5RangeMinimum改為0Maximum改為25Continue再按OK
  5. y軸的數字上快速按滑鼠兩下進入Scale Axis對話盒內Axis Title:內輸入relative frequencyTitle Justification:內選Center再到右下角按Labels進入下一個對話盒Decimal Places:改為1y軸的坐標印列小數點一位)Scaling Factor:改為20y軸的坐標除以20再按Continue完成後再按OK
  6. 在標題Histogram of time上,用滑鼠快速按兩下Title Justification:內選Center
  7. 即完成histogram《圖3.4-1

ch3agraph3.jpg (28739 bytes)

《圖3.4-1

  1. Statistics下選Summarize」,再向右選Explore…」。
  2. 按變數time再按「 」,time移至右方的Dependent List:方格內
  3. 在左下角Display方格內按Plots再到右邊按Plots…。
  4. Box plots下按NoneDescriptive下選Stem-and-leaf完成後按Continue
  5. 再按OK即在Output視窗中得到下面的莖葉圖

 

TIME

Valid cases: 20.0 Missing cases: .0 Percent missing: .0

Frequency        Stem   &  Leaf

4.00                    0 *               2344

8.00                    0 .                 55678889

5.00                     1 *                01223

2.00                    1 .                 78

1.00                    2 *                1

Stem width:     10.00

Each leaf:         1 case(s)

3.5 練習

1. The following data indicate the country of origin of each of the top 40 corporations in Fortune magazine's Global 500 with the highest 1995 revenues.

Japan  Japan  Japan  U.S.  Japan  Japan  U.S.  Japan  U.S.  Netherlands

Japan  U.S.  Japan  Japan  Japan  U.S.  Germany  U.S.  Japan  U.S.

Japan  U.S.  Japan  Germany  Germany  Japan  Britain  Switzerland  U.S.  U.S.

U.S.  Japan  Japan  S.Korea  Japan  Japan  Japan  Netherlands  Switzerland  Japan

定義變數輸入資料Statistics下選Summarize」,再向右選Frequencies產生報表再回答(a)(b)的問題

(a) Prepare a frequency distribution table for these data.

 

 

 

 

(b) Calculate the relative frequency and percentage distributions.

 

 

 

 

 

 

Graph下選Bar及在Graph下選Pie」,並依循前面講義的指令即可得到Bar graphPie chart再回答(c)(d)的問題

(c) Draw a bar graph for the frequency distribution and a pie chart for the percentage distribution.

 

 

 

 

 

 

 

 

 

 

 

(d) What percentage of these corporations are from the United States?

 

2. The following data give the weekly expenditures (in dollars) on fruit and vegetables for 30 households randomly selected from the households who incurred (受、招致) such expenses.

4.57   3.95   6.95   3.80    1.50   2.99   7.84   5.05

        8.00   14.75  9.33   1.05   5.08   7.00    9.60  18.99

        9.15   11.32  4.75   9.95   3.63   1.99    1.39  13.09

        31.1  1.15     7.73  12.00  7.58   16.35

定義變數,輸入資料,再將資料分組,分組講用0-4.5, 4.5-9.5, 9.5-14.5, 14.5-19.5為組界。根據前面講義的方法,得到必需的報表與圖形,再回答下面的問題。 

(a) Construct a frequency distribution table.

 

 

 

 

(b) Calculate the relative frequencies and percentages for all classes. (答案放在(a)的部分)

(c) Construct the cumulative percentage distribution. (答案放在(a)的部分)

(d) Draw a histogram for the frequency distribution.

 

 

 

 

3. The following are the scores of 30 college students on a statistics test.

75 52 80 96 65 79 71 87 93 95

69 72 81 61 76 86 79 68 50 92

83 84 77 64 71 87 72 92 57 98

Construct a stem-and-leaf display. (請用SPSS)

 

 

 

3.6 Homework

1. The mental health clinic of a university uses the following codes for the main types of problems that bring students in for assistance:

A. General anxiety

B. General depression

C. Sexually related problems

D. Alcohol or drug-related problems

E. Problems of social adjustment

F. Family problems

G. Other problems

During 1 day, 54 students visited the clinic, and the classifications used were as follows:

A  B  B  E  B  D    B  C  E  B  B  A  C  F  D  G  G  D

G  A  G  A  F  G  B  B  B  G  G  G  G  G  B  D  B  B

F  B  G  C  C  F  E  G  B  G  G  B  B  B  D  G  A  B

(a) Construct a frequency distribution showing the numbers receiving each code.

 

 

(b) Draw a bar graph for the following distribution.

 

 

(c) Draw a pie chart.

 

 

 

 

2. The following data represent weights of 78 boys in junior high school.

122

122

110

118

120

111

117

122

107

127

146

113

116

119

108

118

127

116

114

118

153

125

138

126

110

117

148

119

133

113

109

112

134

125

134

106

107

108

140

119

128

118

105

117

108

124

144

115

103

117

126

120

132

119

102

126

103

121

137

133

134

123

136

128

136

148

126

118

112

116

146

137

123

113

118

127

152

124

(a) Construct a histogram for the weight.

 

 

 

 

 

(b) Construct a stem-and-leaf display for the weight.

 

 

 

 

  

(c) Describe the shape of the distribution of the weight.