資料的型態可以概略分為離散型及不連續型,其中資料屬性是可以用一般的實數來表示,並且任何兩個數值間的段落可以無限的分割成更小的數值,此種變數稱之為連續型資料(continuous data),例如時間、報酬率等;反之則稱為離散型資料(discrete data),例如信用評等的等級。

一般在蒐集資訊之後,為了將所蒐集的資訊進一步量化與處理上方便之因素,我們將資料「數字化」,以作為後續比較與計算的基礎,然而在量化後得到的資料又可分為四種型態,分別為類別尺度、順序尺度、區間尺度及比例尺度等。以名目尺度或順序尺度檢測定性資料;以區間尺度或比率尺度檢測定量資料。


(一)類別尺度(Nominal scale)
又稱名義尺度,使用數字來分辨事物不同的性質或分類,目的僅在說明事物性質間的差異,數字並不代表性質或類別之間的差異大小或形式。如用0、1 代表男性、女性,此時0 與1 之間的目的是為了要區分性別,並不包含特殊的數字意義。又如職業、地區等變數在經過量化後,其中數字僅作為區分類別之用,並無特殊意義。

(二)順序尺度(Ordinal scale)
順序尺度的資料除了可以區分類別之外,尚具備順序的概念,如名次、滿意度、等級等。在這一類的資料中,我們除了可以區分不同類別的資料,也可對於資料進行排序,例如我們可以知道第一名跟第二名之間的差異,除了類別之外,尚有順序的差別。

以上兩種尺度(名義尺度、順序尺度),一般稱為初級測量尺度,兩者差異之處在於有順序的存在。

(三)區間尺度(Interval scale)
在上述的資料尺度中,我們除了瞭解第一名優於第二名,兩者間具有「等級」的概念,但並不知道第一名優於第二名多少,兩者的差距並無法作為衡量與比較的基礎。因此如果在資料尺度中加上差距的標準,如智商、溫度等,則150C 高於100C,兩者差了50C。兩者之間除了順
序的概念之外,並具有相等單位的特性,可衡量之間差異的程度。

(四)比例尺度(Ratio scale)
在區間尺度的資料中,可以瞭解資料間差異的概念,若再加上「倍數」的概念,則就成了比例尺度,例如商品的價格、成交量、報酬率等。我們除了可以說明某甲的身高高於某乙幾公分以外,更可比較兩人身高差異的倍數。在比例尺度中,0 是具有意義的,其所代表的意義為
計算的基礎,即表示變數計算距離時,是以自然原點(natural origin)起算;而在區間尺度中,0 僅為區分的標準,並不具備特殊意義。

以上兩種尺度(區間尺度、比例尺度)又稱高級測量尺度。通常越高層次的資料越不容易獲得,在處理上高尺度的資料可以降階處理,而低尺度的資料則不適合使用處理高尺度資料的方法,這是在資料分析時需要特別注意之處。一般而言,雖然我們可以透過統計套裝軟體處理
複雜的計算過程,得到結果,解釋上也與直覺相符,但若不瞭解資料的基本特性,則很可能發生錯誤的推論,更甚至造成錯誤的決策,這是在分析資料時需要特別注意。

以上資料參考台灣金融研訓院




arrow
arrow
    全站熱搜
    創作者介紹
    創作者 Ashero 的頭像
    Ashero

    ash's not hero

    Ashero 發表在 痞客邦 留言(0) 人氣()