データの見方

SPSS形式の画面を利用しながら、JILPTのアーカイブデータの内容について、具体的に説明します。(参考:データクリーニング

データビュー

各設問に対して、各回答者がどのように回答したかが分かる画面のことです。数値自体を回答する設問の場合(例:「あなたは1週間に何時間仕事をしていますか」)は数値を入力し、選択肢の中から選ぶ設問の場合(例:「あなたの働き方の勤務先での呼び名は次のどれですか」)はその選択肢の番号が入力されています。

(図1 データビューの例) 画像クリックで拡大

図1 データビューの例(クリックで拡大)

変数ビュー

各設問の情報(設問の内容、回答する選択肢の内容、欠損値の定義等)が分かる画面のことです。

(図2 変数ビューの例) 画像クリックで拡大

図2 変数ビューの例(クリックで拡大)

変数名

調査票の設問番号を記述している部分で、SPSS形式のデータ上では、「名前」と表示されています。

変数ラベル

調査票の設問内容を記述している部分で、SPSS形式のデータ上では、「ラベル」と表示されています。

値ラベル

「各設問に対する選択肢」ごとに選択肢の番号とそれに対応する内容を記述している部分で、SPSS形式のデータ上では、「値」と表示されています。

無回答

無回答の扱いは、カテゴリ変数では原則として「9」ないし「99」…の値が付されています。「無回答」の値の実際の桁数は、設問の内容により変化します。例えば、選択肢が9個ある設問の場合は、無回答は「99」の値が付されています。スケール変数では原則として (1)カテゴリ変数と同様に「9」ないし「99」…の値が付されていて、かつ「無回答」は欠損値指定されているもの (2)システム欠損値となっているもの――の2通りがあります。

なお、多重回答となる設問に対する無回答の扱いは、多重回答グループの最後に、無回答変数を設けています。(多重回答参照)。

非該当

設問内容により論理的に回答が行われない場合のことです。

(例)論理的に回答が行われない場合とは、次のような場合が考えられます。

問1:あなたは20歳以上ですか。

付問1:問1で「はい」を選んだ人のみ回答してください。あなたはふだんお酒を飲みますか。

問1で「いいえ」「無回答」の人は付問1で回答するのは、論理的に正しくないので、この場合は付問1の回答を非該当として扱います。

非該当の場合はデータを入力せず、システム欠損値となっています。

多重回答

該当する選択肢を複数選ぶような設問のことです。多重回答の場合は、変数名の末尾に「_ma」が入っています。値ラベルには0=「非選択」、1=「選択」が設定されており(図3参照)、多重回答の当該選択肢を選んだ場合は「1」、選んでいない場合は「0」が入っています(図4参照)。

多重回答変数の最後に設けられた無回答変数(変数名の末尾に「_na」を付けた変数)の値ラベルも0=「非選択」、1=「選択」が設定されており(図3参照)、一連の選択肢を全て選ばなかった場合(無回答の場合)は「1」、いずれかの選択肢を選んだ場合は「0」が入っています(図4参照)。

(図3 変数ビュー) 画像クリックで拡大

図3 変数ビュー(クリックで拡大)

(図4 データビュー) 画像クリックで拡大

図4 データビュー(クリックで拡大)

欠損値

集計から除かれる数値のことです。例えば「無回答」を除いたデータを集計したい場合は、欠損値に「9」(無回答)を指定することにより(図6参照)、「無回答」を除いたデータを集計することができます。

(図5) 画像クリックで拡大

図5(クリックで拡大)

スケール変数とカテゴリ変数

スケール変数とは、回答者の記入した数値がそのまま入力されている変数のことです。

カテゴリ変数とは、変数の値をいくつかのカテゴリに分けて、特定の数値を使って表わす変数のことです。

カテゴリ変数は、その内容により (1)もともとカテゴリ変数であるもの (2)スケール変数を一定の区分で分類してカテゴリ変数に変換したもの (3)当初のカテゴリ変数の括り方を変えて再編成したもの―の3種類があります。また、カテゴリ変数はその数値の大小に意味があるかないかで、順序変数(例:年齢のカテゴリ)と名義変数(例:男女のカテゴリ)に分かれます。