問題のある回答の確認と対応

 紙の調査票で実査を行った場合、調査票上に記された回答はコンピュータで分析するための電子データに変換する。このデータ入力を正確に、スムーズに遂行できるように、判読しにくい文字や数字、選択肢の○印などは、正確な回答(回答者が記入しようとした回答)がはっきりとわかる場合は修正し、明確化させる。誤字についても、それ自体がデータとなるような調査でない限り訂正する。
 回答の記入方法の誤りや不明瞭さも修正が必要である。例えば選択肢から一つだけ選ぶ形式の質問で、二つ以上選択している場合や、どちらを選択しているかはっきりしない形で○印が書かれている場合である。ほかの質問への回答などから確実に判断できる場合は正しい回答に修正する。例えば最終学歴で「高校卒」と「大学・大学院卒」のどちらが選択されているか不明瞭であっても、別の質問で大学卒業が要件となっている教員免許をもっていることがわかれば、「大学・大学院卒」と判断できる。また、具体的な数値で記入を求める質問に対して、「約20人」「40〜50人」といった回答がなされることがある。このままでは数値として扱えないため、「約20人は約を取り除いて20人とする」「40〜50人と幅がある場合は、中央値をとり45人とする」など、何らかの基準を設け、修正していく。
 論理的に矛盾する、あるいは論理的に成立しにくい回答(論理エラー)についても、確認と対応が必要である。性別を尋ねる質問の後、女性に対してのみ出産経験の有無を尋ねる質問に、男性で出産経験ありと回答するような場合である。どちらかの回答に誤りがある可能性が高い、ほかの質問への回答を精査することで正しい回答を突き止めることができる場合は修正する。回答の記入方法の誤りにせよ論理的に成立しにくい回答にせよ、調査票のほかの回答を吟味しても明確な判断を下せない場合は、無回答とするなど、欠損値として扱わざるを得ない。

回答がない個所の確認と有効票の確定

 選択式の質問でいずれの選択肢にも○がついていない。回答欄が空白になっているなど、回答がない個所についても確認が必要である。回答なしには非該当と無回答がある。上述の性別と出産経験についての質問で。男性回答者が女性を対象とする枝分かれ質問である出産経験の有無について回答していないのは。調査票の設計どおりであり。これを非該当という。一方、女性が出産経験の有無に回答していない場合は。調査者としては回答してほしい質問に回答がないのであり。非該当とは区別して無回答(NA=No Answer)という。無回答には、答えたくない(回答拒否)。回答者自身答えがわからない(DK=Don’t Know)、単なる記入忘れなど、さまざまな場合がある。非該当の項目には×印をつけ、無回答の項目には「NA」と朱書きするなど、非該当と無回答は明確に区別する必要がある。
 エディティングの過程を通して、調査票全体の判断も行う。分析に使うことができない調査票(無効票)を除外し、分析に用いることのできる調査票(有効票)を確定するのである。無回答だらけでほとんど白紙の調査票、調査の核となる質問が無回答である調査票は分析には使えない、また、ほとんどの質問で同じ選択肢番号を選んでいる、選択肢の選び方に不自然な規則性がある、矛盾する回答だらけであるといった調査票も、調査者からすると不真面目な回答と判断せざるを得ず、分析には使えない。こうした分析に使うことができない調査票は無効票とする。無効票はその旨を表紙に明記したうえで有効票とは分けておく。また、調査票の設計どおりに回答していても、世帯主対象の郵送調査で配偶者が回答するといった代理回答がなされている調査票も無効票とする。訪問面接調査や留置調査などで調査員によるデータの捏造(メイキング)が判明した場合についても、その調査票は無効票とする。有効票が確定すれば、調査の回収率(有効回収率)を計算することができる。


妻木進吾,2014,「データの整理 エディディング」社会調査協会編『社会調査事典』丸善出版,184-5.