実験の結果や調査結果など様々なデータを分析(解析)することは日常的に行われています。表やグラフにした分析が代表的なものですが、それらの中にも様々な種類があります。そこで、今回はデータ分析における5大解析手法について書いてみたいと思います。
【比較分析】
最も基本的で、かつ、代表的な分析方法です。データAとBの違いを可視化するものであり、定量的比較だけでなく定性的な視点でも用いられます。基本は大小関係を比較するものですが、単純な数値的比較だけでなく、信頼性などより定性的な観点でも行われます。ただし、いずれの場合も基本は何らかの形で数値化することになります。ただし、いくつか気を付けなければならないことがあります。まず、比較するもの同士が直接比較できるのか、それとも何らかの換算が必要かということです。全く単位系の異なる物を直接比較しても意味のある結論は得られません。また、何を比較基準にするかということも重要です。
【変化分析】
実験結果の解析で最も多く用いられる分析手法であり、傾向分析と呼ばれることもあります。時間、温度、濃度など様々な実験パラメータ―に対して、指標となる注目パラメーターがどのように変化するかを解析するものです。通常はグラフを用いて可視化して解析が行われます。この分析で重要なことは、軸の取り方です。関係性を持ったパラメーターを軸に選ばなければ、単なるランダムプロットになって何も解析できないということになってしまいます。また、軸がリニアで良いのか、それとも対数軸が適当かなどという意味での軸の取り方も重要です。
【分布分析】
ヒストグラム分析とも呼ばれるもので、通常は3つ以上のデータセットに対して行われます。いわゆるヒストグラムグラフを用いて直接数値で解析が行われることもあれば、割合に換算して円グラフを用いて視覚化するなどの方法も用いられます。この分析で気を付けることは、分布分析同士の比較を行う時です。特に円グラフで示した分布分析の場合には割合となっているので、母数を合わせるなどの工夫をしないと絶対値が全く異なってしまうので間違った解析をしてしまうことがあります。
【相関分析】
複数のパラメーターの関係を解析する手法です。変化分析と似ていますが、変化分析がパラメーターAに対するパラメーターBの変化の解析、すなわち、増減などを解析するのに対して、相関解析はその前段階と言える、そもそも関係性があるのかという所からスタートして、どのような関係があるのかを解析します。変化分析に比べると、若干複雑な数学的処理が必要なりますが、一見しても分かりづらい埋もれた傾向を可視化する場合などに有効です。
【セグメント分析】
データ集合を何らかの視点でグループ(セグメント)に分けたうえで、セグメント同士を比較するなどの解析を行います。マーケティングなどの分野で良く使われています。
細かく分ければ、まだまだ種類はありますが代表的なものとしては以上のようなものになります。
技術コンサルティング、人材育成はジャパン・リサーチ・ラボにご相談ください。