IBM SPSSとは
IBM SPSS Statistics は、統計解析の初心者からプロフェッショナルまであらゆるニーズに応える統計解析のスタンダード・ソフトウェアです。1968 年 にスタンフォード大学の学生たちによって、米国大統領選挙の浮動票を予測するために誕生した SPSS は、社会学や心理学、教育学などの社会科学の分野をはじめ、医学・看護・保健・薬学などの医療分野、消費者行動学や商品開発などのマーケティング分野とさまざまな分野での研究や論文の作成、また授業などでの人材教育に活用されています。
統計解析でよく使う多くの検定や多変量解析の手法を分析メニューに実装しているので、複雑で難解な関数入力やプログラミングの手間はいりません。医療統計によく利用されるロジスティック回帰と傾向スコアや生存分析のカプラン・マイヤー法、Cox 回帰の比例ハザードモデルも実行可能です(一部オプション製品が必要)
基本ソフト
IBM SPSS STATISTICS BASE
IBM SPSS Statisticsのソフトウェア構成の基本となるソフト。基本分析はもちろん、様々なオプションソフトを追加することで必要な分析機能を付加できます。
オプションソフト
目的に応じて、様々なオプションを組み合わせてご利用いただけます。
分析の手法を増やす
分析の精度を高める
表示をグラフィカルに
分析の効率を上げる
予測の分析を行う
マーケティング分析を強化する
Amos
共分散構造分析
IBM SPSS AMOS
パス図をパレット上に描画し、そのまま分析することができるソフトウェア。
コマンドを入力せず、描画ツールを活用して、頭の中にあるモデルをそのまま画面に再現し、多数の候補からデータに最適な構造方程式を採用し分析することが可能です。
※ IBM SPSS AMOS は、IBM SPSS STATISTICS BASE をインストールしなくてもご利用いただけるソフトウェアです。
分析手法で選ぶSPSS製品
基礎集計・記述統計
度数は英語でfrequencyまたはcountといいます。度数分布表はそのカテゴリの値が、どのくらい頻繁に出現するのか、その値の個数を表します。
度数分布表は棒グラフとともに表すことにより、より理解をすることが可能になります。アンケートでの満足度のデータや名義尺度のデータなどが対象となります。
<度数分布が可能なSPSS製品>
統計解析パッケージ「IBM SPSS Statistics Base」
50年以上の歴史を持つSPSS Statistics Baseは、度数分布表の作成も含め、記述統計、推測統計をカンタンに実行可能な統計解析のプラットフォームです。検定・集計関連
なお、SPSS Statisticsでは、各種検定手法を搭載しています。
<検定におすすめのSPSS製品>
IBM SPSS Statistics Base
統計解析のスタンダードツールIBM SPSS Statisticsは、さまざまな検定機能を標準装備しています。<t検定におすすめのSPSS製品>
IBM SPSS Statistics Base
統計解析のスタンダードツール IBM SPSS Statisticsは、t検定もメニューから簡単に分析が可能です。<クロス集計におすすめのSPSS製品>
IBM SPSS Statistics Base
統計解析のスタンダードツール IBM SPSS Statisticsは、クロス集計もメニューから簡単作成IBM SPSS Custom Tables
複雑なクロス集計もウィザード形式により容易に作成可能なIBM SPSS Statisticsのオプション製品。<正確確率検定におすすめのSPSS製品>
IBM SPSS Statistics Base
統計解析のスタンダードツールIBM SPSS Statisticsは、さまざまな検定機能を標準装備しています。IBM SPSS Exact Tests
正確確率検定をはじめ、ピアソンのカイ2乗検定、尤度比検定などに対応のIBM SPSS Statisticsオプション。統計解析手法
回帰分析は、説明変数から目的変数を推定する分析手法であり、予測や制御のために用いられます。
2変数間の変動の傾向を数式により、実データとの誤差が最小になるようにモデル化を行います。
回帰分析というと主に単回帰分析を指し、変数間に直線式を当てはめます。また線型回帰・非線型回帰・ロジスティック回帰などさまざまな種類が存在します。
<回帰分析が可能なSPSS製品>
IBM SPSS Statistics Base
適合度や回帰係数などの回帰分析に関する統計量を出力します。ステップワイズ法により独立変数の選択が可能です。IBM SPSS Regression
非線型による回帰分析が可能です。ロジステック回帰分析を行うことができます。IBM SPSS Advanced Statistics
従属変数に順序尺度をもつロジスティック回帰分析が可能です。IBM SPSS Categories
データに質的尺度を持つ変数による回帰分析が可能です。<ロジスティック回帰分析に対応しているSPSS製品>
IBM SPSS Statistics Base
使いやすさ、解りやすさを追求した統計解析ソフトのスタンダード。統計解析ソフトIBM SPSS Statistics の基本ソフトウェアです。IBM SPSS Regression
複数の値をもつ名義尺度のデータを従属変数とするロジスティック回帰分析を行うことができます。オッズ比などの統計量を出力します。IBM SPSS Advanced Statistics
Statistics Base オプションから、一般線型モデルや対数線型分析など、高度なモデリングオプションを適用することができます。しかし、どんな場合でもノンパラメトリックな検定を用いたほうがよいわけではありません。 パラメトリックな手法を適用できる条件がそろっている場合には、ノンパラメトリックな検定は検出力が低下するため、 パラメトリックな手法を用いたほうが妥当です。
<ノンパラメトリック検定が可能なSPSS製品>
IBM SPSS Statistics Base
統計解析のスタンダードツールIBM SPSS Statisticsは、さまざまな検定機能を標準装備しています。これは、観測者がその事象が起こると考える確率(事前確率)を、その後に観測された事実によって、 より客観的な確率(事後確率)に推定していく方法です。
さらに新しい事実が得られたなら、求めた事後確率を事前確率と考え、新しい事実に基づいて推定を行うことで、 さらに客観的な確率を求めることができます。
統計学では、ベイズ推定が応用されて、ベイズ統計学の代表的な方法になっています。
<ベイズ推定に対応しているSPSS製品>
IBM SPSS Amos
パス図をイメージして共分散構造分析を行うことができます。 探索的にモデルをシュミレーションさせたり、多母集団の比較などを行うことができます。※当製品は、IBM SPSS Statistics Base なしでも稼動します。
線型モデル、重回帰モデル、分散分析モデル、共分散モデルをまとめて一般線型モデルと呼びます。
<一般線型モデルに対応しているSPSS製品>
IBM SPSS Statistics Base
使いやすさ、解りやすさを追求した統計解析ソフトのスタンダード。統計解析ソフトIBM SPSS Statisticsの基本ソフトウェアです。IBM SPSS Advanced Statistics
多変量、反復測定の場合の分散分析を行うことができます。その後の検定や球面性の検定などを行うことができます。GLM一般線型モデル(GLM)を搭載したIBM SPSS Statisticsオプション製品。主に実験の分析において、母集団の平均を同じと考えてよいのかどうかを決定するのに使用されます。 グループを識別する要素が1つの場合を一元配置分散分析と呼び、2つまたは3つ以上の場合をそれぞれ二元配置分散分析、多元配置分散分析と呼びます。
二元配置分散分析、多元配置分散分析では、要素間の交互作用も検討する必要があります。
分散分析(ANOVA)の活用例
・薬剤の時間と量を変えたときの細胞分裂の差(医薬統計)
・品質管理
・学力調査
<分散分析(ANOVA)に対応しているSPSS製品>
IBM SPSS Statistics Base
統計解析ソフトIBM SPSS Statisticsの基本ソフトウェア。グループ間の比較を行います。その後の検定を行い、ペアごとの差の検定も行うことができます。等分散の検定を行うことができます。IBM SPSS Advanced Statistics
多元配置、多変量による分散分析ができるIBM SPSS Statisticsのアドオンオプション。反復測定による分散分析も可能です。IBM SPSS Amos
共分散構造分析のパス図による分散分析モデルを行うことができます。※当製品は IBM SPSS Statistics Base なしでも稼動します。
時系列分析の活用例
・株価の予測
・売上の予測
<時系列分析が可能なSPSS製品>
IBM SPSS Statistics Base
使いやすさ、解りやすさを追求した統計解析ソフトのスタンダード。統計解析ソフトIBM SPSS Statisticsの基本ソフトウェアです。IBM SPSS Forecasting
時系列データ分析において、予測精度の向上を可能にするパワフルツール。<プロビット分析に対応しているSPSS製品>
IBM SPSS Statistics Base
使いやすさ、解りやすさを追求した統計解析ソフトのスタンダード。統計解析ソフトIBM SPSS Statisticsの基本ソフトウェアです。IBM SPSS Regression
ロジスティック回帰、非線型回帰、プロビット分析など、専門的な回帰分析手法をカバーしたオプション。<コレスポンデンス分析が可能なSPSS製品>
IBM SPSS Statistics Base
適合度や回帰係数などの回帰分析に関する統計量を出力します。ステップワイズ法により独立変数の選択が可能です。IBM SPSS Categories
データに質的尺度を持つ変数による回帰分析が可能です。重回帰分析では各説明変数から目的変数への因果関係のみを仮定するのに対し、 パス解析では、変数間に自由に因果関係を仮定して、より複雑なモデルを分析することができます。
<パス解析に対応しているSPSS製品>
IBM SPSS Amos
共分散構造分析のパス図による分散分析モデルを行うことができます。※当製品は IBM SPSS Statistics Base なしでも稼動します。
クラスター分析の活用例
アカデミック
・ブランドの分類
・消費者のセグメンテーション
ビジネス
・ブランドの分類
・アンケート調査におけるイメージワードの分類
・顧客のセグメンテーション
<クラスター分析が可能なSPSS製品>
IBM SPSS Statistics Base
使いやすさ、解りやすさを追求した統計解析ソフトのスタンダード。統計解析ソフトIBM SPSS Statisticsの基本ソフトウェアです。例えば、国語と数学のテストの点数に関連があるか調べるために、散布図を作ったり、相関係数を求めたりします。
一方が大きくなると、もう一方も大きくなる関係を「正の相関がある」といい、 一方が大きくなるともう一方が小さくなる関係を「負の相関がある」といいます。
相関関係の程度を示す相関係数は-1~1の値をとり、絶対値が1に近いほど関係が強いといえます。
相関分析の活用例
・年齢とコレステロールの相関係数が0.78の場合、正の相関があると判断し、それらの間に関係性があることが分かります。
・1日のビールの販売数と気温の相関係数が0.78の場合、正の相関があると判断し、それらの間に関係性があることが分かります。
<相関分析に対応しているSPSS製品>
IBM SPSS Statistics Base
相関係数、有意性の検定をします。順序尺度による相関係数も算出します。 使いやすさ、解りやすさを追求した統計解析ソフトのスタンダード。因子分析の活用例
アカデミック
・学習効果の測定
・心理評価
・アンケート分析
・大規模データの要約 ビジネス
ビジネス
・市場調査分析(アンケート)
・大規模データの要約
<因子分析が可能なSPSS製品>
IBM SPSS Statistics Base
使いやすさ、解りやすさを追求した統計解析ソフトのスタンダード。統計解析ソフトIBM SPSS Statisticsの基本ソフトウェアです。そこで、欠損データに対して、他の変数を利用して欠損部分の予測、置き換えを行うものが欠損値分析です。
欠損データの予測には、観測されたデータから重回帰式を求めて予測する方法や、最尤推定値を求めるアルゴリズムを用います。
<欠損値分析に対応しているSPSS製品>
IBM SPSS Statistics Base
使いやすさ、解りやすさを追求した統計解析ソフトのスタンダード。統計解析ソフトIBM SPSS Statisticsの基本ソフトウェアです。IBM SPSS Missing Values
新データ内にある欠損情報に対して、EM法や回帰手法を使用してデータの置き換えを行います。IBM SPSS Advanced Statistics
従属変数に順序尺度をもつロジスティック回帰分析が可能です。主成分は、持っている情報量の順に第1主成分、第2主成分、…となり、データの持つ変数の数だけ求まりますが、 一般に累積寄与率が0.8を超えるまでの主成分を用います。
主成分分析の活用例
・アンケート分析
・スポーツチームの分析
<主成分分析が可能なSPSS製品>
IBM SPSS Statistics Base
使いやすさ、解りやすさを追求した統計解析ソフトのスタンダード。統計解析ソフトIBM SPSS Statisticsの基本ソフトウェアです。IBM SPSS Categories
データに質的尺度を持つ変数による回帰分析が可能です。潜在変数と観測変数の因果関係を分析できる点から、回帰分析と因子分析を組み合わせた分析手法と考えることができます。 各種の社会現象・自然現象などの因果関係を調べるために用いられます。
共分散構造分析の活用例
・アレルギー疾患調査などの医薬統計
・ブランドイメージの計量化
・消費者行動における潜在意識調査
<共分散構造分析に対応しているSPSS製品>
IBM SPSS Statistics Base
使いやすさ、解りやすさを追求した統計解析ソフトのスタンダード。統計解析ソフトIBM SPSS Statisticsの基本ソフトウェアです。IBM SPSS Amos
パス図をイメージして共分散構造分析を行うことができます。探索的にモデルをシュミレーションさせたり、多母集団の比較などを行うことができます。※当製品は IBM SPSS Statistics Base なしでも稼動します。
コンジョイント分析では、消費者の嗜好を理解することで、製品の属性の重要性と、その属性の最適な水準を見つけ出すことを目的とし、 新商品開発戦略・マーケティング戦略の立案に用います。
コンジョイント分析の活用例
アカデミック
・製品の価格評価
・生産/品質管理
ビジネス
・(新)製品企画と価格決定
・各属性の価格評価
<コンジョイント分析が可能なSPSS製品>
IBM SPSS Statistics Base
適合度や回帰係数などの回帰分析に関する統計量を出力します。ステップワイズ法により独立変数の選択が可能です。IBM SPSS Conjoint
顧客の嗜好をより理解し、最適なマーケティングを支援するコンジョイント分析用 オプション。イベントが再発であっても治癒であっても、単に率を調べるのではなく、 時間の経過の中でどのくらいの割合の患者に起こるのかが問題となります。そのため、イベントの累積発生率をプロットした生存曲線を使って分析を行います。
生存分析の活用例
・薬剤の効果の評価
・クレジットカード会員が1年後に解約する確率を、性別や年齢、年収などの属性データや利用履歴から予測できます。
<生存分析に対応しているSPSS製品>
IBM SPSS Statistics Base
使いやすさ、解りやすさを追求した統計解析ソフトのスタンダード。統計解析ソフトIBM SPSS Statisticsの基本ソフトウェアです。IBM SPSS Advanced Statistics
生存表、生存確率が算出でき、性別などの属性間の比較をグラフで表示できます。よく分析に用いられるものに、値が大きければ信頼性が高いとするアルファ係数があります。
「信頼性がある」というのは、尺度内の項目同士に一貫性があることです。
アンケートの回答者が、同じ尺度内の項目に対して同じような回答(YesやNo)をしていればアルファ係数は大きくなり、 回答のバラツキが大きければアルファ係数は小さくなります。
もし、尺度内の項目と方向性の異なる項目があれば、その項目を削除することで、アルファ係数を大きくすることができ、信頼性を高めることができます。
信頼性分析の活用例
・アンケート項目の検討
<対応IBM SPSS製品>
IBM SPSS Statistics Base
調査データなどの項目尺度の信頼性を分析します。アルファ係数やGuttman、 級内相関係数を算出します。使いやすさ、解りやすさを追求した統計解析ソフトのスタンダード。統計解析ソフトIBM SPSS Statistics の基本ソフトウェアです。IBM SPSS Missing Values
新データ内にある欠損情報に対して、EM法や回帰手法を使用してデータの置き換えを行います。対数線型モデルでは、クロス表のある要素が起こる確率が、他の要素が起こる確率の何倍であるかを求めることができます。 対数線型モデルでは、従属変数と独立変数の区別がないのですが、ある変数を従属変数、その他の変数を独立変数として分析を行うのがロジット分析です。
また、重回帰分析では従属変数と独立変数は量的変数ですが、ロジット分析では、従属変数と独立変数が質的変数(0と1の変数)の場合の分析手法です。
<ロジット対数線型分析を実現するSPSS製品>
IBM SPSS Statistics Base
対数線型モデルとロジットモデルを度数データに適合するIBM SPSS Statisticsのオプション製品。IBM SPSS Advanced Statistics
従属変数が順序尺度の場合のロジスティック回帰分析を行います。データマイニング手法
Two-Stepクラスタ化方法では、最初のステップでクラスタ中心を発見するためにデータを流し 2番目のステップでは、階層クラスタ化方法を使用して、サブクラスタをより大きなクラスタに結合させていきます。Two-Stepクラスタリングには、学習データに最適なクラスタ数を自動的に推定するという利点があります。また、混在したフィールド型を処理でき、大規模なデータセットを効率よく扱うこともできます。
<Two-Stepが可能なSPSS製品>
IBM SPSS Modeler
Two-Stepをはじめ、さまざまなデータマイニング手法と強力なデータ加工機能を搭載。国内実績No.1のデータマイニングツールです。
GRIは、ルールの一般性(範囲)と精度(確信度)の両方を考慮した指標を使用して、ルールと最大の情報内容を抽出します。GRIは、数値入力とカテゴリ入力を処理できますが、対象はカテゴリであることが必要です。
<GRIが可能なSPSS製品>
IBM SPSS Modeler
ビジュアルプログラミングの手法を用いることにより、データマイニングのプロセスを視覚的に捉え、高度で素早い分析環境を提供します。保持できるルール数に特に制限はなく、また、最大32の前提条件を持つルールを処理できます。
Aprioriでは、入力フィールドと出力フィールドのどちらもシンボル型のデータしか扱えませんが、 両方で同じデータセットを扱っている場合には、より効率的かつ高速のパフォーマンスを実現できます。
<Aprioriを実現するSPSS製品>
IBM SPSS Modeler
Aprioriをはじめ、さまざまなデータマイニング手法と強力なデータ加工機能を搭載。国内800社に利用されている1データマイニングツールです。
データマイニングにおけるデシジョンツリー分析は、 対象データ全体を最もよく分類できる変数を探索するアルゴリズムによって、データを分類していきます。
主なアルゴリズムにC&RT、C5.0、CHAIDなどがあります。
デシジョンツリーの活用例
・離反顧客の予測
<決定木に対応しているSPSS製品>
IBM SPSS Statistics Base
使いやすさ、解りやすさを追求した統計解析ソフトのスタンダード。統計解析ソフトIBM SPSS Statisticsの基本ソフトウェアです。IBM SPSS Decision Trees
CHAID、C&RT、QUESTなどを搭載するIBM SPSS Statisticsのアドオンオプション。IBM SPSS Modeler
判別やセグメントのルールを算出できます。ルールを元に予測結果を算出します。ゲインチャートやリフトチャートを作成します。