2019.12.05
記述統計とは
記述統計とは・・・ データの傾向や性質を知る方法のことで、度数分布(ヒストグラム)、平均、中央値、最大値、最小値、最頻値、分散、標準偏差などがあります……
公開日:2022.11.15
「デシジョンツリー分析(決定木分析)」とは情報を樹形図のかたちに整理・分析して、情報がどのような構造を持っているかを視覚的に表現する分析手法です。
世の中にはとても多くのデータがあふれています。私たちがそのデータを上手に活用するためには、自分の知りたいことが分かるようにデータを整理しなければなりません。例えば、みなさんが自社商品をPRするために、SNSで情報発信することを考えたとします。そこで、候補となるSNSの利用率を調べてみました。
SNS | 全年代利用率 |
T | 42.3% |
I | 42.3% |
F | 31.9% |
この情報を見る限りでは、TとIが同じ利用率で、Fが若干利用率が下がるということが読み取れます。ですが全年代ではあまりにもカバーしている範囲が広すぎて、それぞれのSNSにどのような特徴があるかを把握できません。もし、得られる情報が全年代だけでなく、「性別」「年代別」など利用者の特徴が把握しやすい情報でより細かく分類できると、SNSごとのユーザー層をより鮮明に把握できます。そこで先ほどの情報に、年代ごとの利用率を加えてみました。
SNS | 全年代利用率 | 10~20代 | 30~40代 | 50代~ |
T | 42.3% | 73.7% | 43.2% | 21.6% |
I | 42.3% | 68.6% | 47.2% | 22.1% |
F | 31.9% | 26.4% | 43.5% | 23.4% |
「全年代利用率」では42.3%の利用率だったTとIは10~20代の利用率が非常に高いものの、30代以降であればFと大きな違いがないことが認識できました。このようにデータをある要因によって分類すると、より詳しい状況が得られデータの裏側にある仕組みや構造をとても理解しやすくなります。
それらのデータがどのような構造を持っているかを把握し、視覚的に表現する分析手法が「デシジョンツリー分析(決定木分析)」です。
顧客満足度調査( CS 調査)の調査票作成のポイント【テンプレート付】 無料ダウンロードはこちら>
デシジョンツリー分析(決定木分析)は、データをツリー構造によって階層分けして、データの持つ構造を把握します。例として、SNS Iのデータからデシジョンツリーを作成してみましょう。
データの内容は表と同じものですが、かなり理解しやすくなったのではないでしょうか。このように「利用している」「利用していない」という判断結果を一つの基準にして、要因をデシジョンツリー分析すると、SNSの利用にどの要因が大きく関係しているのかを視覚的に理解できます。
それでは、デシジョンツリー分析の活用方法を考えてみましょう。例として、SNSの中から「全年代利用率」が同じであった、TとIのデシジョンツリーを作成してみましょう。
SNS Tは10~20代の利用者がとても多くなっていますが、性別による差はほとんどありません。
一方、SNS Iも10~20代の利用者が多いのですが、女性の利用率が男性を大きく上回っています。この結果を用いれば、同じ全世代利用率であっても、10~20代女性を狙うのであればSNS I、10~20代男性を狙うのであればSNS Tの方が適していると判断できます。
デシジョンツリー分析を活用すれば、以下のようなことを調べられます。
デシジョンツリー分析することを前提にアンケート設計を行えば、より効果的な分析が期待できるでしょう。
アンケートなどの調査データをデシジョンツリー分析することで、以下のようなメリットが発生します。
人の脳は基本的に、映像などのビジュアルを認識するのは得意ですが、文字や数字などを理解するにはかなりの労力を要します。これはアンケートの集計結果も同じで、文字や数字よりもビジュアルで結果表示した方が、多くの人に理解されやすくなります。デシジョンツリー分析を用いれば、多くの文字や数字情報を整理してビジュアル化できます。それにより、どの要因のどの数字が重要なのかを説明される側がすぐに理解でき、内容への同意も得やすくなります。
アンケート等で扱う数値データの大部分は、デシジョンツリー分析に利用できます。また、文字などのテキストデータであっても、
という分類コードを付け加えれば、デシジョンツリー分析が可能です。
デシジョンツリー分析は目的変数を基礎として、要因を階層分けします。アンケート設計を行う際は、この目的変数となる質問を明確にすることが大切です。
上記のように、どの質問を目的変数としてデシジョンツリー分析するかを、事前にしっかりと検討しましょう。
デシジョンツリー分析は、その分析目的によって用いるデータ項目が変わってきます。例えば、先ほどのSNSでは、ターゲット層への情報発信を目的としていました。もし、地域別の要因を取り入れるのであれば、「都道府県」という項目による分類も考えられるでしょう。何のためにデシジョンツリー分析するのか、分析項目はその目的に合致しているかを注意して選定してください。
デシジョンツリー分析は、階層が深くなるほど対象データが少なくなります。対象データが少なくなりすぎると、顧客が絞られることでマーケティング効果の期待値が大きく下がってしまいます。どの階層まで分析するかは対象データ数や想定ユーザー数などを考慮して、効率的かつ効果的な結果が期待できる範囲に留めておきましょう。
ここまでデシジョンツリー分析について解説しました。デシジョンツリー分析によって導かれた集計結果はとても理解しやすく、関係者からの同意をとても得やすくなります。アンケート調査を検討される際はデシジョンツリー分析することを想定し、調査設計されることをおすすめします。もし「どのように調査設計すれば良いか分からない」という悩みをお持ちであれば、外部プロフェッショナルのアドバイスを参考にしてみてください。
デシジョンツリー分析を上手に活用して、自社マーケティング戦略の立案に活用していきましょう。
市場調査についてのご相談はこちら>
2019.12.05
記述統計とは・・・ データの傾向や性質を知る方法のことで、度数分布(ヒストグラム)、平均、中央値、最大値、最小値、最頻値、分散、標準偏差などがあります……
2022.11.11
コンジョイント分析とは、いくつかの要素を組み合わせた「商品全体」を評価してもらうことで、それぞれの要素が商品の選択に対して、どの程度の影響を与えているかを調べる……
2022.09.26
企業がマーケティングのなかでアンケート調査を実施するとき、回答者の属性を尋ねることがあります。 それは消費者や顧客の属性が、マーケティング上の重要な情報になる……
2019.12.05
数量化Ⅰ類・・・ 目的 基本的な考え方は重回帰分析と同様 重回帰分析の説明変数が数値ではない場合に用いる 質的データを1,0データに変換すること……