テキストマイニングとは
企業のもつデータを経営活動に活かせることから、テキストマイニングが注目されています。ここでは、テキストマイニングの概要について見ていきましょう。
膨大な量のテキストから有益な情報を探すこと
テキストマイニングとは、「自然言語処理」と呼ばれる解析手法を用いて、企業にとって有益な情報を抽出することです。自然言語処理は、コンピュータが自然言語(日常生活において使われている言葉)を処理することを指します。
テキストマイニングの対象となるテキストにはさまざまなものがあります。例えば、コールセンター内の顧客とオペレータのやり取り記録やアンケート、WebサイトやSNSへの書き込みなどです。音声データをテキスト化したものも含まれます。
これらには市場動向や消費者意識など、企業にとって有益な情報が含まれており、経営上非常に重要です。
アンケート集計やコールセンターなどで使われる
記述式のアンケートやコールセンターでの応対履歴などがテキストマイニングに利用されます。しかし、テキストマイニングは文章を単語や助詞などの文節で区切り解析を行う手法であるため、実は日本語には不向きです。
日本語は、英語のように名詞や助動詞の間に「スペース」がなく、単語ごとの切り分けが難しいです。そのうえ、同音異義語や表記ゆれがあるのも理由として挙げられます。
そのため、テキストマイニングは全体像や特徴を目的とするざっくりとした分析との相性が良いと言われます。全体像の場合はどんな単語が使われるのか、出現頻度を解析します。特徴を把握する場合、使われる単語の種類の増加数などを解析します。
これらは一定の条件下で抽出しているだけですので、分析精度は高くないことを覚えておいてください。
テキストマイニングはデータマイニングの一種
テキストマイニングは、文字列を単語ごとに分解し、有益な情報を抽出します。たとえば、SNSや記述式アンケートをテキストマイニングすることで商品が売れない理由などがわかります。
データマイニングは膨大なデータの中から有益な情報を探す手法の総称であり、統計学や人工知能などの技術を利用する手法です。店舗の売上情報をデータマイニングすると、時間帯ごとの商品が売れる相関関係などを分析できます。
テキストマイニングは文字列、データマイニングは全てのデータがマイニングの対象です。データマイニングはテキストマイニングよりも対象範囲が広く、テキストマイニングの上位区分と言えます。
データマイニングについて知りたい方は、以下の記事をご覧ください。
関連記事
watch_later
2021.03.17
データマイニングとは?基本の考え方から分析手法、仕組みを解説!
続きを読む ≫
テキストマイニングの目的
では、テキストマイニングはどのような目的で利用されるのでしょうか。3つの目的別に解説します。
顧客のニーズを発見する
コールセンターやWebサイトに寄せられるお問い合わせや記述式アンケートには、顧客の意見や要望などが反映されています。
それらのテキストデータをテキストマイニングすることでリアルタイムに顧客の声を知り、ニーズを明確化できるのです。季節や年齢、意見の種類などさまざまなキーワードの収集・解析は、要因の関係性の気付きにつながります。
テキストマイニングは、売れない理由といった「なぜ」の原因究明に役立てることが可能です。
業務の課題に対する改善策を見つける
テキストマイニングで抽出したデータはナレッジとして共有可能で、社内でも活かせます。
営業日報や作業報告書、レポートなどをテキストマイニングすれば業務の問題点を見える化できます。属人化している業務であれば業務の平準化が、営業成績が優秀な従業員のナレッジがあれば、スキルの平準化が可能です。
社内に蓄積された膨大なテキストデータの活用により、企業力強化が図れます。
ビッグデータを分析して将来を予測する
テキストマイニングをTwitterなどのSNSに活用すれば、市場動向の予測が可能です。
SNSにアップされるコメントは膨大な有益情報を含むため、ビッグデータとして活用が進んでいます。テキストデータであるこれらの情報はテキストマイニングに最適です。例えば、コメントを解析し、インフルエンザの流行を予測できればマスクの仕入量を増やせます。
日々の業務にテキストマイニングが活かせれば、仕入量のコントロールといった効率的な企業運営が可能です。
テキストマイニングの手法
テキストマイニングには3つの手法があります。ここでは、それぞれの手法を見ていきましょう。
センチメント分析
テキストマイニングの代表的な手法であり、顧客の感情を分析します。顧客が商品やサービスを利用した際に、どんな感情をもったのかを評価します。「肯定的」「否定的」「中立的」の3つで評価するのが基本です。
しかし、年代によっては異なる感情を意味する単語もあります。「やばい」は代表的な単語です。若い世代では肯定的な意味を持ちますが、年配世代では否定的な意味で利用されることが多いでしょう。
このように、曖昧な意味を持つ単語などは、人による解釈が必要な場合もあります。
対応分析
コレスポンデンス分析とも呼ばれます。設問をかけ合わせて作成する「クロス集計」や、編集・集計を行う前の「ローデータ」を散布図で表現する分析手法です。
アンケートなどはクロス集計を用いることが多く、項目が多岐に渡ると結果を把握しにくいです。そこで散布図にすることで項目の関係性が可視化され、対象データを比較しやすくなります。
対応分析は企画書やブランドのイメージ分析に活用されることが多いです。
主成分分析
ビッグデータなど、膨大なデータを分析する際に活用される手法です。
膨大なデータには多くのデータ項目が存在するため、それが分析の妨げとなることがあります。そこで、多くのデータ項目を少数の項目に置き換えることで、データ分析をしやすくするのです。
主成分分析はデータ分析しやすくなりますが、一部のデータを切り捨てることになります。したがって、全ての情報を見ることはできません。切り捨てた分のデータに重要なデータが含まれることもあるため、慎重な判断が必要です。
テキストマイニングの活用ポイント
テキストマイニングを効果的に活用するには、どのような点に注意するべきでしょうか。活用時に気を付ける2つのポイントを見ていきましょう。
分析結果をもとにPDCAを回す
テキストマイニングの活用を検討している場合、改善を図りたい課題や問題があるはずです。「データ活用したい」「何か有益な情報を得られるかも」など、目的もなくテキストマイニングを行ってもデータを活用できません。
まず、テキストマイニングによってどうなりたいのか、どんな課題を解決したいのか。自社が目指すゴールを設定し、目的の明確化を図ってください。そして分析結果を基に、問題点の整理を行い、それを解決する具体的な方法を決めましょう。
その分析結果と解決方法を共有して解決方法の実践後、どんな変化・効果があったのか評価を行います。期待する効果や変化が得られない場合は、改めて解決方法を見直し改善を行いましょう。このように繰り返しPDCAサイクルを回すことで、目標達成に近づくことができます。
テキストマイニングによって得た結果を経営に活かすには、結果を共有して組織ぐるみで解決に臨む姿勢が大切です。
精度を高めるために辞書を作成する
単語や文節ごとに区切ってマイニングするため、テキストマイニングでは単語判定が重要です。
1つに数通りの読み方や意味を持つ漢字は、辞書にその情報を集約することでテキストマイニングの精度をあげることができます。1つの動詞も現在形や過去形、未来形などを辞書に登録する必要があります。そして、辞書は定期的に更新しなければいけません。
新しい言葉や商品、サービスが次々と誕生し、それらの情報を登録して辞書を更新していくことでテキストマイニングの最適化が図れます。なお、テキストマイニングツールを利用することで効率的に辞書を作成でき、分析精度の向上が可能です。
辞書に登録する単語の語彙力がテキストマイニングの精度を高めるポイントになるでしょう。
テキストマイニングを有効活用して業務を効率化しましょう!
テキストマイニングは文字列から有益な情報を抽出するデータマイニングの1種です。アンケート集計などに活用します。用いられる分析手法は以下のとおりです。
テキストマイニングは顧客ニーズや課題点の発見、将来の予測も可能です。辞書を更新したり、PDCAを回したりすることで効果的に活用できます。以上を踏まえて導入を検討し、データ分析の精度を高めましょう。