テキストマイニングとは

テキストマイニングとは、アンケートやSNSなどで自由に書かれた文章データを、自然言語処理や統計学などの手法を用いて、言葉の出現量や繋がり、分布パターンを抽出し、隠された意味や本音(=インサイト)を人間が読み取りやすいように編み出された手法です。
マイニング(採掘)とあるように、文章データの中から価値ある情報を採掘する、という意味を持っています。

コンピューター技術の発展と共にビッグデータという言葉が当たりまえのように使われるようになった昨今、企業が取得できる文章データも膨大になっています。その膨大なデータの中から、いかに価値ある情報を簡単に、短時間で抽出できるかどうかがビジネス成功のカギを握っています。
またテキストデータでは、同じニュアンスのことばが、色々な表現で使用されます。
『お昼に食べるご飯』を例に挙げると、「お昼ごはん」「昼ご飯」「昼御飯」「昼食」「昼飯」「ランチ」など、ひらがな/カタカナ/漢字が入り混じって記入されています。これらの単語をそれぞれ分けて分析することもあるかもしれませんが、全て同じ『お昼に食べるご飯』として、類義語が最初から1つにまとまって分析できると効率が上がります。

マイボイスコムが提供する
TextVoiceの特徴は3つです。

  • POINT 1

    直感的で
    分かりやすい操作性

    分析を行いたいテキストデータを、CSV形式の定型フォーマットに整えた後は、数回ボタンを押すだけで分析が始まります。初回の分析も3000件(≒文)程度のデータであれば、1回の分析を行うのに1分~数分程度で完了します。

  • POINT 2

    類義語辞書の自動生成により、
    すぐにテキストデータの分析が可能

    マイボイスコムのTextVoiceは、辞書を自動作成し、類義語をまとめた形で分析結果が表示されるので、その日から分析可能なテキストマイニングツールになります。

  • POINT 3

    最大6つのコトバの
    組み合わせで表現

    2つのコトバの係り受けだけでは分かりづらかった文の内容を、TextVoiceでは最大6つで表現するため、より詳細な意味を捉えることが可能です。

TOPへ戻る