メイン

仕事絡み アーカイブ

2008年8月17日

[memo][SEO]KH Coderで検索キーワードをテキストマイニング

アンケートの自由回答データ入手できたので、業者にテキストマイニングを依頼。
数社の見積もりを取ったところ、簡易レポートつきで30万~50万くらい。
某電々系SIerに発注したところ、PPTのテンプレートだけがcoolなショボい納品物に眩暈がしたので、オープンソースなテキストマイニングツールを探してみた。

KH Coder

KH Coderとは、内容分析(計量テキスト分析)もしくはテキストマイニングのためのフリーソフトウェアです。新聞記事、質問紙調査における自由回答項目、インタビュー記録など、社会調査によって得られる様々な日本語テキスト型データを計量的に分析するために製作されました。

Windows版では、その他の必須ソフトウェア(ChaSen + MySQL + Perl + 各種Perlモジュール)はKH Coderの配布パッケージに同梱されています。また、これらの必須ソフトウェアの設定はKH Coderが自動的に行います。

なんか良さげなので、会社でインストール申請出す前に自宅でテスト。

とりあえずWindows版のバイナリで、このサイトの検索キーワードをマイニングしてみた。
元ネタは、Google Analyticsから。2,664種類のフレーズを.csvで入手。

[起動して]
KHcoder_1st.jpg

[ファイルを読み込んで]
KHcoder_2nd.jpg

[前処理を実行]
KHcoder_3rd.jpg

[処理完了]
KHcoder_4th.jpg

すると
[品詞別の出現回数]
demo0.jpg

[KWIC(keyword in context)]
demo2.jpg

[連関規則]
demo1.jpg

といったデータが簡単に解析できます。
その他にも、外部変数として読み込んだデータとのクロス集計やワードの出現回数分布、コロケーション(共起)統計もできちゃう。さらにExcel上で整形・グラフ化するためのマクロ付き。

外注すると30万の納品物があっという間にお手元に。

今回の様に検索キーワード解析だと、CVRの良いワードと相関の高いSEM入札/SEO用ワードを探したり...といった作業も楽に行えると思われ。

Perlのソースも配布されていることですし、コレでwebサービスしたら便利だと思うなぁ。

2008年9月

  1 2 3 4 5 6
7 8 9 10 11 12 13
14 15 16 17 18 19 20
21 22 23 24 25 26 27
28 29 30        

About 仕事絡み

ブログ「寝不足にて候(仮):」のカテゴリ「仕事絡み」に投稿されたすべてのエントリーのアーカイブのページです。過去のものから新しいものへ順番に並んでいます。

前のカテゴリはネコ、猫、catです。

次のカテゴリは備忘録です。

他にも多くのエントリーがあります。メインページアーカイブページも見てください。

Creative Commons License
このブログは、次のライセンスで保護されています。 クリエイティブ・コモンズ・ライセンス.