寝不足にて候（仮） [30/80]ページ

25 26 27 28 29 30 31 32 33 34

Aug

17

2008

[memo][SEO]KH Coderで検索キーワードをテキストマイニング

|Author：kenji00 | コメント(0) | トラックバック(0)

アンケートの自由回答データ入手できたので、業者にテキストマイニングを依頼。
数社の見積もりを取ったところ、簡易レポートつきで30万～50万くらい。
某電々系SIerに発注したところ、PPTのテンプレートだけがcoolなショボい納品物に眩暈がしたので、オープンソースなテキストマイニングツールを探してみた。

KH Coder

KH Coderとは、内容分析（計量テキスト分析）もしくはテキストマイニングのためのフリーソフトウェアです。新聞記事、質問紙調査における自由回答項目、インタビュー記録など、社会調査によって得られる様々な日本語テキスト型データを計量的に分析するために製作されました。

Windows版では、その他の必須ソフトウェア（ChaSen + MySQL + Perl + 各種Perlモジュール）はKH Coderの配布パッケージに同梱されています。また、これらの必須ソフトウェアの設定はKH Coderが自動的に行います。

なんか良さげなので、会社でインストール申請出す前に自宅でテスト。

とりあえずWindows版のバイナリで、このサイトの検索キーワードをマイニングしてみた。
元ネタは、Google Analyticsから。2,664種類のフレーズを.csvで入手。

[起動して]

[ファイルを読み込んで]

[前処理を実行]

[処理完了]

すると
[品詞別の出現回数]

[KWIC（keyword in context）]

[連関規則]

といったデータが簡単に解析できます。
その他にも、外部変数として読み込んだデータとのクロス集計やワードの出現回数分布、コロケーション（共起）統計もできちゃう。さらにExcel上で整形・グラフ化するためのマクロ付き。

外注すると30万の納品物があっという間にお手元に。

今回の様に検索キーワード解析だと、CVRの良いワードと相関の高いSEM入札/SEO用ワードを探したり...といった作業も楽に行えると思われ。

Perlのソースも配布されていることですし、コレでwebサービスしたら便利だと思うなぁ。

[memo]XenのDomUで時刻合わせ～未完～

|Author：kenji00 | コメント(0) | トラックバック(0)

Dom0からしか時刻を更新できないというXenの仕様で、ずっと嵌りっぱなし。
今日もタイムゾーンはCDTのまま。

パラメタの変更が必要らしいですが。

# echo 1 >/proc/sys/xen/independent_wallclock

or

vi /etc/sysctl.conf

xen.independent_wallclock = 1

してから

/usr/sbin/timeconfig

だの

cp /usr/share/zoneinfo/Asia/Tokyo /etc/localtime

しても、

# date

Sat Aug 16 15:00:03 CDT 2008

何故でしょう。

続きを読む: [memo]XenのDomUで時刻合わせ～未完～

Aug

10

2008

[memo][apache]ディスクに書き出す前にメモリにログエントリをバッファする

|Author：kenji00 | コメント(0) | トラックバック(0)

Apache2.0.41 以降には、ディスクに書き出す前にメモリにログエントリをバッファするBufferedLogs ディレクティブが用意されています。

httpd.conf に　BufferedLogs On　って書いてrestartするだけ。

このディレクティブは実験的なものですので、使用する際は注意してください。

ということですが、設定して ab（Apache Bench）で前後比較してみたところ、14～15%ほど早くなったので採用。
ファイル数多めなページだと、もうちょい効くのかも。

「どうせ、Google Analyticsで見るんだから、ログ取るの止めればいいじゃん。」という意見もありますが、生ログは取っておかないと何かとアレでしょ。ヲタクとして。

続きを読む: [memo][apache]ディスクに書き出す前にメモリにログエントリをバッファする

25 26 27 28 29 30 31 32 33 34

follow kenji00 at http://twitter.com

circuit sud maroc: い、あなたの素晴らし続きを読む
excursion désert marocain: It’s going 続きを読む
agence de voyage maroc: un événeme 続きを読む
anonymous: 公開されたマイク·コ続きを読む
anonymous: 大紫財布人民元、09 続きを読む
anonymous: "This 続きを読む
anonymous: Six Louis 続きを読む
anonymous: So what i 続きを読む
anonymous: レースのベスト非常に続きを読む
anonymous: Only t 続きを読む