Subscribe via feed.

JPMS TagCloud

Japan Prime Minister Speech TagCloudとは、アメリカ歴代大統領のスピーチをタグクラウド化 – GIGANINEを見て、「面白そう」と思って自作しました。

※既にいくつかのサイトが同様の事をしていますが更新が止まっていますので、恐らく現時点(2008/11/8)で最新版だと思います。
※いくつか注意事項※
1.JavaScriptでスライドさせる仕組みではありません。詳細は最後のリンク先で述べます。
2.首相官邸ホームページ内の過去の歴代内閣総理大臣演説内容がHTML化され公開されているもの全てが対象となっています。
後はリンク先で。
※簡単に作成経緯をメモ。根気ある人はもっと精度が高いものを作ってみてw
1.首相官邸ホームページ内の全ての歴代首相演説から各首脳の演説トップをウェブサイトエキスプローラーで解析
2.解析後、サイト内構成が判明したら、ツールメニューからフォルダダウンロードで演説内容が書かれたHTMLファイル群をフォルダごと階層構造を維持したまま全部ダウンロード。
3.ダウンロードした演説フォルダ内にある演説HTMLファイルをxdoc2txt(デスクトップにショートカット作成後、ショートカットのプロパティでリンク先の最後に「 -f」追記)で、HTMLファイルからテキストだけ抽出。
4.抽出してできたテキストファイル群をpacktextで結合(連結)して一つのテキストファイルに。
5.一度別のテキストエディタで開き、KH Conderで開けるように文字コードを変更。
5.連結して出来た各首相の演説テキストファイルを、KH Conderでキーワードと登場回数を抽出。
6.結果をCSV出力して整形
7.CSVで整形したデータをコピーしてHTML_TagCloudに入力
8.完成

作業時間:約一日w

以下のリンク先からどうぞ。
JPMS TagCloud

更新履歴
08/11/08 v1.0 公開
08/11/09 v1.1 小泉首相タグクラウド修正
08/11/09 v1.2 サイトデザイン少し修正,小泉首相タグクラウド修正
08/11/10 v2.0 村山首相タグクラウド完全修正,新サイトデザイン,サイト内構成変更

Post a reply