SHOEISHA iD

※旧SEメンバーシップ会員の方は、同じ登録情報(メールアドレス&パスワード)でログインいただけます

MarkeZine Day(マーケジンデイ)は、マーケティング専門メディア「MarkeZine」が主催するイベントです。 「マーケティングの今を網羅する」をコンセプトに、拡張・複雑化している広告・マーケティング領域の最新情報を効率的にキャッチできる場所として企画・運営しています。

直近開催のイベントはこちら!

MarkeZine Day 2025 Retail

プログラマーが語るマーケティングツール開発の日常

いま、この瞬間のホットなネタ教えます~国産ブログ検索エンジン『kizasi』のすべて~


NHKやYahoo! JAPANともコラボレーション!

編集部
実際にいろいろな企業とコラボレーションされているようですが。
稲垣
NHKで「つながるテレビ@ヒューマン」という土曜の夜10時からやっている番組があるんですが、この中に「今週のきざし」というコーナーがありまして、こちらの方でkizasiのランキングをデータとしてお使いいただいています。
編集部
テレビ番組でも使われているんですね。
稲垣
こういうデータ提供系をいくつかやっています。他にもシネマカフェさんのサイトでなんですが、ブログで話題のランキングがわかるコーナーがあります。これはブログの中から映画だけに関するキーワードを取り出して、基礎データ、ランキングデータを提供しています。その他にも、こちらが出したRSSを利用してサイト内で使っていただくという形もあります。
編集部
Yahoo! JAPANさんの方にも技術協力されていますよね。
稲垣
Yahoo! トレンドワード」ですね。これは、ちょっと特殊なケースなんですが、Yahoo! JAPANさんと協同で、kizasiがやっているブログの話題のランキング提供と、Yahoo! JAPANさんがお持ちのリソースとを組み合わせてやっています。
編集部
ブログではなく、ニュースをkizasi的にレイティングするわけですね。
稲垣
そうです。ニュースの世界だけを見た場合に、どんな話題が盛り上がるのか。ブログで話題になっているものと、純粋にYahoo!ニュースをkizasi的にランキングしたものを見比べてみると、全然違うというおもしろさがある。
 でも、中には「ニュースからブログに」「ブログからニュースに」という話題もあったりします。またニュースにブログをひもづけており、そういう形でkizasiのデータだけでなく、Yahoo! さんのデータとも連携しています。

kizasiサーチエンジンのしくみ

編集部
kizasiサーチエンジンの特徴を教えてください。
稲垣
サーチエンジンの特徴としては3つあります。1つ目は「今盛り上がっている話題がわかる」ということです。かつ、盛り上がった話題を時系列で全て持っています。日々保存していきますので、時間軸に沿って見た場合、どういう勢いで盛り上がったのかがわかります。2つ目は、ランキングという形になりますが、「話題の世界をサマる」機能があります。ランキングを見てもらえば「今」という瞬間の話題をぱっと見て知ることができます。
編集部
3つ目は?
稲垣
3つめの機能としては「この話題からつながる情報」を見られる点です。話題に触れたブログは一覧で表示されるのですぐにアクセスすることが可能です。また、関連するニュース記事なども表示されるので、そちらにもリンクしていけます。これらの機能は、ほぼリアルタイムで収集しているので、今さっきアップされたブログエントリーも、すぐに検索対象になるんです。
編集部
kizasiのランキングはどのように決まるのでしょうか?
瀬戸口
kizasiのランキングは、単純に出現回数の多い順じゃないんです。最近ぐっと注目されたもの、傾きが大きいものを重要視しています。今はアカデミー賞の話が一番になっていますが(編集部注:取材時はアカデミー賞発表の翌日だった)、これって何度も語られるような話題じゃないですよね?
編集部
ええ。
瀬戸口
なので、これは昨日今日の話です、と。そういうのがレイティングされて上に来るようにしてあります。それをするために、これまでの歴史、というほどのものじゃないですが、これまでの中でどれだけ使われてきた単語かっていうのを常に、5分とか10分ごとに再計算し直してます。そしてそれを元に勢いを算出し、ランキング表示をしています。
編集部
するとこのクラウドも、出現回数が多いほど太字、というわけではない?
瀬戸口
そうですね。クラウド内の言葉は左から右へ「この言葉と一緒に書かれた回数が多い順」に並んでいて、文字の大きさは「関連度」を表しています。例えば画像の「澤屋敷と言えば」の場合、左上から3番目に「試合」という言葉がありますね。「試合」という言葉は澤屋敷と一緒に書かれた回数が3番目に多かったのですが、あちこちで出てくる普通の言葉なので、いろんな言葉と結びつきがある。そのため関連度は弱いことになり、クラウド上は小さい文字表示になります。
文字が大きいほど関連度がある
編集部
普遍的でない言葉ほど、太字で表示されるわけですね。
瀬戸口
普通、kizasiエンジンみたいに関連語を調べる場合は、「こういう言葉に対して関連する言葉は、これとこれとこれだよね」とあらかじめ用意しておいて、それに従ってカウントしていくことが多いんです。ですが、それだと新しい言葉に対応できない。kizasiはリアルタイムに計算する仕組みを持っているから、新語対応も簡単に解決できてしまいます。これもkizasiサーチエンジンの特徴の1つですね。
稲垣
だから、「第78回アカデミー賞」という話題を、大きな字を中心に見ると、なんかイメージが飛び込んでくるという作りになっている。
編集部
データ量がすごそうですが。
稲垣
ものすごいボリュームです。
瀬戸口
トップページの右上にカウントされていますが、300万人の7000万エントリー。これをすべて対象として計算しています。
編集部
どのぐらいの時間でクロール注1)しているんですか?
瀬戸口
エントリーが書かれてから5分~15分ぐらいで拾われて、計算対象になっています。
編集部
それをどんどん蓄積している、ということですね。
瀬戸口
はい。kizasiはフリーワードで検索できますし、蓄積されているデータを使って、24時間前、3日前、1年前の関連語と言及回数とエントリーを知ることもできます。
注1
検索エンジンにインディックス(登録)するためにはプログラム(いわゆるクローラー)がページのリンクを辿っている。そのクローラーが巡回することをクロールと呼ぶ。
もどる

次のページ
文脈を見る

この記事は参考になりましたか?

  • Facebook
  • X
  • Pocket
  • note
プログラマーが語るマーケティングツール開発の日常連載記事一覧

もっと読む

この記事の著者

MarkeZine編集部(マーケジンヘンシュウブ)

デジタルを中心とした広告/マーケティングの最新動向を発信する専門メディアの編集部です。

※プロフィールは、執筆時点、または直近の記事の寄稿時点での内容です

この記事は参考になりましたか?

この記事をシェア

MarkeZine(マーケジン)
2007/04/04 17:14 https://markezine.jp/article/detail/977

Special Contents

PR

Job Board

PR

おすすめ

イベント

新規会員登録無料のご案内

  • ・全ての過去記事が閲覧できます
  • ・会員限定メルマガを受信できます

メールバックナンバー

アクセスランキング

アクセスランキング