安斎利洋の日記
2006年05月15日
12:16
検索におけるローカリティ
話題の本
『グーグル』
を書いた佐々木さんとの
会話
。
あ「検索にはローカリティが必要だと思う」
さ「でもそれって、パーソナライズド検索といっしょじゃないの?」
への返答を、ここに書いてみる。
0)図書館から借り出した本に、付箋が貼ってある。これは貼った人pと、自分qとの間に近い距離が作られたことになる。あ、この本をたどった誰かがいる、という感覚。
1)検索者が検索結果のどれをクリックしたかを「検索行為」として、検索者のローカルに検索行為を蓄積したのが、パーソナライズド検索。
2)検索行為をグローバルに蓄積し、検索対象に重み付けをすると、検索対象に起伏が生まれ、「流行」が見える。が、それはローカリティではなく、衆愚的正帰還を生む。
3)pによる検索行為とqによる検索行為が引き合い、クラスタを作るようなモデルを考える。検索をしない人にとって検索対象に起伏はなく平坦。検索行為そのものが、自分自身を検索空間の中に定位させ、その位置独特の起伏形状を削りだす。
3まで来てはじめて、僕の考えるローカリティ=あるいは異端であり続ける方法、です。
安斎利洋の日記とコメントはweb全体に公開されます
コメント
2006年05月15日
12:35
びすけっと
誰かがたどった道だとわかった瞬間に,興味が失せたりして(もっとすごい異端).
2006年05月15日
13:33
安斎利洋
ほとんどの人は、人だかりを見つけようとするけれど、ある確率で、より細い抜け道を探そうとする人が混じっている、ということになるでしょうね。群れをなす動物の習性。
2006年05月15日
14:12
佐々木俊尚
安斎さんの言うローカリティは、詰まるところハテブーじゃないかと思うんですが、違うのかな?
その前提でいえば……。
アルゴリズムによる蓄積は衆愚的正帰還になるけれど、人力によるデータベースはそうはならないってこと?
アルゴリズムか、人力か。
2006年05月15日
14:32
安斎利洋
はてブは、上の番号でいうと2.5くらいじゃないかな。
たとえば僕が、「佐々木 神楽坂」で検索をかけて、出てきた候補のなかから関係のないものを無視して、あるものだけクリックします。その一連の行為は、「検索行為空間」のなかでひとつの点になる(検索対象空間でないことに注意)。僕は、検索をするたびに、点と点をグループ化していくことになる。
多くの点が集まるところはかならずできるけれど、10点とか20点とか、そういう異端の島ができるでしょう。自分じゃない異端仲間のやっている「検索行為」のグループが見えてくる。
そんなイメージです。
2006年05月15日
14:39
小林龍生
どうもこの議論、世界を記述する言語と言語によって記述される世界との関係についての議論と同型のような気がする。
言語化されない世界は、ないも同然。
言語を差異化することによって、今まで見えなかった世界が見えるようになる。
差異のない平板な言語世界を目指すか、差異化を内包したダイナミックな言語世界を目指すか。
で、今の安斎さんの関心は、差異化を促すメカニズムを言語構造そのものの中に組み込むための戦略/戦術にあるのではないだろうか。
2006年05月15日
14:46
安斎利洋
それは小学校の先生をやると、考え方が変わるかもしれない、というツッコミはさておき。
基本的に小林さんの言うとおりなんですが、それ以上に、winnyが極悪非道のシンボルになり、google帝国が正義になるという流れに楔を打ち込みたいということですね。
2006年05月15日
14:49
安斎利洋
それ以上に、っていうのは違うか。同じことですね。
2006年05月15日
15:02
安斎利洋
>そんなイメージです。
もっと簡単に言うと、「このキーワードからこれを見つけるってのは、かなりレアな検索だと思うんだけど、おれと同じことをやった奴がいるとしたら、そいつはほかにどんな検索をしてるんだ」という興味への答が、束になってかえってくる世界。ということです。
2006年05月15日
15:35
小林龍生
大昔、図書館の貸し出しカードの管理がおおらかだったころ。
例えば、ガストン・バシュラールのフランス装の本を片っ端から借りだして、全部のページを切り開いている奴がいたりした。貸し出しカードを見ると記載は一人しかなくって。その後、何かの折りに偶然会ったら、もう他人ではないような奇妙な親しみを感じた。
ぼくの異端や錬金術への関心はそのころから。
ところで、Amazon.co.jpとかの《この本を購入した方は他にこのような本も購入されています》とかいうのと、安斎さんが目指すものとは、どこが類似していてどこが相違しているのだろう。
2006年05月15日
15:47
安斎利洋
決定的な違いは、僕がやっても、小林さんがやっても、同じ本をレコメンドするでしょ。
それは、ひとつ階層が浅いからで、「佐々木」を検索した人は、「神楽坂」も検索しています、という情報にすぎない。
あなたと同じ組みあわせで購入した人は、ほかにもこのような本を組み合わせています、という情報がはじめて意味のある「異端」ガイドになる。つまり、データベースの中に個人情報が(匿名で)入るってことですね。
2006年05月15日
15:51
安斎利洋
>奇妙な親しみを感じた。
最近、ネットで図書館のCDを予約すると、かならず僕のひとつ前で、ひと月以上返却を滞るヤツがいるんだ。
2006年05月15日
16:07
小林龍生
ちっと分かってきた。以前、"Anonymous Individuals"という概念を考えたことがある。スーパーとかコンビニとかで会員カードを作っているよね。これで個人IDを入力すると買い物履歴が全部記録される。でもって、そのIDだけ記入した買い物履歴を見せてもらったことがあるの。
いくつか見ていくと、あ、こいつは単身赴任の男性サラリーマンだとか、こいつは一人暮らしの女性だとか、こいつは小学生ぐらいの子供がいる勤労女性だとか、なんとなく分かってくるのね。
ところが、これを突き詰めていくと、匿名でも何でもなくなって、特にレアな買い物をする奴らって、もともと母集団が限られているので、本の組み合わせを見るだけで、あ、これは安斎利洋だ、とか、あ、これは佐々木俊尚だ、とか分かるようになる、きっと。
安斎さんが構想しているシステムは、うまく使うと魔女狩りにもきっと有効だと思う。
2006年05月15日
16:15
安斎利洋
異端の形成を助けるシステムと、異端を追放するシステムが同じなのは、まあしかたないですね。
この前ビックカメラでプリンタのインクを迷ってたら、店員が「もしプリンタの機種名がわからなかったらポイントカードで調べますが」と言ってきた。すごいな、と思いましたよ。
ポイントカードというのは、匿名の「私」によるソーシャルネットワークを内包しているはずですね。少なくとも、製品別のユーザー会はできちゃう。
2006年05月15日
16:53
大富豪家2.0
> あなたと同じ組みあわせで購入した人は、ほかにも
> このような本を組み合わせています
これは計算してるんじゃないんですかね。本棚.orgだと類似本棚で検索できます。検索に限らず、最近は他人の行為がネット上でバレバレですから、面白いことも怖いこともできますね〜
2006年05月15日
17:05
安斎利洋
あ、そうなんですか?
すると「あなた」が違うと、違う本を薦めてくるんでしょうか。僕はあんまりamazonで買ってないせいかな。あんまり自分っぽい結果は返ってこない。
本棚orgの類似本棚は、かなりイメージが近いと思います。自分で入力した本の一覧のかわりに、検索行為(検索キー→クリックサイトの組み合わせ)の履歴が計算対象になればいい。
2006年05月15日
17:58
安斎利洋
いま、amazonにサインインしてマイページ出てくる推薦本は、
ウェブ進化論 本当の大変化はこれから始まる
梅田 望夫 (著)
ザ・サーチ グーグルが世界を変えた
ジョン・バッテル (著), 中谷 和男 (翻訳)
「へんな会社」のつくり方
近藤 淳也 (著)
もしこれが僕の行為と誰かのマッチングだとしたら、僕の異端度はゼロですね。マーキングが足りない?
2006年05月15日
18:49
はらこ
マイページの推薦本はどうも直近に調べた本に依存しているようです。ちなみに私の場合は
ジュニア・アンカー英和・和英辞典 英単語表つき
羽鳥 博愛 (編集)
スーパー・アンカー英和辞典
山岸 勝栄 (編集)
20世紀言語学入門―現代思想の原点
加賀野井 秀一 (著)
です。この本をチェックしたのが原因らしい…
英語にも主語はなかった 日本語文法から言語千年史へ
金谷 武洋 (著)
ちなみにマイストアの方の上位3点は…
GPU Gems 2 日本語版 ハイパフォーマンス グラフィックスとGPGPUのためのプログラミング テクニック
Matt Pharr (編さん)
ゲーム開発のための数学・物理学入門 Beginning Math and Physics for Game Programmers
Wendy Stahler
Game Programming Gems 4 日本語版
Andrew Kirmse (編さん),
ゲーム開発は滅多にやらないんですが…何故だろう?
2006年05月15日
21:12
安斎利洋
大富豪家さん、本棚と類似本棚のモデルをamazonに売り込んだら? 超富豪家になれるかも。
2006年05月16日
00:53
安斎利洋
僕は、協調フィルタリングをちょっと誤解していたかもしれません。結局、僕の言ってることはレトリックの問題で、同じことを言ってますね。
ってことは、アマゾンの中で異端のクラスタができているんでしょうか。
2006年05月16日
20:25
安斎利洋
恥ずかしいことに、僕はamazonのレコメンドなどでやっている協調フィルタリングは、グローバルな情報を組織するだけだと思っていました。佐々木さんや富豪家さんに指摘されなかったら、ずっとそう思っていたかも。そうじゃなくて、ユーザーごとに自分のローカルなビューを見せてくれるんですね。
弁解っぽいけれど、なんでそう思っていたかというと、そこに個人に結びついた心的なオブジェクトがないからだと思う。ヘンな趣味の人の群れの近くに自分がいる、という感覚をamazonから得られたら、すごいと思うんだけど。
2006年05月22日
23:06
にしの
ここもまた後出しですみません。
結論からすると、amazonなどの手法は多分、安斎さんのもとめるローカリティーには達しておらず、冒頭の1と2を組み合わせただけで、3にはなってないと思います。つまり、衆愚的空間を個人対応して検索はしているけれど、個人が個人によって位置付けられる空間は生成されていない、ということです。
私も、3のようなローカリティーのある世界を構築したい、思いがあります。比較的単純な条件付き確率くらいで探せるローカルなビューではなくて。
2006年05月23日
02:07
安斎利洋
にしのさん、コメントどうも。
amazonのリコメンドがどのくらいすごいのかを検証するために、なるべくamazonで買おうと思ってるんですが、ついついやっぱり今日もジュンクで半日過ごしてました。本屋に行くほうがローカルなコミュニケーション感があって、少なくとも棚に並べている店員(最近は本屋でもキュレーターと言うらしい)との意思疎通を感じるし、実際良い関連情報が手に入ります。
たぶんこれって、物理的な本棚が、ものを考える環境としてまだまだ優位だということでもあるんじゃないでしょうか。クリックしていく行為って、情報を狩猟している感覚はあるけれど、セレンディピティがない。
amazonが実際何をやっているのかはともかく、ほかの人と共振している感覚がないのは確かで、それは基礎技術がおかしいのか、個人情報保護のためなのか。たんに本を薦められているだけ、って感じがしてならない。
2006年05月23日
15:57
にしの
この話題IPAXの前から考え続けていて、やっと一言書き込めました。不思議なもので、いちど書き込んでから風呂に入ったら、ぱぱっと広がってゆきました。
アマゾンやグーグルでやろうとしている事はやっぱりローカリティーではなくてグローバル化です。大勢の検索行為を検索アイテムごとの距離空間・位相空間を作って一つの空間とし、個人をその一つの世界の、一つの点とみなしてその周辺を見せると。これは一見ローカルなようで、距離移動コストがゼロの計算機内の世界ではグローバルです。
決定的な違いは、積極的に(!)異端であろうとして、紹介されたものをどん欲に見続けてゆくと、そのクエリー集合はどの方向でも結局は全体集合に収束して差異がなくなってゆきます。すべてグローバルへの道という事です。
ローカリティーを保証する人工システムは、ある個人ごとに「なにを紹介しないか」という強烈な信念を持つあるいは生成できるシステムである必要があります。物理的地理世界での超えられない谷や山。グラフ構造ならカットの探索。
アマゾンであれば提示された中からユーザが「無視」という行為によって選択「させられている」ものをシステムがあらかじめ見せないということです。
ただ、情報を見せない、というローカリティーは検閲や鎖国につながる点には気がかりがあります。
グーグルは国単位でこれをやっているのでしたっけ。。
ともあれ、ローカリティーの保証によって生まれる幸せもあるとおもう。というのがまとめです。
2006年05月24日
01:17
安斎利洋
>ある個人ごとに「なにを紹介しないか」という強烈な信念を
>持つあるいは生成できるシステムである必要があります。
なるほど、そういうことですね。問題がよく見渡せました。
なめらかに連続した空間で距離を測ると、こうはなりませんね。行為をノードとするグラフ構造が、構造を変えていくようなモデルじゃないとだめだ。
以前、Web上のページを格子点に配置するようなモデルを考えたことがあります。近いページ同士が隣接するように、ある規則でページをスワップしていく、一種のセルオートマトンです。そういう離散的な空間を考えないと、クラスタが切断されないわけだ。
これ、可視化すれば一目瞭然、にしのさんの言っていることが見えるような気がします。
安斎利洋mixi日記 一覧へ