wowlab
え!エッジ検出ですか。ということは今回我々が作る「工場と遊園地」のシステムと似てますね。今回私たちはカメラで撮影した映像のエッジ検出をして、そのエッジと映像の中のオブジェクトを衝突計算させているんです。
茅原
そうなんですか。面白いですね。その場合、エッジ検出は、カメラの中のオブジェクトを切り出すためにしているわけでしょう?実は、網膜がやろうとしているのも同じことらしいんですね。というのも、あるオブジェクトと背景の間にはたいていコントラストが存在することが多いので、 エッジ検出すればオブジェクトのだいたいの輪郭がわかるからです。もちろんエッジ検出だけじゃだめだからコンピュータビジョンがなかなかうまくいかないんですが・・でも、入り口のところでいきなりエッジ検出から始めていることから逆に、私たちの目が世界からオブジェクトを抽出することを目的にしたシステムであろうことが推測できます。
丸い図形に上から下に、白から黒のグラデーションを塗るとしましょう。そうすると丸い図形は急に立体的に見えてきます。実際には平面ですが、なぜか盛り上がって見えるわけです。逆に上から下にかけて黒から白のグラデーションを塗ると、凹んだ図形に見えるはずです。
wowlab
我々はグラフィックデザインをするときに、そのような技法を度々使います。ユーザーインターフェイスのビジュアルデザインだと、特にシェーディングや影を使って、情報の優先度などを表現しすることが多いですね。
茅原
はい。表現としてはとてもよく目にするものだと思いますし、このように見えることもあまり不思議に思われることはないと思います。でも、なぜグラデーションだけで立体感が得られるのか?あくまで2次元のグラデーションに過ぎないのに。そのように考えると、脳の中に「光源は上にある」という前提を持っていて、その前提を使って解釈していると考えざるを得なくなってきます。
wowlab
我々は自然にその前提を利用していたという事ですね。
茅原
網膜に映った像は2次元です。この平面的なデータから完全な3次元世界を構成するのは、原理的に不可能なんです。一次元足りませんから。皆さんもコンピューターグラフィックスに触れられているから分かると思うのですが、3面図から完全な立体を再現するのは無理ですよね。ですから何かを見ているとき脳は、未知数が2つある一つの方程式のように、解が一意に定まらない計算問題を解いていると考えられるのです。
wowlab
ではどうやって脳は答えを導きだしているんでしょうか?勘のようなもの?