グーグル検索で特定の数式"-4^(1/4)"を与えるとアダルトサイトが表示されるバグが発見される
英語の質問サイトQuoraにて、「グーグルで"-4^(1/4)"で検索するとなぜかポルノサイトが出てくるんだけど?」という質問が話題になっています。実際に手元で検索してみても、アダルトサイトばかりが検索結果に表示されます。
「セーフサーチ: 強」の時はさすがに何も出ないようなので、何がなんでもアダルトな結果を見たくない人にまで見せてしまうという事故にはならずに済んだ模様。
この質問を見て試してみた人たちの「俺も俺も」の証言が集まってきた結果、この数式に限らず、桁数の数字が3つ並んでマイナス記号を含む一定のキーワードで、この結果が引き起こされることが絞り込まれてきました。
この質問は先月にされたようですが、一昨日になってQuoraにGoogle検索チームのエンジニアが登場し、これがグーグル検索のバグであることを認めました。そして彼は、実際にどういう条件でアダルトサイトの検索になってしまうのかを説明しています。
アダルトサイトを出してしまう数式は、必ずしも
"-4^(1/4)"
という形である必要はなく、グーグル検索の内部では、この数式は
-4 "1 4"
と同等の扱いなんだそうです。この検索は、
- -4 : 4を含まない
- "1 4" : 1と4が連続している
の両方を満たすもの、という意味で、両者は矛盾しているので、検索結果は本来なら0件になるはずです。
しかし、この矛盾した検索指示にマッチしてしまうウェブサイトが、どうもグーグルのデータベースの中に存在し、それらが表示されてしまう。それこそが今回のバグの原因だ、ということだそうです。
なぜかわかりませんが、グーグルの内部で、今回表示されてしまうようなアダルト系のページが、これらの存在しないキーワードに結び付けられてしまっているようですね。
たとえば、こんなキーワードでも、症状は発生しました。
-1 "1 b"
Quoraの回答者たちが示した組み合わせとしては、以下のようなものも効くようです。
"1 2" -1 "1 2" -2 "9 8" -9 "h 3" -h "15 12" -12 "apple 1" -apple "apple 1" -1
Quoraの他のある回答者は、アダルトサイトは検索上位に出るための工夫(SEO)をものすごく頑張っているので、ありとあらゆるキーワードで引っかかるようになっているのだ、と予想していましたが、機械的にいろんなパターンを生成してグーグルを騙そうとした結果が、効いたという可能性もあるのかもしれません。
このバグは現在修正するよう頑張っている、ということなので、試せるのはあと少しの間かもしれません。
今修正に追われている中の技術者には気の毒ですが、これだけ広く使われている、現在世の中にある中でも最も複雑で大規模であろうwebサービスにおいてこんなバグが有り、しかもバグの出方が笑ってしまうような結果、というのはすごいですね。
これまでにもこのバグを見つけてた人は何百人といたのかもしれませんが、疑問に思ってしかるべきところで質問してみるというのは重要ですね。
via Google search bug returns porn results for 'contradictory queries' | The Verge