07 August '2007 - 20:08 | アメリカ生活, 英語 so[a-z]{2}
タイトルは、「so の次にアルファベットの小文字を二文字」という意味の正規表現。つまり、soho とか soma とか sono とかを意味する。
ちなみに、SoHo っていうのは South of Houston、つまり、ハウストンの南側って意味。ソーホーと発音する。これはマンハッタンのとある地区のこと。
SoMa っていうのは South of Market Street、つまり、マーケットストリートの南側って意味。ソーマ。これはサンフランシスコのとある地区のこと。
SoNo っていうのは、South Norwalk、つまり、ノーヲークの南側って意味。ソノ。これはようするにノーヲークのダウンタウン(以南)。
最初の二つは、もし知らなかったら覚えておくといいかも知れない。どうせ関係あるところに住んでいる人は知ってるし、知らない人は関係ないところに住んでいるわけだけれど、一応、アメリカ人的には常識の範疇に入ると思うので、知ってて損することはない。
が、三つ目の SoNo は、知ってたらびっくりする。知ってたら、大損。ていうか、それだけで、ぼくは好きになると思うけれど。
Norwalk というのは、ぼくがアメリカ生活を始めた、ほんと、とるに足らないというか、どうにもならない田舎の町。基本的にダメ系なんだけれど、だからこそ、とてもいい味がある。それに、Stew's もあるし。
なんてことを思いつつ、この三つ、ぐぐる様に聞いてみたら、面白い結果が出たので特別に教えてあげる。
soho 40,400,000 pages, soma 36,100,000 pages, sono 279,000,000 pages
分かりやすく書くと、SoMa < SoHo <<<< (超えられない壁) <<< SoNo ということ。さすがに、ぐぐる様、分かってらっしゃる。
ソーホーなんかに住んでるよりも、時代はソノってこと。いやあ、 かなり嬉しい。
で、嬉しいついでに、ほかの so[a-z]{2} がどうなってるかもちょっと調べてみた。
1. some 1,900,000,000 2. sort 810,000,000 3. soon 711,000,000 4. sont 457,000,000 5. solo 404,000,000 6. song 342,000,000 7. sous 326,000,000 8. sony 371,000,000 9. soft 285,000,000 10. sono 279,000,000 11. sold 273,000,000 12. soit 261,000,000 13. soul 215,000,000
ぜんぶ書くのもあれなので、必ず覚えておくべきトップ13をリストしておく。いやあ、SoNo の偉大さが分かるというものですなあ。SoHo や SoMa なんてとるに足らん。ほほほ。
ちなみに、so[a-z]{2} は 676 通りあって、これをぜんぶ手でぐぐるってのは無理なので、676 通りを自動生成してぐぐってヒットした数を表示するプログラムを書いて実行したわけだけれど、ぐぐると喋るプログラムはだいぶ前に書いたのがあったので so[a-z]{2} をぜんぶぐぐるプログラムは 1分で書けた。
が、とうぜん、それの実行にはそれなりに時間がかかった。14分14秒。ひとつ 1.26秒。まあ、そんなものかな。
つか、こんなアタックを怒らずにちゃんと相手にしてくれたぐぐるに感謝。
という、923.2MB の Xcode をダウンロードしている間の暇つぶし。
私も現在研究で非常に似た様なことをしているのですが (見ているのは結果の数では無く、文章なのですが) どれぐらいまで許されるのか少し気になります。Google API の1日1000件なんて少なすぎます (と言うのは私だけ..では無いはず)..
# 周りに (研究目的で) ぐーぐる先生を読んでいる人もいるのですが、1度止められるとしばらく同じ IP から接続できなくなるらしいです。
カッキー - 16 August '2007 - 07:53
ちなみに、上の検索では http://www.searchmash.com/ を使ったのですが、三回くらい(つまり 2000アクセス強)テストしても動いてました。攻撃するのはこっちの方がいいかも知れません。
ひろしま - 16 August '2007 - 19:31