情報処理入門ネット検索テキスト
サーチエンジン[top]
ホームページを見るためにはそのアドレスであるURL(uniform resource locator,http://で始まる)を知っていなければなりません.インターネット関連の雑誌や図書などで調べることもできますが,目的のURLがあるかどうかわかりません.そのようなとき,役立つのがURLの検索サービスを提供してくれるホームページです.このようなホームページはサーチエンジン(検索エンジン)と呼ばれる情報検索システムを無料で提供しています.最近の検索サイトは検索サービス以外にもニュースやその他の情報も提供しており,情報の入り口としての機能を提供しているのでポータルサイト(portal site)とも呼ばれています.サーチエンジンを使いこなせれば自由にネットサーフィンを楽しむことができるようになるでしょう.
サーチエンジンを提供するサイトとして最初に名をはせたのは米スタンフォード大学の大学院生が始めたYahoo!(ヤフー)です.その後,Lycos,Alta Vista,Infoseek,goo(グー)など多くの検索サイトが登場しましたが,現在世界で最も利用されている検索サイトは Google(グーグル)です.Google とYahoo! が検索サイトの二大勢力になっています.マイクロソフトのLive Searchや Askなどがこれらを追っています.
検索エンジンには,ヤフーに代表されるジャンルごとの見出しをつけているカテゴリー別検索と,Google(グーグル)に代表されるロボット型サーチエンジンがあります.ロボット型では,コンピュータが世界中のサイトを自動的に探し出して膨大なデータベースを構築しています.カテゴリー別のサーチエンジンは,よく整理されてはいるが情報量が少ないという欠点があります.他方,ロボット型検索エンジンはヒットする数は膨大ですが,関連の薄いものまで拾ってきてしまうという欠点があります.
検索情報の豊富さと的確さの観点から,おすすめはGoogleです.Yahooと同じようにStanford大学院生が始めたベンチャー企業です.これはロボット型検索エンジンに属していますが,検索するキーワードに最も関連があると思われる情報を上位にリストアップする仕組みを備えているので,素早く目的のサイトを探すことができるという点で非常に優れています.グーグルには通常の検索の他にイメージ検索,ニュース検索,論文検索などもあります.
代表的な検索サイト
Google日本語: http://www.google.co.jp/
ヤフー!ジャパン: http://www.yahoo.co.jp/
マイクロソフト Live Search: http://www.live.com/?searchonly=true&mkt=ja-JP
goo: http://www.goo.ne.jp/
Ask.jp: http://ask.jp/
その他の特徴あるサーチエンジン[top]
・新しい情報なら,フレッシュアイ: http://www.fresheye.com/
サーチエンジンは,世界中のサイトから情報を集め,それをデータベースとして整理するまでにある程度の時間がかかります.従って,過去数日間の情報については掲載されていないサーチエンジンが多いのも事実です.そのようなサーチエンジンの中にあって,「フレッシュアイ」は,新しい情報に強いのが特徴です.当日のニュースまで検索可能です.
・情報の達人が教えてくれる,All About Japan: http://allabout.co.jp/
多くのサーチエンジンは,コンピュータが情報を自動的に整理・分類していますが,それぞれの分野について詳しい人たちがサイトを紹介してくれるのが「All
About Japan」です.各ジャンルごとの代表的なサイトを見落とすことがないというのが特徴でしょう.その一方,サイトを紹介してくれるガイドの力量に左右されるということにも注意してください.
・検索結果を整理してくれる,Clusty: http://clusty.com/
サーチエンジンは検索結果をたくさん表示してくれますが,それらは整理された形では示してくれません.検索結果をジャンルごとにフォルダに分類して整理・表示してくれるサーチエンジンが最近登場しました.その代表が
Clustyです.日本語での検索にも対応しています.例えば,「RATS」で検索してください.統計「Software」のRATSと「Rats
And Mice」のRATSの検索結果はそれぞれ別のフォルダに整理してくれます.
・ブログ専門のサーチエンジン
Google Blog Search: http://blogsearch.google.com/
テクノラティ: http://www.technorati.jp/
日記風のホームページ,ブログ(blog)は原則として毎日更新されることに特徴がありますが,新しい情報はブログの中に含まれていることが往々にしてあります.今話題のトピックを探すときもブログは役に立ちます.テクノラティの下部には本家英語版のリンク(English)も貼ってあります.
新しいタイプのサーチエンジン[top]
・Googleの新種たち
Googleではホームページ(ウェブ)の検索だけでなく,画像(イメージ),ニュースグループ,カデゴリー別(ディレクトリ)の検索もできます.そのほか,次のようなサービス(一部は英語のみ)も提供しています.
Google News: http://news.google.com/ (ニュース検索)
Google Print: http://print.google.com/ (出版されている書籍の検索)
Google Earth: http://earth.google.com/ (地球の衛星写真の検索)
Google Maps: http://maps.google.com/ (地図検索)
Google Viewer: http://labs.google.com/gviewer.html
Google WebQuotes: http://labs.google.com/cgi-bin/webquotes
Froogle: http://froogle.google.com/
Google Catalog: http://catalogs.google.com/
新しいタイプのサーチエンジンは,膨大な数の検索結果をジャンルごとに整理して示してくれます.
・Vivisimo: http://vivisimo.com/
検索結果を種類ごとに分類・整理してくれます.
・Kartoo: http://www.kartoo.com/
検索結果をビジュアルに整理してくれます.オシャレです.
・AlltheWeb: http://www.alltheweb.com/
・iLOR: http://www.ilor.com/
・Ask Jeeves: http://www.ask.com/
検索の例[top]
検索(サーチ)するときは,まず的確なキーワードを入れることが最も重要です.サーチには and (かつ)や or(あるいは)を使えるところもありますが,最初はまず1つのキーワードで検索してみましょう.あまりにも多くのサイトが見つかった場合は,その後で絞り込みやあるいはand検索を行います.and検索を行うときはキーワードとキーワードの間に1つスペースを入れます.
----------------------------------------------------------------------
【例題】電子メールには,不特定多数を相手に,読み手の都合を考えずに勝手にかつ大量に送りつけてくる主に営利目的の広告・ダイレクトメールがあります.このような迷惑メールを「〜メール」といいます.「〜」に入る言葉には米国の缶詰会社の登録商標(商品名)が使われています.缶詰メーカーと何ら関係はないのですが.さて「〜メール」というでしょうか.
----------------------------------------------------------------------
上の例題をGoogleを使って解答を見つけてみましょう.キーワードの候補としては,「迷惑メール」が考えられます.そこで,キーワード入力欄に,迷惑メール,と入力しましょう(図1参照).
図1 グーグルでの検索の例
「ウェブ全体から検索」にチェックが入っていることを確認します.次に,「Google検索」をクリックします.Googleは「迷惑メール」という言葉を含むサイトを見つけだしてその一覧を,キーワードと関連が強いサイトの順に表示します.Googleが数ある検索サイトの中で最も支持されている理由は,キーワードと密接な関連があると思われるサイトを上位にリストアップする能力に優れているからなのです.
検索結果のリストの上位5つぐらいをみてください.それぞれのサイトに簡単な説明がついているので,それを参考にして選びます.答はいくつものサイトに載っていますが,今回は一番上にリストアップされているサイトを選びましょう.そのサイト名をクリックするとそのサイトが表示されます.「スパム(spam)」あるいはスパムメールであることがわかります.
複数のキーワードで検索[top]
Googleでand検索するときは(A かつ B),キーワードとキーワードの間に全角で1つのスペースを入れます.今度は,「迷惑メール」と「缶詰」を入れてみましょう(図2参照).
図2 複数のキーワードで検索
最後に,「Google検索」をクリックします.Googleは,この2つのキーワードを同時に含むページを見つけだします.検索結果の少なくとも上位5つのサイトにはスパムメールと缶詰の関係の説明が載っています.これらの中から「スパム(メール) -Wikipedia」を見てみましょう.スパムと呼ばれる語源の説明が載っています.米国の缶詰会社Hormel社の製品SPAM(こちらは大文字)と英BBCで放映されたコメディ「モンティ・パイソン」が語源に関連していることがわかります.ただし,同社はスパムメールと関係はありません,念のため.
キーワードとキーワードの間にスペースを入れれば,キーワードはいくつ入れても構いません.ただし,キーワードの数が増えるにつれて,見つかる情報も絞り込まれてきます.
また,いくつかの単語から成っている語句を1つのまとまりとして検索するときは,モ メ でくくって入力します.
Googleではキーワードに英文字を使えば英語のサイトを検索します.
インターネットを巨大な百科事典と見立てて,Googleで様々な情報を検索してみましょう.
------------------------------------------------------------
【例題2】電子マネーの1つの形態にネットワーク対応型があります.オランダの会社が提案しているその代表的な規格の名前は何というでしょうか.
------------------------------------------------------------
Googleではand検索するときは,キーワードとキーワードの間に全角で1つのスペースを入れます.キーワードの候補としては,
電子マネー,ネットワーク,オランダ
が考えられます.そこで,キーワード入力欄に,
電子マネー ネットワーク オランダ
と入力しましょう.キーワードの間には1つ全角の空白(スペース)を入れます.最後に,「Google検索」をクリックします.
【検索結果】
300件余りがヒットしました.リストを上から見ていくと,1番目か2番目に答えが載っていそうです.「主な電子マネー」をクリックしてみます.
オランダのデジキャッシュ社の「eキャッシュ」であることがわかりました.
練 習[top]
次の練習問題にチャレンジしてみましょう.
-----------------------------------------------------------
(練習1)世界人口を刻々と表示しているサイトがネット上にはいくつかあります.それを1つ見つけなさい.さらに現在時点での世界の人口は何人でしょうか.見つけたサイトのURLと人口,および見つけたプロセス(キーワードなど)を書きなさい.
-----------------------------------------------------------
(ヒント)キーワードとしては,「世界人口」がまず思いつきます.
(補足)いくつものサイトが見つかるでしょう.ネット上で探す場合,答は1つとは限りません.いくつかのサイトに答が載っています.それらを比較して検討することも大切です.誤った情報に踊らされないためにも.
-----------------------------------------------------------
(練習2)インターネットを悪用した phishing(フィッシング)と呼ばれる詐欺行為が世界中で急速に広まっています.フィッシングとはどのような詐欺行為なのかを調べてください.
-----------------------------------------------------------
(ヒント)キーワードとしては,フィッシング,phishing,などが考えられます.魚釣りのfishingとはスペルが違います.
関連として,コンピュータウイルスについても調べてください.以下は代表的なサイトです.
シマンテック,ウイルス情報: http://www.symantec.com/region/jp/sarcj/index.html
トレンドマイクロ,ウイルス情報: http://www.trendmicro.co.jp/vinfo/
-----------------------------------------------------------
(関連問題)2003年1月25日(土),韓国を中心に大きな被害を及ぼしたコンピュータウイルスはワーム型に分類されているウイルスでした.このコンピュータウイルスの名前は何というでしょうか.さらに,その特徴も調べてください.
-----------------------------------------------------------
------------------------------------------------------------
(練習3)ネット上には地図情報を提供してくれるサイトがいくつもあります.例えば,旅行にいく場所の住所を入れて検索すると近辺の地図を表示してくれます.それらから地図サイトの1つを見つけて,熊本学園大学(熊本市大江2丁目5番1号)周辺の地図を表示させてください.
------------------------------------------------------------
(ヒント)地図サイトを見つけるには,キーワードとして,地図,を入れればいいでしょう.
地図サイトで場所を探すときは,キーワードで探すこともできますが,住所を入れるのが最も確実でしょう.
代表的な地図サイトとしては,グーグルマップ,Mapion,ちず丸,MapFanなどがあります.
------------------------------------------------------------
(練習4)イギリスの大学にコーヒーポットの映像を流している有名なサイトがありますが,そのサイトを探してください.
------------------------------------------------------------
(ヒント)coffee pot England
と3つのキーワードを英文入力モードで入力します.単語と単語の間には1つのスペース(空白)をいれます.英文で検索するときは,スペースは半角になります.
「Google検索」をクリックすると,「coffee pot England」の3つの単語を同時に含むページを探してきます.30000件以上がヒットしますが,Googleの優れているのは,キーワードに最も適合するサイトを最初の方に表示してくれることです.予想どおり最初に英ケンブリッジ大学の
Trojan
Room Coffee Machine
を見つけてくれました.
なぜこのようなコーヒーポットの映像だけを流しているのか,その由来をnon technical bibliographyを選んで読んでみましょう.知らない単語がでてきたらWWW集の中のオンライン辞書「英辞郎 on the Web」で調べることができます.本家以外にいくつかの大学がまねをして同じようなサイトを立ち上げているのにも気づくでしょう.こういうのは二番煎じといいます.
グーグルの一歩先ゆく検索術[top]
グーグルでは,ちょっと変わった検索もできます.次のような例です.試してください.
(1)辞書代わりに使える.検索ボックスに以下のように入力すると,英単語の意味を調べてくれます.
英和 uneasy
(注)上で,和英 として日本語を入れれば,英単語を探してくれます.
国語辞典として検索する場合は, 辞書 粒立つ のように入力.
(2)電卓にもなる.検索ボックスに以下のように式を入れると計算してくれます.
Pi*5^2
(注)円の面積,π×半径^2 の計算です.
(3)為替レートの換算をしてくれる.以下のように入力します.
1円は何ユーロ
(注)様々な通貨で試せます.その他,単位の換算にも使えます.
(4)単位の換算の場合は,次のように入力します.
1マイルは何キロメートル
(5)企業の株価も教えてくれます.次のように入力します.
株価 ユニクロ
(注)ユニクロの正式な社名はファーストリテイリングですが,ユニクロでも検索OKです.
課 題[top]
以下のサイトに検索練習問題を多数用意しました.活用してください.
「検索の達人に挑戦:サーチエンジンクイズ(笹山ゼミHP)」:
http://www.kumagaku.ac.jp/teacher/~sasayama/internets/searchquiz.html
代表的サーチエンジンのAND検索方法[top]
goo,Infoseek Japan,InfoNavigatorの場合のAND検索の方法についてまとめておきます.
(1)goo の場合:
キーワード1 キーワード2
キーワードとキーワードの間に全角の空白(スペース)を1つ入れます.キーワードは2つ以上設定できます.
(2)Infoseek Japanの場合:
+キーワード1 +キーワード2
+は半角の英数モードで入れます.キーワード1と+ の間のスペースも半角の英数モードでのスペースです.「通常検索」をクリックします.
もう1つの方法は,
キーワード1 キーワード2
と入力します.キーワードの間には半角のスペースを入れます.この後「絞り込み検索」をクリックします.結果的に上と同じになります.
(3)InfoNavigatorの場合:
キーワード1 AND キーワード2
キーワードとANDの間には半角のスペースを入れます.ANDも当然半角の英数モードで入れます.
(4)gooの高度な検索:
Boolean検索を選んでおきます.
キーワードとANDやNOTの間には半角で1スペースを入れます.
ANDやNOTはすべて大文字でなくてはなりません.
○( )で優先順位をつけられます.
○NOTで含まないキーワードを指定できます.
(A OR B) AND C NOT D
例:今日の星座(星空)を探すとき,星占い関連は省きたい場合
(今日 AND 星座) NOT 星占い
○キーワードとロケーションの設定の組み合わせ
ロケーションとは,ac.jpやgo.jpのドメインの所属を示します.
○キーワードとデータタイプの指定の組み合わせ
データタイプとは,jpegやgif,Acrobatなどです.
「検索の鉄人」[top]
「検索の鉄人」とは第1回が1997年10月6日(月)に全国で実施されたインターネット上の検索コンテストです.第1次予選は第3ラウンドにわたり行われ,第2次予選では結構骨のある問題が出題されました.
初代「検索の鉄人」に輝いた関裕司さんのサイトを参照してください.コンテストの模様がわかります.
以前は「検索の鉄人」のホームページがあったのですが,今ではなくなってしまいました.
http://tetsujin.arena.ne.jp/
(注意)検索の鉄人は第2回が1998年に行われましたが,その後は実施されていません.また,「検索の鉄人」の上記ホームページは今はありません.
検索の鉄人コンテスト最終決戦 問題と解答例:
http://netnavi.nikkeibp.co.jp/forum/mondai.html
(注意)上のサイトも2003年現在残念ながら消滅しています.
参考文献[top]
サーチエンジンの詳しい仕組みを知りたい場合は,以下を参照してください.
原田昌紀『サーチエンジン徹底活用術』オーム社 1997年
著者はサーチエンジンODINの開発者でもあるので,ロボット型サーチエンジンの仕組みの解説が詳しい.
検索術については,「初代検索の鉄人」になる次を参照してください.さまざまな検索のテクニックが紹介されています.
関 裕司『インターネット最強の検索術』リブロス 2000年