ウェブ ページの除外

不必要なウェブ ページをポータルにインポートしないようにクローラを設定するには:

  1. デフォルトでは、このクローラは、自動クロールを設定したほうがよいページについて、ウェブ サーバーの推奨値に従います。この推奨値以外の値を使用するには、[目的のサイトのロボット排除プロトコルに従う] チェック ボックスをオフにします。

    一般に、このような推奨値を設定することで、不要なコンテンツがポータルに取り込まれないようにすることができます。ただし、一部のサイトでは厳密な推奨値が設定されています。クローラがサイトからコンテンツをインポートしない場合は、このオプションをオフにしてください。

  2. デフォルトでは、このクローラはウェブ サイトのソースで使用される場合、インポートされたウェブ ページの URL を保存します。URL を小文字に変換するには、[すべての URL を小文字に変換] を選択します。

  3. あるウェブ サイトのエリアからコンテンツをインポートしないようにする、または特定のページをインポートしないようにするには:

  4. デフォルトで、このクローラは除外で指定されたページのクロールまたはインポートを行いません。クローラで、除外されたページのリンクから、除外されておらず、ページをインポートする必要があるページを選択する場合は、[除外されたページをクロールするが、インポートしない] を選択します。

  5. クロールの対象をあるウェブ サイトのエリアまたは特定のページに制限するには:


  1. [管理] をクリックします
  2. ウェブ クローラ エディタを開きます。
  3. 左側にある [オブジェクト設定の編集] で、[ウェブ ページの除外] をクリックします。