クローラおよびコンテンツ クローラ ウェブサービスについては、こちらを参照してください。
コンテンツ クローラ ウェブサービスの場所を指定するには、タイムアウト期間を指定し、このウェブサービスに関連付けられているクローラを有効または無効にします。
[サーバー情報] では、このウェブサービスに関連するリモートサーバーを確立し、管理することができます。
関連付けられたリモートサーバーが [リモートサーバー] の右に表示されます。また、管理ディレクトリでこのリモートサーバーの場所が [リモートサーバー パス] の右に表示されます。
リモートサーバーの関連付けを削除するには、[削除] をクリックします。
[コンテンツ クローラ ウェブサービスの設定] で、このウェブサービスのパスとタイムアウト期間の設定を指定します。
[コンテナ URL] ボックスに、クロールのプロバイダへのパスを入力します。これにより、ポータルよってコンテンツ階層を移動する方法が指定されます。リモートサーバーを関連付けると、基本 URL はボックスの左に表示されます。URL の指定には、/myCrawlerWebService/ContainerProvider.asmx のように、基本 URLで始まるパスで終わる相対パスを指定するか、http://myServer/myCrawlerWebService/ContainerProvider.asmx のように基本 URL ではなく絶対パスを入力することができます。
[ドキュメント URL] ボックスに、ドキュメントのプロバイダへのパスを入力します。これにより、ポータルによってこのタイプのドキュメントから情報を取得する方法が指定されます。リモートサーバーを関連付けた場合は、相対パス、絶対パスのどちらでも指定できます。
[アップロードの URL] ボックスに、アップロードのプロバイダへのパスを入力します。これにより、ドキュメント レポジトリにドキュメントをコピーする方法が指定されます。リモートサーバーを関連付けた場合は、相対パス、絶対パスのどちらでも指定できます。
タイムアウトの設定には、ウェブサービスのホストコンピュータからコンテンツを取得するためにポータルで試行される時間を指定します。このタイムアウト期間が終了するまでにホストコンピュータからの応答がない場合は、クロールが実行されません。
タイムアウトの各テキストボックスに、ポータルの待機時間を秒または分単位で入力し、ドロップダウンリストから [秒] または [分] を選択します。
[SOAP タイムアウト] の設定は、ゲートウェイ処理されていないコンテンツのみに適用されます。Exchange など、速度の遅いバックエンド システムにクローラによるアクセスが行われる場合は、タイムアウトを比較的長い時間 (90 秒ほど) に設定する必要があります。
[ゲートウェイ タイムアウト] の設定は、ゲートウェイ処理されているコンテンツのみに適用されます。ゲートウェイ処理されたコンテンツは、保護されていて、より複雑な性質を持っていることが多いため、このようなコンテンツの取得には、より長い試行時間をサーバーに割り振る必要があります。そのため、[ゲートウェイ タイムアウト] には [SOAP タイムアウト] よりも、多少長めの時間を設定することができます。
[ウェブサービスの進行状況] で、 ユーザーがクローラを実行したり、このウェブサービスからドキュメントを提出したときに実行される処理を指定します。
このウェブサービスでコンテンツのクロールを行うには、[有効] をクリックします。
ウェブサービスによってコンテンツがクロールされないようにしたり、コンテンツのクロールまたは送信時にメッセージが表示されるようにするには、[ポートレット無効時のメッセージ] をクリックし、ボックスにメッセージを入力します。
このウェブサービスの状態はいつでも変更できます。たとえば、ホストコンピュータやウェブサービスのメンテナンスを行う必要がある場合は、ウェブサービスを無効にすることができます。
このヘルプトピックに関連するページを表示するには、次の操作を実行します。