コンテンツの言語、拒否されたドキュメントの処理方法、およびコンテンツ クローラ タグを指定します。
[コンテンツの言語]のドロップダウン リストから、インポートするコンテンツで頻繁に使用されている言語を選択します。
[拒否されたドキュメント]で、フォルダに分類されなかったドキュメントの処理方法を指定します。
拒否されたドキュメントを強制的にインポートするには、[未分類ドキュメント フォルダにインポートする]を選択します。
注: 未分類ドキュメント フォルダは、未分類ドキュメントへのアクセス権限が与えられているユーザが使用できます。未分類ドキュメントにアクセスするには、[ディレクトリ]メニューの[ディレクトリの編集]をクリックして、未分類ドキュメント フォルダを開きます。[管理]| [ユーティリティの選択]| [未分類ドキュメントへのアクセス]をクリックして開くこともできます。
拒否されたドキュメントをインポートしないようにするには、[インポートしない]を選択します。
既存のコンテンツ クローラを編集している場合は、[拒否されたドキュメント]に、このクローラが以前に拒否されたドキュメントを検出したときにどのように処理するかを指定できる追加オプションが表示されます。以前に拒否されたドキュメントの定義は、手順 4b で選択したオプションによって異なります。
[このクローラ]を選択した場合は、以前に拒否されたドキュメントには、このコンテンツ クローラによって拒否されたすべてのドキュメントが含まれます。
[このコンテンツ ソース]を選択した場合は、以前に拒否されたドキュメントには、このコンテンツ ソースによって拒否されたすべてのドキュメントが含まれます。
以前に拒否されたドキュメントをどのように処理するかを指定します。
以前に拒否されたドキュメントを同じコンテンツ クローラによってインポートするには、[再インポート]チェック ボックスをオンにします。
拒否されたドキュメントをインポートしないようにするには、[インポートしない]を選択します。
どうしても必要な場合は、以前に拒否されたドキュメントの履歴を削除できます。この場合、以前に拒否されたドキュメントの定義は、手順 4b で選択したオプションによって異なります。手順 4b で[このコンテンツ ソース]を選択した場合、このコンテンツ ソースからドキュメントをインポートするすべてのコンテンツ クローラの拒否履歴が削除されます。以前に拒否されたドキュメントの履歴を削除するには、[拒否履歴のクリア]をクリックします。
注意: ドキュメントがどのフォルダにも分類されず、未分類ドキュメント フォルダに格納された場合、そのドキュメントは拒否されたものとして見なされません。拒否されたドキュメントとは、どのフォルダにも格納されないドキュメントを指します。
既存のコンテンツ クローラを編集している場合は、[ドキュメントのインポート]セクションが表示されます。[ドキュメントのインポート]で、新規ドキュメントのみがインポートされるようにするかどうかを指定します。デフォルトでは、コンテンツ クローラによって (このコンテンツ クローラ、あるいは同じコンテンツ ソースにアクセスする他のコンテンツ クローラによってこれまでにインポートされたことがない) 新規のドキュメントのみがインポートされます。各ドキュメントが複数のコピーをインポートするようにコンテンツ クローラの設定を変更することができるため、コンテンツ クローラのテスト時に役立ちます。
新規ドキュメントのみをインポートするには、[新規リンクだけをインポートする]チェック ボックスをオンにして、新規オプションを表示します。このようなインポートを行わない場合は、手順 5 に進みます。
新規リンクの定義を指定するには、次の操作を実行します。
このコンテンツ クローラによって、これまでにインポートされたことがないドキュメントのみをインポートするには、 [このコンテンツ クローラ]オプションをオンにします。
関連するコンテンツ ソースから、同じコンテンツ クローラ、別のコンテンツ クローラ、またはユーザの手動によってこれまでにインポートされたことがないドキュメントのみをインポートするには、 [このコンテンツ ソース]オプションをオンにします。
注意: ここで選択したオプションは、手順 3 および手順 4f の操作に影響します。
これまでにインポートされたドキュメントを[ドキュメント設定]ページの設定内容で更新するには、[これらのドキュメントを更新する]オプションをオンにします。通常、ドキュメントの更新はドキュメント更新エージェントによって処理されるジョブであるため、ドキュメントを更新すると、コンテンツ クローラの処理速度が遅くなります。ただし、このコンテンツ クローラのドキュメント設定を変更したり、関連するコンテンツ タイプ内のプロパティ マップを変更した場合は、ドキュメントを更新すると、これまでにインポートされたドキュメント設定も更新されます。
注意: RSS フィードをクロールしている場合、[これらのドキュメントを更新する]オプションを使用すると、RSS フィードではなく、ターゲット ドキュメントの値でプロパティ (タイトルや説明など) が更新されます。RSS フィードのプロパティを保持する場合は、[これらのドキュメントを更新する]を選択しないでください。
追加フォルダを作成したり、別のフィルタを宛先フォルダに適用した場合は、[これらのドキュメントを追加のフォルダでソートする]チェック ボックスをオンにして、これまでにインポートされたドキュメントを新規のナレッジ ディレクトリ フォルダに分類します。
別のコンテンツ クローラによって同じコンテンツ ソースからドキュメントがインポートされ、このコンテンツ クローラに指定された宛先フォルダ以外のフォルダに保存されることがあります。ドキュメントを再ソートして、このコンテンツ クローラに指定された宛先フォルダに格納する必要があるかどうかを確認してください。
(手動による操作、期限切れ、またはソース ドキュメントの喪失などの理由により) これまでに削除されたドキュメントを再インポートするには、[削除されたリンクを再生成する]オプションをオンにします。これにより、ポータルで不要と見なされたドキュメントを再インポートできるようになることがあります。
どうしても必要な場合は、ポータルからすでに削除されたドキュメントに関する履歴を削除できます。[履歴]は、手順 3b で新規ドキュメントとして指定したときの内容で定義されます。
[このコンテンツ クローラ]を選択した場合、履歴には、このコンテンツ クローラによってインポートされ、削除されたすべてのドキュメントが含まれます。
[このコンテンツ ソース]を選択した場合、履歴には、 このコンテンツ ソースによってインポートされ、削除されたすべてのドキュメントが含まれます。したがって、このコンテンツ ソースからドキュメントをインポートするすべてのコンテンツ クローラの履歴が削除されることになります。
ポータルから削除されたドキュメントに関するレコードを削除するには、[削除履歴のクリア]をクリックします。
インポート済みのドキュメントにコンテンツ クローラ タグのマークを付けるには、[インポートされたドキュメントを次のコンテンツ クローラ タグでマーク]ボックスにタグを入力します。このタグは、このコンテンツ クローラによってインポートされたドキュメントと別のコンテンツ クローラによってインポートされたドキュメントを区別するために使用されます。
[ランタイムの設定]で、実行します。
ドキュメント取得の最大スレッド数 コンテンツ ソースからのコンテンツの取得に使用されるスレッドについて、同時に実行できる最大数を指定します。
カード インデックス作成の最大スレッド数 コンテンツがポータルに取り込まれた後、コンテンツの処理に使用されるスレッドについて、同時に実行できる最大数を指定します。
これらのフィールドに入力できる範囲は、ポータル設定ファイルで設定できます。ここで設定される値は、このコンテンツ クローラに関連するジョブで使用される Automation Service 最大スレッド数によっても制限されます。
このヘルプ トピックに関連するページを表示するには、次の操作を実行します。