データベースのインポート設定 (テキスト ファイル ソース) ウィンドウ

このウィンドウを使用して、区切りテキスト ファイル (CSV) に基づく Fuzzy データベースのインポート設定を構成します。

[ソース ファイル]

このグループには次の設定があります。

[手動でサーバーにファイルをアップロードする]

Kofax Search and Matching Server でアクセスできないインポート用のソース ファイルを定義するには、この設定を選択します。ファイル名 (ファイル パスとファイル名) を入力するか、[開く] ウィンドウでファイルを選択します。[アップロード] をクリックしてファイルをサーバーにストリーミングし、テーブルのプレビューを表示して、使用する列やその他のインポート オプションを設定できるようにします。

重要 アップロード済みのファイルについては、自動更新を定義することはできません。新しいレコードが追加されたり、列が追加または削除されたりした場合など、ソース ファイルが変更された場合は、手動でソース ファイルをアップロードする必要があることに注意してください。
[サーバーは URL/UNC の場所からファイルにアクセス]

構成されたファイルにアクセスして読み取るために必要なすべての権限が Kofax Search and Matching Server にある場合は、この設定を選択します。ファイル名 (ファイル パスとファイル名) を入力するか、[開く] ウィンドウでファイルを選択します。使用する列やその他のインポート オプションを選択するためのテーブルのプレビューが表示されます。

[列の構成]

このグループには次の設定があります。

このグループには、データベース列のリストと、[検索][フィルタ] の 2 つのチェックボックスを含むテーブルが配置されています。

その列をデータベース検索に含める場合は、[検索] を選択します。列にフィルタを使用する場合は、[フィルタ] を選択します。フィルタは、リモート Fuzzy データベースでのみ使用できます。

列の名前を変更するには、列を選択してからもう一度クリックし、列名を編集可能にします。多くの場合、データベースには内部顧客 ID や連絡先名などの追加の列が含まれているため、これらの内容がドキュメントに表示されないように、Fuzzy データベースの作成に関する考慮事項に注意を払う必要があります。デフォルトでは、使用可能なすべてのデータベース列が選択されています。

[インポート オプション]

このグループには次の設定があります。

[大文字と小文字を区別しない]

大文字と小文字を区別せず、すべての検索文字列とルックアップ文字列を小文字に変換するには、このオプションを選択します。これがデフォルトの設定です。

[最初の行にキャプションが含まれています]

入力ファイルの最初のレコードに列ヘッダが含まれている場合は、この設定を選択します。これらの名前は、データベース ロケータでフィールド名として使用されます。データベースがこの設定を選択する前に参照されていた場合は、後でこの設定を選択できます。データベースの各エントリは自動的に更新されます。デフォルトでは、この設定が選択されています。

[インポート後にデータベースをアクティブ化]

新しく構成したデータベースに対してこの設定を選択すると、インポート後にデータベースが自動的にアクティブになります。この設定は新しいデータベースに対してのみ表示され、次回 [インポート設定] ウィンドウを開いたときには非表示になることに注意してください。

フィルタでは大文字と小文字が区別されます

選択した場合、フィルタリングを使用すると、検索で大文字と小文字が区別されます。

半角/全角のカタカナ文字を正規化する

選択すると、半角カタカナとハングルの Unicode 文字が対応する全角の文字に変換されます。同様に、全角 ASCII/ラテン Unicode 文字は、対応する半角文字に置き換えられます。これは、これらの文字が通常、欧米のドキュメントで表示される方法です。

この変換は、これらの文字がドキュメントまたはデータベースで見つかった場合に発生します。

この設定はデフォルトではクリアになっています。

[CJK 文字を 1 つの単語として処理する]

選択すると、中国語、日本語、韓国語の文字が 1 つの単語として個別に処理されます。これは、これらの言語には、単語を区切るためのスペースなどの区切り文字がないためです。

この設定はデフォルトではクリアになっています。

[フィールド区切り文字]

このフィールドに値を入力して、インポート ファイルの内容を個々のフィールドに区切る文字を指定します。この設定の値は、[;] (セミコロン) がデフォルトで設定されています。

タブ

[フィールド区切り文字] の設定で指定した文字に加えて、タブを区切り文字として使用するには、このチェックボックスを選択します。

[単語区切り文字]

データベースのフィールドに複合語が含まれている場合、複合語の各部分が個別に検索および評価されるように、共通の文字を指定できます。この設定の値は、 「 -,」 (スペース、ハイフン、コンマ) がデフォルトで設定されています。

たとえば、デフォルト設定を使用すると、複合語Diagon-Alleyは、diagonalleyという 2 つの単語として扱われ、個別に検索および評価されます。

区切り文字は、OCR に定義されている区切り文字に対応している必要があります。
タブ

[単語区切り文字] の設定で指定した文字に加えて、タブを単語区切り文字として使用する場合は、このチェックボックスを選択します。

スペース

[単語区切り文字] の設定で指定した文字に加えて、スペースを単語区切り文字として使用する場合は、このチェックボックスを選択します。

[無視する文字]

入力レコードから不要な文字をフィルタするには、このフィールドに文字のリストを入力します。カンマ (,) など、入力内の文字であるフィールド区切り文字を使用する場合は、引用符 (") を使用して入力文字列が識別されるようにする必要があります。ただし、最終結果の一部としてこれらの引用符を残したくない場合もあります。

無視する文字として引用符を定義すると、引用符は削除されます。無視する文字としてタブまたはスペースを定義するには、対応するチェックボックスをオンにします。この設定の値は、[."'!](ピリオド、引用符、単一引用符、および感嘆符) がデフォルトで設定されています。

スペース

[無視する文字] の設定で指定した文字に加えて、空白文字を無視する場合は、このチェックボックスを選択します。

[文字列置換]

次のボタンを使用して、ドキュメントおよびデータベースで検索テキストを置換テキストに置き換えるために使用する [文字列置換] を管理できます。

[追加]

[追加] [アイテムを追加] アイコン をクリックして、新しい文字列置換ペアを置換リストに追加します。

[削除]

[削除] 削除アイコン をクリックして、置換リストで選択したアイテムを削除します。

[変更]

[変更] をクリックして、置換リストで選択したアイテムを 2 つの編集フィールドの値で変更します。

[インポート]

[インポート] をクリックして、文字列置換のリストを含むファイルをインポートします。インポートの場合は、現在の置換リストに文字列置換を追加するか、インポートされたリストで置き換えることができます。Kofax Search and Matching Server データベースおよび Kofax Transformation Modules Project Builder または Kofax TotalAgility Transformation Designer データベースからエクスポートされた文字列置換をインポートできます。

[エクスポート]

[エクスポート] をクリックして、文字列置換ペアをテキスト ファイルにエクスポートします。次に、他の Kofax Search and Matching Server または Project Builder データベースで使用する文字列置換をインポートします。

[テーブル レコードのプレビュー]

[テーブル レコードのプレビュー] エリアには、参照テーブルの最初の 20 件のレコードについての読み取り専用プレビューが表示されます。使用する列が選択されていない場合はグレー表示されることに注意してください。

共通ボタンの他に、ウィンドウの下部には次のボタンもあります。

[データベースのインポート]

定義されたインポート設定に沿って Fuzzy データベースを作成します。