データベースのインポート設定 (リレーショナル データベース ソース) ウィンドウ

このウィンドウを使用して、リレーショナル データベース (Microsoft SQL Server、Microsoft Access、MySQL、または Oracle データベース) で作成された Fuzzy データベースのインポート設定を構成します。

[接続タイプ]

この設定には次の値があります。値を 1 つ選択して、接続タイプを選択します。

  • [Microsoft SQL Server]

    Microsoft SQL Server 接続を設定します。

  • [ODBC]

    Microsoft Access など、開いているデータベース接続を使用して別のタイプのデータベースを構成します。

  • [Oracle]

    Oracle データベース接続を設定します。

接続文字列

このグループには次の設定があります。

接続文字列

接続文字列には、サーバー名とデータベース、または DSN (データ ソース名) が含まれます。接続文字列には、データベースへの接続に必要な認証の詳細を含めることもできます。[構成] をクリックして、Microsoft SQL ServerODBC、または Oracle 接続タイプの接続を設定します。

すべてのパスワード情報は完全に暗号化されています。
[構成]

このボタンをクリックして、選択した接続タイプの接続文字列を設定します。有効な接続文字列の場合にのみ接続が確立され、利用可能なテーブル、ビュー、またはストアド プロシージャのリストが表示されます。

[テーブル、ビュー、シノニムまたはストアド プロシージャ]

接続文字列が構成されて正常にテストが完了すると、利用可能なテーブル、ビュー、およびシノニムのリストが表示されます。Microsoft SQL Server および Oracle データベースの場合は、ストアド プロシージャが表示されます。リストからテーブル、ビュー、シノニム、またはストアド プロシージャを選択します。この選択は、以下の [テーブル レコードのプレビュー] テーブルのデータを更新する Fuzzy データベースの作成に使用されます。

[更新]

このボタンをクリックして、[テーブル、ビュー、シノニムまたはストアド プロシージャ] のリストを入力します。

[使用する列]

データベース内の列のリストが表示されます。使用している列を選択します。

[インポート オプション]

このグループには次の設定があります。

[大文字と小文字を区別しない]

大文字と小文字を区別せず、すべての検索文字列とルックアップ文字列を小文字に変換するには、このオプションを選択します。これがデフォルトの設定です。

[最初の行にキャプションが含まれています]

入力ファイルの最初のレコードに列ヘッダが含まれている場合は、この設定を選択します。これらの名前は、データベース ロケータでフィールド名として使用されます。データベースがこの設定を選択する前に参照されていた場合は、後でこの設定を選択できます。データベースの各エントリは自動的に更新されます。デフォルトでは、この設定が選択されています。

この設定は、リレーショナル データベースでは無効になっている可能性があります。

[インポート後にデータベースをアクティブ化]

新しく構成したデータベースに対してこの設定を選択すると、インポート後にデータベースが自動的にアクティブになります。この設定は新しいデータベースに対してのみ表示され、次回 [インポート設定] ウィンドウを開いたときには非表示になることに注意してください。

フィルタでは大文字と小文字が区別されます

選択した場合、フィルタリングを使用すると、検索で大文字と小文字が区別されます。

半角/全角のカタカナ文字を正規化する

選択すると、半角カタカナとハングルの Unicode 文字が対応する全角の文字に変換されます。同様に、全角 ASCII/ラテン Unicode 文字は、対応する半角文字に置き換えられます。これは、これらの文字が通常、欧米のドキュメントで表示される方法です。

この変換は、これらの文字がドキュメントまたはデータベースで見つかった場合に発生します。

この設定はデフォルトではクリアになっています。

[CJK 文字を 1 つの単語として処理する]

選択すると、中国語、日本語、韓国語の文字が 1 つの単語として個別に処理されます。これは、これらの言語には、単語を区切るためのスペースなどの区切り文字がないためです。

この設定はデフォルトではクリアになっています。

[フィールド区切り文字]

このフィールドに値を入力して、インポート ファイルの内容を個々のフィールドに区切る文字を指定します。この設定の値は、[;] (セミコロン) がデフォルトで設定されています。

タブ

[フィールド区切り文字] の設定で指定した文字に加えて、タブを区切り文字として使用するには、このチェックボックスを選択します。

[単語区切り文字]

データベースのフィールドに複合語が含まれている場合、複合語の各部分が個別に検索および評価されるように、共通の文字を指定できます。この設定の値は、 「 -,」 (スペース、ハイフン、コンマ) がデフォルトで設定されています。

たとえば、デフォルト設定を使用すると、複合語Diagon-Alleyは、diagonalleyという 2 つの単語として扱われ、個別に検索および評価されます。

区切り文字は、OCR に定義されている区切り文字に対応している必要があります。
タブ

[単語区切り文字] の設定で指定した文字に加えて、タブを単語区切り文字として使用する場合は、このチェックボックスを選択します。

スペース

[単語区切り文字] の設定で指定した文字に加えて、スペースを単語区切り文字として使用する場合は、このチェックボックスを選択します。

[無視する文字]

入力レコードから不要な文字をフィルタするには、このフィールドに文字のリストを入力します。カンマ (,) など、入力内の文字であるフィールド区切り文字を使用する場合は、引用符 (") を使用して入力文字列が識別されるようにする必要があります。ただし、最終結果の一部としてこれらの引用符を残したくない場合もあります。

無視する文字として引用符を定義すると、引用符は削除されます。無視する文字としてタブまたはスペースを定義するには、対応するチェックボックスをオンにします。この設定の値は、[."'!](ピリオド、引用符、単一引用符、および感嘆符) がデフォルトで設定されています。

スペース

[無視する文字] の設定で指定した文字に加えて、空白文字を無視する場合は、このチェックボックスを選択します。

次のボタンを使用して、ドキュメントおよびデータベースで検索テキストを置換テキストに置き換えるために使用する [文字列置換] を管理できます。

[追加]

[追加] [アイテムを追加] アイコン をクリックして、新しい文字列置換ペアを置換リストに追加します。

[削除]

[削除] 削除アイコン をクリックして、置換リストで選択したアイテムを削除します。

[変更]

[変更] をクリックして、置換リストで選択したアイテムを 2 つの編集フィールドの値で変更します。

[インポート]

[インポート] をクリックして、文字列置換のリストを含むファイルをインポートします。インポートの場合は、現在の置換リストに文字列置換を追加するか、インポートされたリストで置き換えることができます。Kofax Search and Matching Server データベースおよび Kofax Transformation Modules Project Builder または Kofax TotalAgility Transformation Designer データベースからエクスポートされた文字列置換をインポートできます。

[エクスポート]

[エクスポート] をクリックして、文字列置換ペアをテキスト ファイルにエクスポートします。次に、他の Kofax Search and Matching Server または Project Builder データベースで使用する文字列置換をインポートします。

[テーブル レコードのプレビュー] エリアには、参照テーブルの最初の 20 件のレコードについての読み取り専用プレビューが表示されます。使用する列が選択されていない場合はグレー表示されることに注意してください。

ウィンドウの下部にあるボタンの説明は、共通ボタンを参照してください。

[データベースのインポート]

定義されたインポート設定に沿って、リレーショナル データベースの Fuzzy データベースを作成します。