コンセプト情報
複数の区切り文字付きファイルを定義およびインポートすることで、複数の Analytics テーブルを作成します。
構文
IMPORT MULTIDELIMITED <TO インポート フォルダー> FROM {ソース ファイル名|ソース フォルダー} ソースの文字エンコード SEPARATOR {文字|TAB|SPACE} QUALIFIER {文字|NONE} <CONSECUTIVE> STARTLINE 行番号 <KEEPTITLE> <CRCLEAR> <LFCLEAR> <REPLACENULL> <ALLCHAR>
メモ
IMPORT MULTIDELIMITED パラメーターを上記と完全に同じ順序で、以下のテーブルで指定する必要があります。
複数の区切り文字付きファイルを完全な形でインポートするには、それらすべてのファイルのインポート前の構造が同一である必要があります。
詳細については、同一のファイル構造が必要を参照してください。
パラメーター
名前 | 説明 | |||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
TO インポート フォルダー 省略可能 |
データをインポートするフォルダー。 フォルダーを指定するには、絶対ファイル パス、または Analytics プロジェクトを含むフォルダーに相対的なファイル パスを使用します。インポート フォルダーは引用符で囲んで指定します。 例TO "C:\Point of sale audit\Data\Transaction working data" TO "Data\Transaction working data"
TO を省略すると、データは Analytics プロジェクトを含むフォルダーにインポートされます。 |
|||||||||||||||
FROM ソース ファイル名 | ソース フォルダー |
ソース データ ファイル、またはソース データファイルを含むフォルダーの名前。 ソース ファイル名 またはソース フォルダーは引用符で囲んで指定します。 本コマンドでは、以下の 4 種類の区切り文字付きファイルがサポートされています。
メモ 区切り文字付きファイルの 64 文字を超える名前は、Analytics にインポートする際に切り捨てられます。Analytics のテーブル名は、最長で 64 文字の英数字(拡張子 .FIL を含まない)に制限されます。 また、区切り文字付きファイル名に含まれる以下の文字は、Analytics テーブル名ではアンダースコア文字(_)に置き換わります。
ルートの Analytics プロジェクト フォルダーのソース データ ファイル 複数のファイルを指定するには、ファイル名の中の一意の文字の代わりに、ワイルドカード文字 (*) を使用します。ワイルドカード文字は、任意の文字、数字、または特殊文字のゼロ (0) 回以上の出現を表します。 例FROM "Transactions_FY*.csv"
次のファイルが選択されます。 Transactions_FY18.csv Transactions_FY17.csv ワイルドカードは、ファイル名およびファイル拡張子における複数の位置にも使用できます。 例FROM "Transactions_FY*.*"
次のファイルが選択されます。 Transactions_FY18.txt Transactions_FY17.csv ルートの Analytics プロジェクト フォルダー以外の場所にあるソース データ ファイル ソース データ ファイルが Analytics プロジェクトと同じディレクトリに位置していない場合、ファイルの位置を指定するために、絶対ファイル パス、またはプロジェクトを含むフォルダからの相対ファイル パスを使用する必要があります。 例FROM "C:\Point of sale audit\Data\Transaction master files\Transactions_FY*.csv" FROM "Data\Transaction master files\Transactions_FY*.csv"
ソース データ ファイルを含むフォルダー ソース データ ファイル名を指定する代わりに、そのファイルを含むフォルダーの名前だけを指定することもできます。フォルダーに含まれるファイルのうち、サポートされている区切り文字付きファイル( *.csv、*.dat、*.del、*.txt)がすべてインポートされます。 ソース データ フォルダーを指定するには、絶対ファイル パス、またはAnalytics プロジェクトを含むフォルダーに相対的なファイル パスを使用します。 例FROM "C:\Point of sale audit\Data\Transaction master files" FROM "Data\Transaction master files"
|
|||||||||||||||
ソースの文字エンコード |
ソース データの文字セットおよび文字エンコード。 お使いの Analytics エディションとソース データのエンコードに応じて、次のうち該当するコードを指定してください。
メモ コードを指定しない場合は、非 Unicode 版の Analytics では 0 が、Unicode 版の Analytics では 2 が、それぞれ自動的に使用されます。 |
|||||||||||||||
SEPARATOR 文字 | TAB | SPACE |
ソース データのフィールド間で使用される区切り文字。文字は引用符で囲まれた文字列として指定する必要があります。 タブまたは空白を区切り文字として指定するには、それらを二重引用符で囲んで入力するか、またはそれらのキーワードを使用します。
|
|||||||||||||||
QUALIFIER 文字 | NONE |
ソース データ内のフィールド値を折り返すためと識別するために使用するテキスト修飾子文字。文字は引用符で囲まれた文字列として指定する必要があります。 文字をテキスト修飾子として指定するには、二重引用符を一重引用符で囲む必要があります。QUALIFIER '"' テキスト修飾子がないことを指定するには、次のいずれかの方法を使用します。
|
|||||||||||||||
CONSECUTIVE 省略可能 |
連続したテキスト修飾子を単一の修飾子として扱います。 |
|||||||||||||||
STARTLINE 行番号 |
データが始まる行。 たとえば、データの最初の 4 行にヘッダー情報が含まれており、それらをインポートの対象外とする場合は、行番号「5」を指定します。 メモ IMPORT MULTIDELIMITED を 1 回実行することでインポートするすべての区切り文字付きファイルにおいて、データの開始行を同じにすることをお勧めします。 異なる開始行にする場合は、同一のファイル構造が必要を参照してください。 |
|||||||||||||||
KEEPTITLE 省略可能 |
STARTLINE に指定する行番号をデータでなくフィールド名と見なします。KEEPTITLE を省略すると、汎用フィールド名が使用されます。 メモ IMPORT MULTIDELIMITED を 1 回実行することでインポートするすべての区切り文字付きファイルにおいて、各フィールド名が同じ行番号になければなりません。 各フィールド名の行番号が異なる場合は、同一のファイル構造が必要を参照してください。 |
|||||||||||||||
CRCLEAR 省略可能 |
テキスト修飾子間で発生するすべての CR 文字(キャリッジリターン)をスペース文字で置換します。CRCLEAR を使用するには、QUALIFIER と文字値を指定する必要があります。 CRCLEAR と LFCLEAR の両方を使用する場合は、CRCLEAR を最初に記述する必要があります。 |
|||||||||||||||
LFCLEAR 省略可能 |
テキスト修飾子間で発生するすべての LF 文字(ラインフィード)をスペース文字で置換します。LFCLEAR を使用するには、QUALIFIER と文字値を指定する必要があります。 CRCLEAR と LFCLEAR の両方を使用する場合は、CRCLEAR を最初に記述する必要があります。 |
|||||||||||||||
REPLACENULL 省略可能 |
スペースで区切られたファイルで発生するすべての NUL 文字を置換します。置き換えられたすべての NULL 文字の数がログに記録されます。 |
|||||||||||||||
ALLCHAR 省略可能 |
インポートされたすべてのフィールドには、自動的に文字のデータ型が割り当てられます。 ヒント インポートされたすべてのフィールドに文字のデータ型を割り当てると、区切り文字付きテキスト ファイルのインポート処理が容易になります。Analytics にインポートされたデータのフィールドには、数値や日付時刻などのさまざまなデータ型を割り当て、書式の詳細を指定することができます。 Analytics によって識別子のフィールドに数値のデータ型が自動的に割り当てられたテーブルをインポートする際、実際には文字のデータ型を使用する必要がある場合には、ALLCHAR を使用することができます。 |
例
後続の例では、次のような 12 個の区切り文字付きファイルに保存された月次取引データがある場合を想定しています。
- Transactions_Jan.csv ~ Transactions_Dec.csv
メモ
インポートする区切り文字付きファイルごとに、独立した Analytics テーブルが作成されます。
すべての区切り文字付きファイルをインポートする
12 個すべての区切り文字付きファイルをインポートするとします。各ファイル名に含まれる月名の位置で、ワイルドカード記号 (*) を使用します。
Analytics は各フィールドに適切なデータ型を割り当てようとします。
IMPORT MULTIDELIMITED FROM "Transactions_*.csv" 0 SEPARATOR "," QUALIFIER '"' CONSECUTIVE STARTLINE 1 KEEPTITLE
すべての区切り文字付きファイルを文字型データとしてインポートする
この例は上の例と似ていますが、相違点は、インポートされるすべてのフィールドに対して Analytics により自動的に文字のデータ型が割り当てられる点です。
IMPORT MULTIDELIMITED FROM "Transactions_*.csv" 0 SEPARATOR "," QUALIFIER '"' CONSECUTIVE STARTLINE 1 KEEPTITLE ALLCHAR
指定されたフォルダーからすべての区切り文字付きファイルをインポートする
C:\Point of sale audit\Data\Transaction master files フォルダーにあるすべての区切り文字付きファイルをインポートします。
IMPORT MULTIDELIMITED FROM "C:\Point of sale audit\Data\Transaction master files" 0 SEPARATOR "," QUALIFIER '"' CONSECUTIVE STARTLINE 1 KEEPTITLE
指定されたフォルダーにあるすべての区切り文字付きファイルをインポートし、Analytics テーブルを別のフォルダーに保存
この例は上記の例と同じですが、Analytics テーブルをルート プロジェクト フォルダーに保存するのではなく、C:\Point of sale audit\Data\Transaction working data フォルダーに保存します。
IMPORT MULTIDELIMITED TO "C:\Point of sale audit\Data\Transaction working data" FROM "C:\Point of sale audit\Data\Transaction master files" 0 SEPARATOR "," QUALIFIER '"' CONSECUTIVE STARTLINE 1 KEEPTITLE
備考
同一のファイル構造が必要
IMPORT MULTIDELIMITED を使って複数の区切り文字付きファイルを完全な形でインポートするには、それらすべてのファイルの構造が同一である必要があります。
異なる構造の区切り文字付きファイルをインポートした場合でも、後から Analytics でデータをクレンジングおよび正規化することもできます。ただし、このように行うと、より多くの作業が必要となる可能性があります。通常、これより簡単なのは、区切り文字付きファイルをインポートする前にそれらを同じ構造にしておくことです。
複数の区切り文字付きファイルを完全な形でインポートするには、以下の項目がすべてのファイルにおいて同じである必要があります。
項目 | ACLScript のキーワード | 問題 | 解決策 |
---|---|---|---|
ソース データの文字セットおよび文字エンコード |
数値コード |
(Analytics の Unicode 版のみ) ソースの区切り文字付きファイルに応じて、異なる文字エンコードが使用されています。たとえば、ASCII エンコードを使用しているファイルもあれば、Unicode エンコードを使用しているファイルもあります。 |
エンコード タイプ別にソース ファイルをグループ化し、各グループを別々にインポートします。 |
区切り文字 | SEPARATOR | ソースの区切り文字付きファイルに応じて、フィールド間に異なる区切り文字が使用されています。 |
次のいずれかを実行します。
|
テキスト修飾子文字 | QUALIFIER | ソースの区切り文字付きファイルに応じて異なるテキスト修飾子文字が使用されることで、フィールド値が折り返されるとともに識別されています。 |
次のいずれかを実行します。
|
データの開始行 | STARTLINE |
ソースの区切り文字付きファイルごとにデータの開始行が異なります。 |
次のいずれかを実行します。
|
フィールド名 | KEEPTITLE | ソースの区切り文字付きファイルに応じて、各フィールド名が異なる行番号にあります。 |
次のいずれかを実行します。
|
フィールド名 | KEEPTITLE | ソースの区切り文字付きファイルによって、フィールド名があるファイルと、フィールド名がないファイルがあります。 |
次のいずれかを実行します。
|
複数の IMPORT DELIMITED コマンド
IMPORT MULTIDELIMITED コマンドは、インポートされるファイルごとに実際に個別の IMPORT DELIMITED コマンドを 1 つずつ実行するものです。ログの IMPORT MULTIDELIMITED エントリをダブルクリックすると、個別の IMPORT DELIMITED コマンドが表示領域に表示されます。
複数の区切り文字付きファイルをインポート後に結合する
複数の区切り文字付きファイルを個々の Analytics テーブルにインポート後に、それらを 1 つの Analytics テーブルに結合できます。たとえば、12 個の月次テーブルのデータをすべてのデータを含む単一の年次テーブルに結合できます。
複数の Analytics テーブルを結合する方法については、APPEND コマンド を参照してください。