区切り文字付きテキスト ファイルのインポート

区切り文字付きテキスト ファイルを分析のために Analytics にインポートするには、多種多様なツールを使用することができます。

機能の仕組み

データ定義ウィザードを使用することで、1 つまたは複数の区切り文字付きテキスト ファイルを選択してそのデータを Analytics にインポートできます。インポートされたデータを基に、1 つまたは複数の新しい Analytics テーブルおよび関連するデータ ファイル(.fil)が作成されます。インポートした個々の区切り文字付きテキスト ファイルは、個別の Analytics テーブルとなります。

Analytics データ ファイルには、元の区切り文字付きテキスト ファイルから完全に独立した、区切り文字付きデータのコピーが格納されます。

お使いのローカル コンピューターまたはネットワーク ドライブにある区切り文字付きテキスト ファイルをインポートできます。Analytics Exchange のユーザーは、Analytics サーバーにある区切り文字付きテキストにもアクセスできます。

1 つのファイルのインポートと複数のファイルのインポート

1 つの区切り文字付きテキスト ファイルをインポートすることも、複数の区切り文字付きファイルを 1 回の操作でインポートすることもできます。どちらのオプションを使用するかによって、インポート処理が多少異なってきます。

  • 1 つのファイル インポート処理時に、ファイル レベルのプロパティとフィールド レベルのプロパティをどちらも手動で定義することができます。
  • 複数のファイル インポート処理時にファイル レベルのプロパティのみを手動で定義することができます。フィールド レベルのプロパティは、Analytics により自動的に定義されるため、インポート時に手動で定義することはできません。

    たとえば、複数のファイルのインポート時に以下を行うことはできません

    • フィールドのデータ型の指定
    • インポート対象からフィールドを選択的に除外する

    データを Analytics にインポート後、データ定義を[テーブル レイアウト]ダイアログ ボックスで必要に応じて調整することができます。

複数のファイルの結合

複数の区切り文字付きテキスト ファイルを個々の Analytics テーブルにインポート後に、それらを 1 つの Analytics テーブルとして結合できます。たとえば、12 個の月次テーブルのデータをすべてのデータを含む単一の年次テーブルに結合できます。ファイルを結合できるのは、それらのファイルを個別の Analytics テーブルにインポートした後に限ります。

複数の Analytics テーブルを結合する方法については、テーブルの追加 を参照してください。

ヒント

作業を減らすには、新しい結合されたテーブルでデータ定義に必要な調整を行う前に、複数のテーブルを結合してみてください。

区切り文字付きのテキスト ファイルの構造化

区切り文字付きテキスト ファイルのファイル拡張子は通常、.txt または .csv ですが、他のファイル拡張子も使用できます。区切り文字付きテキスト ファイルは、主にスプレッドシートやデータベース アプリケーションからデータを Analytics にインポートするために使用します。データベースまたはスプレッドシートの各行はそれぞれ区切り文字付きテキスト ファイルの 1 行となり、各行または各レコードが行区切り文字で区切られます。有効な行区切り文字:

  • CR キャリッジ リターン
  • LF 改行
  • CRLF キャリッジ リターン改行(標準 DOS/Windows 文字シーケンス)

フィールド区切り文字

区切り文字付きテキスト ファイルの各レコードのフィールドはフィールド区切り文字で区切られます。主に 3 種類の区切り文字付きファイルがあります。これらはそれぞれ使用する次のようなフィールド区切り文字に基づいています。

  • カンマ区切り(.csv) – 各レコード内のフィールドを区切るためにカンマが使用されます。
  • タブ区切り – 各レコード内のフィールドを区切るためにタブが使用されます。
  • テキスト ファイル(.txt) – カンマ、タブ、または別のフィールド区切り文字が、各レコードのフィールドを区切るために使用されます。その他、一般的なフィールド区切り文字にはスペース、パイプ(|)およびセミコロン(;)があります。

テキスト修飾子文字

フィールド区切り文字が使用されている場合、テキスト修飾子文字を使用して文字フィールド値を囲み、その値をフィールド区切り文字と区別します。一般的なテキスト修飾子は二重引用符(" ")または一重引用符(' ')です。

たとえば、カンマがフィールド区切り文字の場合に、値 $1,000 をテキスト修飾子で囲んで "$1,000" とすると、元の値は、2 つの値($1 と 000)ではなく、単一の値として解釈されます。

区切られたテキスト ファイル

次の例では、区切り文字付きテキスト ファイルの最初の 4 件の行を表示します。

  • 最初の行にはフィールド名が格納されています。
  • フィールド区切り文字はカンマです。各行には 7 つのフィールドがありカンマで区切られています。
  • テキスト修飾子は二重引用符です。各行の最後のフィールドにはテキスト修飾子があり、ドルの値に含まれるカンマはフィールド区切り文字としては解釈されません。
First_Name,Last_Name,CardNum,EmpNo,HireDate,Salary,Bonus_2011
Lila,Remlawi,8590122497663807,000008,12/28/2007,52750,"$1,405.40"
Vladimir,Alexov,8590122281964011,000060,10/5/2007,41250,"$4,557.43"
Alex,Williams,8590124253621744,000104,8/12/2010,40175,"$7,460.02"

上書きの動作

区切り文字付きデータをインポートし、Analytics プロジェクト内の既存のテーブルと同じ名前を持つ新しい Analytics テーブルを作成する場合は、その既存のテーブルが上書きされます。

1 つの区切り文字付きテキスト ファイルのインポート

1 つの区切り文字付きテキスト ファイルをインポートして新しい Analytics テーブルを作成します。インポート処理時に、ファイル レベルのプロパティとフィールド レベルのプロパティをどちらも手動で定義することができます。

複数の区切り文字付きテキスト ファイルのインポート

1 回の操作で複数の区切り文字付きテキスト ファイルをインポートします。各区切り文字付きファイルは、Analytics プロジェクトにインポートされると、独立した Analytics テーブルになります。

インポート処理時にファイル レベルのプロパティのみを手動で定義することができます。フィールド レベルのプロパティは、Analytics により自動的に定義されるため、インポート時に手動で定義することはできません。

データを Analytics にインポート後、データ定義を[テーブル レイアウトAnalytics]ダイアログ ボックスで必要に応じて調整することができます。