区切り文字付きテキスト ファイルのインポート

区切り文字付きテキスト ファイルを分析のために Analytics にインポートするには、多種多様なツールを使用することができます。

機能の仕組み

データ定義ウィザードを使用することで、1 つまたは複数の区切り文字付きテキスト ファイルを選択してそのデータを Analytics にインポートできます。 インポートされたデータを基に、1 つまたは複数の新しい Analytics テーブルおよび関連するデータ ファイル(.fil)が作成されます。 インポートした個々の区切り文字付きテキスト ファイルは、個別の Analytics テーブルとなります。

Analytics データ ファイルには、元の区切り文字付きテキスト ファイルから完全に独立した、区切り文字付きデータのコピーが格納されます。

お使いのローカル コンピューターまたはネットワーク ドライブにある区切り文字付きテキスト ファイルをインポートできます。 Analytics Exchange のユーザーは、Analytics サーバーにある区切り文字付きテキストにもアクセスできます。

1 つのファイルのインポートと複数のファイルのインポート

1 つの区切り文字付きテキスト ファイルをインポートすることも、複数の区切り文字付きファイルを 1 回の操作でインポートすることもできます。 どちらのオプションを使用するかによって、インポート処理が多少異なってきます。

  • 1 つのファイル インポート処理時に、ファイル レベルのプロパティとフィールド レベルのプロパティをどちらも手動で定義することができます。
  • 複数のファイル インポート処理時にファイル レベルのプロパティのみを手動で定義することができます。 フィールド レベルのプロパティは、Analytics により自動的に定義されるため、インポート時に手動で定義することはできません。

    たとえば、複数のファイルのインポート時に以下を行うことはできません。

    • フィールドのデータ型の指定
    • インポート対象からフィールドを選択的に除外する

    データを Analytics にインポート後、データ定義を[テーブル レイアウト]ダイアログ ボックスで必要に応じて調整することができます。

複数のファイルの結合

複数の区切り文字付きテキスト ファイルを個々の Analytics テーブルにインポート後に、それらを 1 つの Analytics テーブルとして結合できます。 たとえば、12 個の月次テーブルのデータをすべてのデータを含む単一の年次テーブルに結合できます。 ファイルを結合できるのは、それらのファイルを個別の Analytics テーブルにインポートした後に限ります。

複数の Analytics テーブルを結合する方法については、テーブルの追加 を参照してください。

ヒント

作業を減らすには、新しい結合されたテーブルでデータ定義に必要な調整を行う前に、複数のテーブルを結合してみてください。

区切り文字付きのテキスト ファイルの構造化

区切り文字付きテキスト ファイルのファイル拡張子は通常、.txt または .csv ですが、他のファイル拡張子も使用できます。 区切り文字付きテキスト ファイルは、主にスプレッドシートやデータベース アプリケーションからデータを Analytics にインポートするために使用します。 データベースまたはスプレッドシートの各行はそれぞれ区切り文字付きテキスト ファイルの 1 行となり、各行または各レコードが行区切り文字で区切られます。 有効な行区切り文字:

  • CR キャリッジ リターン
  • LF 改行
  • CRLF キャリッジ リターン改行(標準 DOS/Windows 文字シーケンス)

フィールド区切り文字

区切り文字付きテキスト ファイルの各レコードのフィールドはフィールド区切り文字で区切られます。 主に 3 種類の区切り文字付きファイルがあります。これらはそれぞれ使用する次のようなフィールド区切り文字に基づいています。

  • カンマ区切り(.csv) – 各レコード内のフィールドを区切るためにカンマが使用されます。
  • タブ区切り – 各レコード内のフィールドを区切るためにタブが使用されます。
  • テキスト ファイル(.txt) – カンマ、タブ、または別のフィールド区切り文字が、各レコードのフィールドを区切るために使用されます。 その他、一般的なフィールド区切り文字にはスペース、パイプ(|)およびセミコロン(;)があります。

テキスト修飾子文字

フィールド区切り文字が使用されている場合、テキスト修飾子文字を使用して文字フィールド値を囲み、その値をフィールド区切り文字と区別します。 一般的なテキスト修飾子は二重引用符(" ")または一重引用符(' ')です。

たとえば、カンマがフィールド区切り文字の場合に、値 $1,000 をテキスト修飾子で囲んで "$1,000" とすると、元の値は、2 つの値($1 と 000)ではなく、単一の値として解釈されます。

区切られたテキスト ファイル

次の例では、区切り文字付きテキスト ファイルの最初の 4 件の行を表示します。

  • 最初の行にはフィールド名が格納されています。
  • フィールド区切り文字はカンマです。 各行には 7 つのフィールドがありカンマで区切られています。
  • テキスト修飾子は二重引用符です。 各行の最後のフィールドにはテキスト修飾子があり、ドルの値に含まれるカンマはフィールド区切り文字としては解釈されません。
First_Name,Last_Name,CardNum,EmpNo,HireDate,Salary,Bonus_2011
Lila,Remlawi,8590122497663807,000008,12/28/2007,52750,"$1,405.40"
Vladimir,Alexov,8590122281964011,000060,10/5/2007,41250,"$4,557.43"
Alex,Williams,8590124253621744,000104,8/12/2010,40175,"$7,460.02"

上書きの動作

区切り文字付きデータをインポートし、Analytics プロジェクト内の既存のテーブルと同じ名前を持つ新しい Analytics テーブルを作成する場合は、その既存のテーブルが上書きされます。

1 つの区切り文字付きテキスト ファイルのインポート

1 つの区切り文字付きテキスト ファイルをインポートして新しい Analytics テーブルを作成します。 インポート処理時に、ファイル レベルのプロパティとフィールド レベルのプロパティをどちらも手動で定義することができます。

複数の区切り文字付きテキスト ファイルのインポート

1 回の操作で複数の区切り文字付きテキスト ファイルをインポートします。 各区切り文字付きファイルは、Analytics プロジェクトにインポートされると、独立した Analytics テーブルになります。

インポート処理時にファイル レベルのプロパティのみを手動で定義することができます。 フィールド レベルのプロパティは、Analytics により自動的に定義されるため、インポート時に手動で定義することはできません。

データを Analytics にインポート後、データ定義を[テーブル レイアウト]ダイアログ ボックスで必要に応じて調整することができます。