区切り文字付きテキスト ファイルのインポート

区切り文字付きテキスト ファイルを定義およびインポートして、Analytics テーブルを作成できます。区切り文字付きテキスト ファイルは通常、.txt、.csv(カンマ区切り)、または .tsv(タブ区切り)のファイル拡張子を持ちます。

お使いのローカル コンピューターまたはネットワーク ドライブにある区切り文字付きテキスト ファイルを定義およびインポートできます。Analytics Exchange のユーザーは、Analytics サーバーにある区切り文字付きテキストにもアクセスできます。

区切り文字付きのテキスト ファイルの構造化

区切り文字付きテキスト ファイルは、主にスプレッドシートやデータベース アプリケーションからデータを Analytics にインポートするために使用します。データベースまたはスプレッドシートの各行はそれぞれ区切り文字付きテキスト ファイルの 1 行となり、各行または各レコードが行区切り文字で区切られます。有効な行区切り文字:

  • CR キャリッジ リターン
  • LF 改行
  • CRLF キャリッジ リターン改行(標準 DOS/Windows 文字シーケンス)

フィールド区切り文字

区切り文字付きテキスト ファイルの各レコードのフィールドはフィールド区切り文字で区切られます。主に 3 種類の区切り文字付きファイルがあります。これらはそれぞれ使用する次のようなフィールド区切り文字に基づいています。

  • カンマ区切り(.csv) – 各レコード内のフィールドを区切るためにカンマが使用されます。
  • タブ区切り(.tsv) – 各レコード内のフィールドを区切るためにタブが使用されます。
  • テキスト ファイル(.txt) – カンマ、タブ、または別のフィールド区切り文字が、各レコードのフィールドを区切るために使用されます。その他、一般的なフィールド区切り文字にはスペース、パイプ(|)およびセミコロン(;)があります。

テキスト修飾子文字

フィールド区切り文字が使用されている場合、テキスト修飾子文字を使用して文字フィールド値を囲み、その値をフィールド区切り文字と区別します。一般的なテキスト修飾子は二重引用符(" ")または一重引用符(' ')です。

たとえば、カンマがフィールド区切り文字の場合に、値 $1,000 をテキスト修飾子で囲んで "$1,000" とすると、元の値は、2 つの値($1 と 000)ではなく、単一の値として解釈されます。

区切られたテキスト ファイル

次の例では、区切り文字付きテキスト ファイルの最初の 4 件の行を表示します。

  • 最初の行にはフィールド名が格納されています。
  • フィールド区切り文字はカンマです。各行には 7 つのフィールドがありカンマで区切られています。
  • テキスト修飾子は二重引用符です。各行の最後のフィールドにはテキスト修飾子があり、ドルの値に含まれるカンマはフィールド区切り文字としては解釈されません。
First_Name,Last_Name,CardNum,EmpNo,HireDate,Salary,Bonus_2011
Lila,Remlawi,8590122497663807,000008,12/28/2007,52750,"$1,405.40"
Vladimir,Alexov,8590122281964011,000060,10/5/2007,41250,"$4,557.43"
Alex,Williams,8590124253621744,000104,8/12/2010,40175,"$7,460.02"

区切り文字付きテキスト ファイルの検索と選択

ご利用になった Analytics のインストールに一致する方法を使用します。

Analytics のスタンドアロンのインストール

  1. ファイル > 新規作成 > テーブル]の順にクリックします。
  2. データ ソースの選択]ページで[ファイル]が選択されていることを確認し、[次へ]をクリックします。
  3. 定義するファイルの選択]ダイアログ ボックスで、Analytics テーブルの作成元とする区切り文字付きテキスト ファイルを探して選択し、[開く]をクリックします。

Analytics Exchange と統合された Analytics

  1. ファイル > 新規作成 > テーブル]の順にクリックします。
  2. データ ソースのプラットフォームの選択]ページで、次のいずれかを実行します。
    • Analytics を使用してデータにアクセスするには[ローカル]を選択し、[次へ]をクリックします。
    • Analytics サーバーを使用してデータにアクセスするには、[ACL サーバー]を選択し、ドロップダウン リストから Windows サーバー プロファイルを選択して[次へ]をクリックします。

  3. ローカル]を選択した場合:
    1. ローカル データ ソースの選択ページで[ファイル]が選択されていることを確認します。
    2. 次へ]をクリックします。
  4. ACL Server を選択した場合:
    1. サーバー プロファイル パスワードの入力を要求された場合は、パスワードを入力します。
    2. ACL サーバー データ ソースの選択]ページで[フラット ファイル]が選択されていることを確認します。
    3. 次へ]をクリックします。
  5. 定義するファイルの選択]ダイアログ ボックスで、Analytics テーブルの作成元とする区切り文字付きテキスト ファイルを探して選択し、[開く]をクリックします。

区切り文字付きファイルのプロパティの指定

  1. 文字セット]ページで、正しい文字セット オプションが選択されていることを確認し、[次へ]をクリックします。
  2. ファイル形式]ページで、[区切り文字付きテキスト ファイル]オプションが選択されていることを確認し、[次へ]をクリックします。
  3. 区切り文字付きファイルのプロパティ]ページで、Analytics によって、以下に一覧されたプロパティへと割り当てられた設定をレビューし、必要な更新を行い、[次へ]をクリックします。
    プロパティ 説明
    開始する行 ファイルの読み取りを開始する行番号。

    この設定により、インポートしない情報を含むファイルが始まる行をスキップできます。たとえば、ファイルの先頭 3 行にヘッダー情報が含まれている場合、4 行目からデータの読み取りを開始するには、「4」と入力します。

    フィールドの幅

    プレビュー テーブルの選択された列見出しに、結果として得られるテーブル レイアウトのフィールド長を指定します。文字で長さを指定します。

    Analytics で割り当てられた長さを保持するか、別の長さを入力することができます。

    ヒント

    更新されたソース データから結果として得られる Analytics テーブルを定期的に更新する、またはインポート コマンドを再利用する予定である場合は、Analytics によって割り当てられたものより長いフィールド長を入力します。

    ソース データの更新された値が現在のいずれかの値より長い場合は、それより長いフィールド長によって余分のスペースが与えられます。利用可能なフィールド長を超える値は切り詰められます。

    \[先頭の行をフィールド名として使用する] ファイルの第 1 行の値は、結果として得られるテーブル レイアウトのフィールド名として使用されます。

    メモ

    この設定を使用する場合、フィールド名として使用される行は、行番号が[開始する行]で指定される行です。フィールド名が正しくない場合は、[データ定義ウィザード]の後続ページで更新できます。

    連続した修飾子は 1 文字として扱う 重複した修飾子文字は無視されます。

    たとえば、"ACL Services Ltd. dba Galvanize""(2 つの二重引用符で終わっています)は、このオプションがオンの場合には、"ACL Services Ltd. dba Galvanize" と同等になります。

    フィールドの区切り文字 ファイルのフィールドを区切る文字:
    • カンマ
    • TAB
    • セミコロン
    • その他 – フィールド区切り文字として使用される文字を指定できます
    テキスト修飾子 フィールドに含まれる値を特定するテキスト記号:
    • 二重引用符
    • 引用符
    • なし – テキスト修飾子が使用されないことを示します
    • その他 – テキスト修飾子として使用される文字を指定できます
    キャリッジ リターンの削除およびライン フィードの削除 キャリッジ リターン(CR)やライン フィード(LF)文字の配置が誤ってインポートされたデータをクレンジングします。

    CR/LF の配置が正しくないと、レコード内の改行が正しくなくなる可能性があります。有効化されると、このオプションは CR/LF 文字をスペースで置き換えます。テキスト修飾子のペアの中に発生する CR/LF 文字のみが置き換えられます。

    Windows ファイルの場合、[キャリッジ リターンの削除]と[ライン フィードの削除]の両方を選択します。

    テキスト修飾子]が[なし]である場合は、2 つのオプションは無効です。

    すべての文字タイプ インポートされたすべてのフィールドに文字データ型を割り当てます。

    ヒント

    インポートされたすべてのフィールドに文字データ型を割り当てると、区切り文字付きテキスト ファイルのインポート処理が容易になります。

    Analytics にインポートされたデータのフィールドには、数値や日付時刻などのさまざまなデータ型を割り当て、書式の詳細を指定することができます。

    すべての文字]オプションは、実際に文字データ型を使用する必要がある場合に、Analytics によって数値のデータ型が自動的に割り当てられた、識別子のフィールドを持つテーブルをインポートする際に有用となります。

    NULL の置換 誤って配置されて NUL 文字がインポートされたデータをクレンジングします。

    NUL 文字の配置が正しくないと、レコード内でギャップが生じ、フィールドの分割が正しくなくなる可能性があります。有効化されると、このオプションは NUL 文字をスペースで置き換えます。

Analytics データ ファイルの保存

データ ファイルを別名で保存]ダイアログ ボックスで、Analytics データ ファイルの名前を入力して[保存]をクリックします。

Analytics によってデータ ファイル名があらかじめ設定されている場合は、その設定されている名前を受け入れることも、あるいは変更することもできます。

Analytics によって開かれたデフォルトのロケーションを使用しない場合は、異なるフォルダーに移動して、データ ファイルを保存することもできます。

Analytics フィールド プロパティの編集

フィールド プロパティの編集]ページで、Analytics によって、以下に一覧されたプロパティへと割り当てられた設定をレビューし、必要な更新を行い、[次へ]をクリックします。

メモ

列に関連付けられたプロパティを確認するには、プレビュー テーブルで列見出しを選択します。

プロパティ 説明
このフィールドを無視する 結果として得られるテーブル レイアウトからフィールドを除外します。

このフィールドのデータは、インポートは行われますが、定義されないため、新しい Analytics テーブルには表示されません。必要に応じ、あとで定義して、テーブルに追加することができます。

名前 テーブル レイアウトのフィールド名。

Analytics で割り当てた名前をそのまま使用するか、別の名前を入力します。

列見出し デフォルトの Analytics ビューにおけるフィールドの列見出し。

列見出しを指定しない場合は、[名前]の値が使用されます。

メモ

区切り文字付きファイルのプロパティ]ページで[すべての文字]を選択した場合、以下のオプションは適用されず、無効になります。

Analytics のフィールドに割り当てられるデータ型。

Analytics によって割り当てられたデータ型を保持するか、ドロップダウン リストから適切なデータ型を選択することができます。

Analytics でサポートされているデータ型の詳細については、Analytics データ型を参照してください。

フィールドの最初の値を表示する読み取り専用プロパティ。

この値は、行う編集に基づき動的に更新します。

10 進型(Decimal) 数値フィールドのみ。ソース データの小数点以下桁数。

メモ

小数位]テキスト ボックスは、数値のデータ型を選択すると自動的に表示されます。

入力形式 日付時刻フィールドのみ。ソース データの日付時刻値の書式。

指定する書式はソース データの書式と正確に一致する必要があります。

日付と時刻の書式の詳細については、ソース データに含まれる日付および時刻データの書式を参照してください。

インポートの最終処理

  1. 最終]ページで、新しい Analytics テーブルの設定を確認したら、[完了]をクリックします。

    変更する場合は、[戻る]をクリックし、ウィザードの適切なページへと進みます。

  2. プロジェクトに追加中のテーブル名を入力するか、デフォルトの名前を保持し、そこで、[OK]をクリックします。

    新しい Analytics テーブルは、インポートされたファイルからのデータと一緒に作成されます。

Analytics 14.1 ヘルプ