区切り文字付きテキスト ファイルのインポート
区切り文字付きテキスト ファイルを定義およびインポートして、Analytics テーブルを作成できます。区切り文字付きテキスト ファイルは通常、.txt、.csv(カンマ区切り)、または .tsv(タブ区切り)のファイル拡張子を持ちます。
お使いのローカル コンピューターまたはネットワーク ドライブにある区切り文字付きテキスト ファイルを定義およびインポートできます。Analytics Exchange のユーザーは、Analytics サーバーにある区切り文字付きテキストにもアクセスできます。
区切り文字付きのテキスト ファイルの構造化
区切り文字付きテキスト ファイルは、主にスプレッドシートやデータベース アプリケーションからデータを Analytics にインポートするために使用します。データベースまたはスプレッドシートの各行はそれぞれ区切り文字付きテキスト ファイルの 1 行となり、各行または各レコードが行区切り文字で区切られます。有効な行区切り文字:
- CR キャリッジ リターン
- LF 改行
- CRLF キャリッジ リターン改行(標準 DOS/Windows 文字シーケンス)
フィールド区切り文字
区切り文字付きテキスト ファイルの各レコードのフィールドはフィールド区切り文字で区切られます。主に 3 種類の区切り文字付きファイルがあります。これらはそれぞれ使用する次のようなフィールド区切り文字に基づいています。
- カンマ区切り(.csv) – 各レコード内のフィールドを区切るためにカンマが使用されます。
- タブ区切り(.tsv) – 各レコード内のフィールドを区切るためにタブが使用されます。
- テキスト ファイル(.txt) – カンマ、タブ、または別のフィールド区切り文字が、各レコードのフィールドを区切るために使用されます。その他、一般的なフィールド区切り文字にはスペース、パイプ(|)およびセミコロン(;)があります。
テキスト修飾子文字
フィールド区切り文字が使用されている場合、テキスト修飾子文字を使用して文字フィールド値を囲み、その値をフィールド区切り文字と区別します。一般的なテキスト修飾子は二重引用符(" ")または一重引用符(' ')です。
たとえば、カンマがフィールド区切り文字の場合に、値 $1,000 をテキスト修飾子で囲んで "$1,000" とすると、元の値は、2 つの値($1 と 000)ではなく、単一の値として解釈されます。
区切られたテキスト ファイル
次の例では、区切り文字付きテキスト ファイルの最初の 4 件の行を表示します。
- 最初の行にはフィールド名が格納されています。
- フィールド区切り文字はカンマです。各行には 7 つのフィールドがありカンマで区切られています。
- テキスト修飾子は二重引用符です。各行の最後のフィールドにはテキスト修飾子があり、ドルの値に含まれるカンマはフィールド区切り文字としては解釈されません。
First_Name,Last_Name,CardNum,EmpNo,HireDate,Salary,Bonus_2011 Lila,Remlawi,8590122497663807,000008,12/28/2007,52750,"$1,405.40" Vladimir,Alexov,8590122281964011,000060,10/5/2007,41250,"$4,557.43" Alex,Williams,8590124253621744,000104,8/12/2010,40175,"$7,460.02"
区切り文字付きテキスト ファイルの検索と選択
ご利用になった Analytics のインストールに一致する方法を使用します。
Analytics のスタンドアロンのインストール
- [ ]の順にクリックします。
- [データ ソースの選択]ページで[ファイル]が選択されていることを確認し、[次へ]をクリックします。
- [定義するファイルの選択]ダイアログ ボックスで、Analytics テーブルの作成元とする区切り文字付きテキスト ファイルを探して選択し、[開く]をクリックします。
Analytics Exchange と統合された Analytics
- [ ]の順にクリックします。
- [データ ソースのプラットフォームの選択]ページで、次のいずれかを実行します。
- Analytics を使用してデータにアクセスするには[ローカル]を選択し、[次へ]をクリックします。
-
Analytics サーバーを使用してデータにアクセスするには、[ACL サーバー]を選択し、ドロップダウン リストから Windows サーバー プロファイルを選択して[次へ]をクリックします。
- [ローカル]を選択した場合:
- ローカル データ ソースの選択ページで[ファイル]が選択されていることを確認します。
- [次へ]をクリックします。
- ACL Server を選択した場合:
- サーバー プロファイル パスワードの入力を要求された場合は、パスワードを入力します。
- [ACL サーバー データ ソースの選択]ページで[フラット ファイル]が選択されていることを確認します。
- [次へ]をクリックします。
- [定義するファイルの選択]ダイアログ ボックスで、Analytics テーブルの作成元とする区切り文字付きテキスト ファイルを探して選択し、[開く]をクリックします。
区切り文字付きファイルのプロパティの指定
- [文字セット]ページで、正しい文字セット オプションが選択されていることを確認し、[次へ]をクリックします。
- [ファイル形式]ページで、[区切り文字付きテキスト ファイル]オプションが選択されていることを確認し、[次へ]をクリックします。
- [区切り文字付きファイルのプロパティ]ページで、Analytics によって、以下に一覧されたプロパティへと割り当てられた設定をレビューし、必要な更新を行い、[次へ]をクリックします。
プロパティ 説明 開始する行 ファイルの読み取りを開始する行番号。 この設定により、インポートしない情報を含むファイルが始まる行をスキップできます。たとえば、ファイルの先頭 3 行にヘッダー情報が含まれている場合、4 行目からデータの読み取りを開始するには、「4」と入力します。
フィールドの幅 プレビュー テーブルの選択された列見出しに、結果として得られるテーブル レイアウトのフィールド長を指定します。文字で長さを指定します。
Analytics で割り当てられた長さを保持するか、別の長さを入力することができます。
ヒント
更新されたソース データから結果として得られる Analytics テーブルを定期的に更新する、またはインポート コマンドを再利用する予定である場合は、Analytics によって割り当てられたものより長いフィールド長を入力します。
ソース データの更新された値が現在のいずれかの値より長い場合は、それより長いフィールド長によって余分のスペースが与えられます。利用可能なフィールド長を超える値は切り詰められます。
\[先頭の行をフィールド名として使用する] ファイルの第 1 行の値は、結果として得られるテーブル レイアウトのフィールド名として使用されます。 メモ
この設定を使用する場合、フィールド名として使用される行は、行番号が[開始する行]で指定される行です。フィールド名が正しくない場合は、[データ定義ウィザード]の後続ページで更新できます。
連続した修飾子は 1 文字として扱う 重複した修飾子文字は無視されます。 たとえば、"ACL Services Ltd. dba Galvanize""(2 つの二重引用符で終わっています)は、このオプションがオンの場合には、"ACL Services Ltd. dba Galvanize" と同等になります。
フィールドの区切り文字 ファイルのフィールドを区切る文字: - カンマ
- TAB
- セミコロン
- その他 – フィールド区切り文字として使用される文字を指定できます
テキスト修飾子 フィールドに含まれる値を特定するテキスト記号: - 二重引用符
- 引用符
- なし – テキスト修飾子が使用されないことを示します
- その他 – テキスト修飾子として使用される文字を指定できます
キャリッジ リターンの削除およびライン フィードの削除 キャリッジ リターン(CR)やライン フィード(LF)文字の配置が誤ってインポートされたデータをクレンジングします。 CR/LF の配置が正しくないと、レコード内の改行が正しくなくなる可能性があります。有効化されると、このオプションは CR/LF 文字をスペースで置き換えます。テキスト修飾子のペアの中に発生する CR/LF 文字のみが置き換えられます。
Windows ファイルの場合、[キャリッジ リターンの削除]と[ライン フィードの削除]の両方を選択します。
[テキスト修飾子]が[なし]である場合は、2 つのオプションは無効です。
すべての文字タイプ インポートされたすべてのフィールドに文字データ型を割り当てます。 ヒント
インポートされたすべてのフィールドに文字データ型を割り当てると、区切り文字付きテキスト ファイルのインポート処理が容易になります。
Analytics にインポートされたデータのフィールドには、数値や日付時刻などのさまざまなデータ型を割り当て、書式の詳細を指定することができます。
[すべての文字]オプションは、実際に文字データ型を使用する必要がある場合に、Analytics によって数値のデータ型が自動的に割り当てられた、識別子のフィールドを持つテーブルをインポートする際に有用となります。
NULL の置換 誤って配置されて NUL 文字がインポートされたデータをクレンジングします。 NUL 文字の配置が正しくないと、レコード内でギャップが生じ、フィールドの分割が正しくなくなる可能性があります。有効化されると、このオプションは NUL 文字をスペースで置き換えます。
Analytics データ ファイルの保存
[データ ファイルを別名で保存]ダイアログ ボックスで、Analytics データ ファイルの名前を入力して[保存]をクリックします。
Analytics によってデータ ファイル名があらかじめ設定されている場合は、その設定されている名前を受け入れることも、あるいは変更することもできます。
Analytics によって開かれたデフォルトのロケーションを使用しない場合は、異なるフォルダーに移動して、データ ファイルを保存することもできます。
Analytics フィールド プロパティの編集
[フィールド プロパティの編集]ページで、Analytics によって、以下に一覧されたプロパティへと割り当てられた設定をレビューし、必要な更新を行い、[次へ]をクリックします。
メモ
列に関連付けられたプロパティを確認するには、プレビュー テーブルで列見出しを選択します。
プロパティ | 説明 |
---|---|
このフィールドを無視する | 結果として得られるテーブル レイアウトからフィールドを除外します。 このフィールドのデータは、インポートは行われますが、定義されないため、新しい Analytics テーブルには表示されません。必要に応じ、あとで定義して、テーブルに追加することができます。 |
名前 | テーブル レイアウトのフィールド名。 Analytics で割り当てた名前をそのまま使用するか、別の名前を入力します。 |
列見出し | デフォルトの Analytics ビューにおけるフィールドの列見出し。 列見出しを指定しない場合は、[名前]の値が使用されます。 |
メモ [区切り文字付きファイルのプロパティ]ページで[すべての文字]を選択した場合、以下のオプションは適用されず、無効になります。 |
|
型 | Analytics のフィールドに割り当てられるデータ型。 Analytics によって割り当てられたデータ型を保持するか、ドロップダウン リストから適切なデータ型を選択することができます。 Analytics でサポートされているデータ型の詳細については、Analytics データ型を参照してください。 |
値 | フィールドの最初の値を表示する読み取り専用プロパティ。 この値は、行う編集に基づき動的に更新します。 |
10 進型(Decimal) | 数値フィールドのみ。ソース データの小数点以下桁数。 メモ [小数位]テキスト ボックスは、数値のデータ型を選択すると自動的に表示されます。 |
入力形式 | 日付時刻フィールドのみ。ソース データの日付時刻値の書式。 指定する書式はソース データの書式と正確に一致する必要があります。 日付と時刻の書式の詳細については、ソース データに含まれる日付および時刻データの書式を参照してください。 |
インポートの最終処理
- [最終]ページで、新しい Analytics テーブルの設定を確認したら、[完了]をクリックします。
変更する場合は、[戻る]をクリックし、ウィザードの適切なページへと進みます。
- プロジェクトに追加中のテーブル名を入力するか、デフォルトの名前を保持し、そこで、[OK]をクリックします。
新しい Analytics テーブルは、インポートされたファイルからのデータと一緒に作成されます。