Hitachi

データバリエーション一覧の例
カラム名 (1)
種別
(2)
パターン
(3)
割合
(4)
異常候補
(5)
データ例
従業員コード コード系 XXX99999 99.99% ABC12345
XX99999 0.01% AA56789
従業員氏名 姓名 人名(区切り文字あり) 98% 山田 太郎
人名(区切り文字なし) 2% 鈴木一郎
性別 少データ種 1 51%
2 49%
生年月日 年月日 YYYYMMDD 99.9% 19861210
YYYY/MM/DD 0.1% 1990/10/11
(1)種別
該当カラムに登録されているデータから自動で種別を推測して出力します。
上記例のほか、数値や地名にも対応しています。
(2)パターン
格納されているデータの形式を出力します。
(3)割合
(2)のパターンに当てはまるデータの割合を出力します。
(4)異常候補
異常データの候補に「*」を出力します。
(5)データ例
格納されているデータの一例を出力します。

その他、最小値・最大値や最小文字数・最大文字数などの情報も出力します。

データバリエーションと分布、異常候補を把握できるため、異常データを検知できます。