データ標準チェックツール_3.標準チェックケース別結果

データ標準チェックの結果をケースごとに分けて詳しく見てみる。前の記事で続く内容だ。

データ標準チェックツール_2.3.データ標準事前設定

3. データ標準チェック結果

入力資料の属性名について標準用語と一致する場合、標準用語はないが、一部または全単語が標準単語に組み合わせられる場合、非標準単語を使用した属性名に代わる場合、同音異義語/継承同義語があり、注意しなければならない場合など、様々なデータ標準点検結果を確認することができる。点検結果の内容が多くて複雑に見えることがあるが、各事例別に詳しく見れば複雑ではなく容易に理解できるだろう。

3.1。データ標準チェック結果の例

チェックオプションを「単語組み合わせ方向:左→右&右→左すべて選択」、「標準事前検索:単語&用語」に設定し、チェックを実行すると、次のような結果が得られる。

표준점검결과 예시
標準点検結果の例

以下で、各例Case別に見てみよう。

3.2。標準チェックの例 Case #1: 標準用語マッチング

入力属性名が標準用語辞書の論理名と一致する場合であり、この場合、チェック結果の「ドメイン、Data Typeチェック結果」のみを確認して対処すればよい。標準辞書検索オプションが「単語&用語」または「用語」の場合に適用されます。 

표준점검 예시 Case #1: 표준용어일치
標準チェックの例 Case #1: 標準用語一致

「標準単語論理名の組み合わせ」項目には、underscore(_) 文字を区切り文字として標準単語論理名を組み合わせて表示する。 「標準単語物理名の組み合わせ」項目には、標準単語物理名を組み合わせて表示する。 「標準用語Type / Size」項目は、入力属性名が標準用語論理名と一致する場合にのみ表示されます。 「ドメイン、データタイプチェック結果」項目には、データタイプと長さのチェック結果が表示されます。

上記の例では、属性「国名」は標準用語と論理名は一致していますが、ドメインチェックの結果「データ長の不一致」です。属性のデータ長を標準用語データ長に増やし、標準と一致するように措置すればよい。

ドメインチェック結果の不一致タイプは3つあります。

  1. タイプの不一致
  2. 長さの不一致
  3. Typeと長さの両方が不一致

一致する方法は、1)標準用語を基準に属性のType/長さを変更する方法、2)標準用語のType/長さを変更する方法の2つがある。状況に応じて判断して措置するようにする。

3.3。標準チェックの例 Case #2: 標準単語の組み合わせ

入力属性名が標準用語辞書になく、標準単語の組み合わせを試みる場合である。標準辞書検索オプションが「単語&用語」または「単語」の場合に適用されます。

표준점검 예시 Case #2-1: 표준단어 조합
標準チェックの例 Case #2-1: 標準単語の組み合わせ

属性「差額維持可否」は、標準単語を探してみたとき、「可否」のみ登録されており、他の単語はない場合である。 「標準単語論理名の組み合わせ」項目に「[差]_[額]_[有]_[地]_か否か”と表示される。文字「[“と“]」の間の単語は未登録の単語です。このセルの背景色は、セル値に未登録単語を表示する「[」文字が含まれており、条件付き書式により赤色に設定された。 「[“、“]」文字間の連続した単語は、「追加候補単語」項目に表示されます。この場合、「差額維持」が追加候補語である。

入力属性名に空白または underscore(_) 文字が含まれている場合には、属性名に単語の組み合わせをユーザが指定したものと仮定し、その文字を区切り文字として標準単語を探して組み合わせる。

属性「個人対象かどうか」(Row# 9)にはスペースが含まれています。 「標準単語論理名の組み合わせ」項目に「[個人対象]_か否か」と表示されているのは、「[個人対象]」は標準単語辞書になく、「か否」は標準単語辞書にあるという意味である。このセルも未登録文字が含まれており、背景色が赤色に設定された。属性名に区切り文字が含まれている場合は、「属性名チェック結果」項目に「(ユーザー指定)」と表示します。

属性「所有権保有月数」(Row# 10)は、「標準単語論理名の組み合わせ」項目の背景色がオレンジ色です。対応するセルに行分離記号がある場合、条件付き書式によってオレンジ色に設定されます。行分離記号が含まれる理由は、単語の組み合わせ方向「左→右」、「右→左」によって異なる結果が出ており、1行には「左→右」方向の組み合わせ結果を、2行には「右→左」方向の組み合わせ結果を表示したからだ。このように組み合わせ方向によって異なる結果が出るとき、「属性名チェック結果」項目に「(組合せパターン確認必要)」と表示する。

属性「所有権保有月数」(Row# 12)は、「標準単語物理名の組み合わせ」項目の背景色が緑色である。括弧文字(「(」)がある場合は緑色に設定されます。標準単語の物理名を決定する前に論理名に括弧を付けて指定すると、論理名に基づいて標準化を先に進めることができます。括弧文字は標準単語を確定する前に属性名の単語がどのように組み合わされるかを確認する simulation 用途に使用する。 (所有権)」に設定)

次の例も見てみましょう。

표준점검 예시 Case #2-2: 표준단어 조합
標準チェックの例 Case #2-2: 標準単語の組み合わせ

属性「個人砲賞金」は「属性名終結語点検結果」が「単語なし」である。属性名終結語「金」が未登録単語だからだ。 「金」が標準単語で適合する場合は標準辞書に登録し、属性分類語で適合すれば指定して措置する。標準単語に適していない場合、または属性分類に適していない場合は、属性名を変更してください。

属性「個人砲上ヶ月」は、「属性名終結語チェック結果」が「基本単語」である。属性名終結語「月」が標準単語辞書に登録されているが、属性分類語に指定されていないからである。 「月」を属性分類語で指定するか、属性分類語に適合しない場合は属性名を変更して処置する。

3.4。標準チェックの例 Case #3: 非標準単語の使用

非標準単語を含む属性名のチェック結果を見てみましょう。

비표준단어를 포함한 표준단어사전
非標準単語を含む標準単語辞書
표준점검 예시 Case #3: 비표준단어 사용
標準チェックの例 Case #3: 非標準単語の使用

単語論理名「社員」が標準であり、「職員」が非標準の場合である。非標準単語は標準論理名を必須として指定しなければならない。ここでは非標準単語「職員」に標準論理名「社員」が指定されている。

属性「職員入社日」の点検結果のうち、「標準単語論理名組合せ」項目に非標準語である「職員」が標準語「社員」に置き換えられて表示された。 「属性名点検結果」には「(非標準単語確認必要)」と表示する。

3.5。標準チェックの例 Case #4: 同音異義語の使用

オプションで「標準単語論理名重複(同音異義語)許可」をチェックした場合に確認することができる。

동음이의어를 포함한 표준단어사전
同音異義語を含む標準単語辞書
표준점검 예시 Case #4: 동음이의어가 사용된 경우 점검결과
標準チェックの例 Case #4: 同音異義語が使用された場合のチェック結果

単語論理名「試み」が異なる物理名で登録されている場合である。同音異義語を含む属性「試み名」について「属性名点検結果」項目に「(同音異義語確認必要)」で、「標準単語物理名組み合わせ」項目に2つの組み合わせ結果を表示する。この場合、標準用語辞書に登録する際に物理名に注意が必要である。

3.6。標準チェックの例 Case #5: 継ぎ目同義語の使用

オプションで「標準単語物理名の重複(同義語)許可」をチェックした場合に確認することができる。

이음동의어를 포함한 표준단어사전
同義語を含む標準単語辞書
표준점검 예시 Case #5: 이음동의어가 사용된 경우 점검결과
標準チェックの例 Case #5: 継ぎ目同義語が使用されている場合のチェック結果

単語物理名「DAYOFF」が異なる論理名で登録されている場合である。異音同義語を使用した属性名は、属性名チェック結果に「(継承同義語確認必要)」と表示する。属性「休店地域コード」(Row# 19)の属性名チェック結果に「(継承同義語確認必要)」が表示されていないのは、標準用語が登録されていて混同される可能性がないためである。

継承同義語を許可すると、データベースの列名(=標準用語物理名)が2つ以上の意味に解釈され、混乱を招く可能性があります。なるべく継ぎ目の同義語は許容しないことが好ましい。


これまでケース別に標準点検結果を見てみた。次に、追加の内容とVBAソースコードの構成について説明します。


データ標準チェックツールは以下のgithubリポジトリで確認できます。

https://github.com/DAToolset/ToolsForDataStandard


<< 関連記事のリスト >>

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です

ja日本語