数据标准检查工具_3.按案例标准检查结果

我们按照案例来详细看看数据标准检查结果。这是上一篇文章的延续。

数据标准检查工具_2.3. 数据标准字典配置

3.数据标准检查结果

当输入数据的属性名称与标准术语匹配时,当没有标准术语但部分或全部单词与标准单词组合时,当使用非标准单词替换属性名称时,请小心,因为存在同音异义/ disonyms.您可以在必要时检查各种数据标准检查的结果。由于内容较多,检查结果可能看起来很复杂,但如果你详细地看每个案例,它并不复杂,而且很容易理解。

3.1.数据标准检查结果示例

当您将检查选项设置为“单词组合方向:选择左->右和右->左”和“标准词典搜索:单词和术语”并运行检查时,您可以获得以下结果。

표준점검결과 예시
标准检查结果示例

让我们看一下下面的每个示例案例。

3.2.标准检验示例 案例#1:标准术语匹配

此时输入的属性名称与标准字典中的逻辑名称相匹配,此时只需检查检查结果中的“域、数据类型检查结果”并采取操作即可。当标准词典搜索选项为“单词和术语”或“术语”时适用。 

표준점검 예시 Case #1: 표준용어일치
标准检验示例 案例#1:标准术语匹配

在“标准字逻辑名称组合”项中,通过组合下划线(_)字符作为分隔符来显示标准字逻辑名称。 “标准单词物理名称组合”项显示标准单词物理名称的组合。仅当输入属性名称与标准术语逻辑名称匹配时,才会显示“标准术语类型/大小”项。 “域、数据类型检查结果”项显示数据类型和长度的检查结果。

在上例中,属性“国家名称”与标准术语和逻辑名称匹配,但域检查结果显示“数据长度不匹配”。您可以通过将属性的数据长度增加到标准术语数据长度来采取操作来匹配标准。

域检查结果中存在三种类型的不一致。

  1. 类型不匹配
  2. 长度不匹配
  3. 类型和长度都不匹配

有两种匹配方式:1)根据标准术语改变属性的类型/长度,2)改变标准术语的类型/长度。根据情况判断并采取行动。

3.3.标准检查示例 案例 #2:标准单词组合

这是由于输入属性名称不在标准术语词典中而尝试标准单词组合的情况。当标准词典搜索选项为“单词和术语”或“单词”时适用。

표준점검 예시 Case #2-1: 표준단어 조합
标准检查示例 案例 #2-1:标准单词组合

属性“是否保持差异”是在搜索标准词时仅登记“是否”而没有登记其他词的情况。在“标准字逻辑名组合”部分,显示为“[Cha]_[金额]_[U]_[G]_是否”。字母“[”和“]”之间的单词是未注册单词。该单元格的背景颜色通过条件格式设置为红色,因为单元格值包含“[”字符,该字符表示未注册的单词。 “[”、“]”字符之间的连续单词显示在“附加候选单词”项中。在这种情况下,“保持差异”是一个额外的候选词。

如果输入的属性名称包含空格或下划线(_)字符,则假定用户在属性名称中指定了单词组合,并使用该字符作为分隔符找到标准单词并进行组合。

属性“个人与否”(Row# 9) 包含空格。 “标准词逻辑名组合”项中显示“[个人主题]_是否”,说明“[个人主题]”不在标准词典中,而“是否”在标准词典中。该单元格还包含未注册的字符,因此背景颜色设置为红色。如果属性名称中包含分隔符,则“属性名称检查结果”项中会显示“(用户指定)”。

属性“拥有月数”(Row# 10) 的“标准字逻辑名称组合”项目具有橙色背景颜色。当单元格中有行分隔符时,条件格式将其设置为橙色。包含行分隔符的原因是,根据单词组合“左->右”或“右->左”方向的不同,会得到不同的结果。第1行显示“左->右”方向的组合结果,第2行显示的是“左->右”方向的组合结果,这是因为显示的是“右->左”方向的组合结果。当根据组合方向获得不同结果时,“属性名称检查结果”项目中会显示“(需要组合模式确认)”。

属性“拥有月数”(Row# 12) 的“标准单词物理名称组合”项目的背景色为绿色。当有括号字符(“(“)时,设置为绿色。如果在确定标准字的物理名称之前在逻辑名称中指定了括号,则可以先根据逻辑名称进行标准化。括号字符确认标准字,用于模拟目的,检查属性名中的字是如何组合的。标准物理名建议使用“(”+逻辑名+“)”。(例如:如果逻辑名是“所有权”,物理名称为“(Ownership)”)

我们还看一下下面的例子。

표준점검 예시 Case #2-2: 표준단어 조합
标准检查示例 案例 #2-2:标准单词组合

对于属性“个人奖励”,“属性名称最终字检验结果”为“无字”。这是因为属性名称最后一个词“gold”是一个未注册词。如果“gold”适合作为标准词,则将其登记在标准词典中,如果适合作为属性分类词,则指定它并采取行动。如果它不适合作为标准词或属性分类器,请更改属性名称。

对于属性“个人奖励月”,“属性名称最终词检验结果”为“基础词”。这是因为属性名最终词“月”被登记在标准词典中,但未被指定为属性分类词。将“月”指定为属性分类,如果不适合作为属性分类,则通过更改属性名称来采取措施。

3.4.标准检验示例 案例 #3:使用非标准词语

我们来看一下包含非标准单词的属性名称的检查结果。

비표준단어를 포함한 표준단어사전
标准词词典,包括非标准词
표준점검 예시 Case #3: 비표준단어 사용
标准检验示例 案例 #3:使用非标准词语

在这种情况下,词逻辑名称“employee”是标准的,而“employee”是非标准的。非标准词必须给出标准逻辑名称。这里,标准逻辑名称“employee”被分配给非标准词“employee”。

在“员工入职日期”属性的检查结果中,将“标准字逻辑名称组合”项中的非标准字“员工”替换为标准字“员工”。 “属性名称检查结果”显示为“(需要检查非规范字)”。

3.5.标准检查示例 案例 #4:同音异义词的使用

您可以通过选中选项中的“允许标准词逻辑名称重复(同音异义词)”来检查这一点。

동음이의어를 포함한 표준단어사전
标准词词典,包括同音异义词
표준점검 예시 Case #4: 동음이의어가 사용된 경우 점검결과
标准检查示例 案例#4:使用同音异义词时的检查结果

这是单词逻辑名称“Sido”被注册为不同的物理名称的情况。对于含有同音异义词的属性“市/省名”,在“属性名称检验结果”部分显示“(需要同音字确认)”,在“标准词物理名称组合”部分显示两个组合结果。在这种情况下,在标准词典中注册时必须注意物理名称。

3.6.标准检查示例 案例 #5:同义词的使用

如果在选项中选中“允许标准字物理名称重复(同义词)”,则可以选中此项。

이음동의어를 포함한 표준단어사전
标准单词词典,包括同义词
표준점검 예시 Case #5: 이음동의어가 사용된 경우 점검결과
标准检查示例 案例#5:使用同义词时的检查结果

这是单词物理名称“DAYOFF”被注册为不同的逻辑名称的情况。使用同义词的属性名称在属性名称检查结果中显示为“(需要检查同义词)”。属性“封闭区域代码”(Row# 19)的属性名称检查结果中未显示“(需要同义词确认)”的原因是因为标准术语已注册,因此不存在混淆的可能性。

如果允许使用同义词,则数据库列名称(=标准术语中的物理名称)可能会被解释为多种含义,这可能会导致混乱。如果可能的话,最好不要允许同义词。


到目前为止,我们已经查看了每个案例的标准检查结果。接下来我们看一下附加内容和VBA源代码配置。


数据标准检查工具可以在下面的 github 存储库中找到。

https://github.com/DAToolset/ToolsForDataStandard


<< 相关文章列表 >>

发表回复

您的电子邮箱地址不会被公开。 必填项已用*标注

zh_CN简体中文