数据标准检查工具_2.3. 数据标准字典配置
这是上一篇文章的延续。我们来看一下数据标准字典的组成。
2.3.数据标准字典组成
数据标准字典是标准检验的输入和标准。标准词典由三部分组成:标准词、标准术语和标准领域。让我们看看标准字典的每个组成部分及其关系。
2.3.1.数据标准字典组成概述
标准单词、术语和领域词典由以下项目组成。列标题中黄色背景的项目为必填项,灰色背景为可选输入,红色背景为条件必填项,绿色背景为公式自动计算,部分(长度、重复CHK等)设置为背景色通过条件格式设置。这样就可以了。
以下几点是关键:
▼ 标准单词词典与标准领域词典的关系
- 标准词典中的域分类名称链接到标准域词典中的域分类名称。仅属性分类为“Y”的标准词适用。
- 例如,上图中,单词“amount”是属性分类单词“Y”,域分类名称为“amount”,连接的标准域词典中有三个可用域(amount 14_2、amount 20_5、和金额 22_4)。
▼ 标准术语词典与标准领域词典的关系
- 标准术语词典的域逻辑名称连接到标准域词典的域逻辑名称。
- 所有标准术语必须指定域逻辑名称,并且域逻辑名称必须在标准域词典中定义。
2.3.2.标准词典构成和项目描述示例
标准单词词典的结构如下。
各项目的说明如下。
- 字逻辑名:可用作标准逻辑名组成部分的单位
- 单词物理名称:单词全名的缩写。在为属性名称(逻辑名称)创建列名称(物理名称)时使用
- 单词英文名:单词逻辑名含义对应的全名
- 单词解释:单词逻辑名称的含义。描述相关工作中使用的含义而不是字典含义。
- 是否标准:标准词为“Y”,非标准词为“N”(管理同义词时使用非标准词)
- 属性分类词:以下两者之一(如果为空或者非Y则认为N)
- N=基本词:可以作为标准术语逻辑名的构成单元,但不能作为分类词。
- Y=分类词:可用作标准术语逻辑名称的构成单元和分类词。必须指定域分类名称。
- 标准逻辑名称:标准为“N”时必需。指定非标准字的标准逻辑名称(在检查非标准字的标准时替换为连接的标准字)
- 同义词:与该词相关的同义词列表(参考信息)
- 域分类名称:如果属性分类词为“Y”,则必填。如果是属性分类词,则指定该分类词连接到哪个域分类名。如果不是属性分类词则留空。
- 词逻辑名(原):若原词逻辑名有细化或整合等变化,则词原名(参考信息)
- 来源:可以确认来源的信息技术,例如收集该词的系统名称、数据文件名、表名、列名(参考信息)
- 备注:纯化、标准化或删除审核所需的备注技术(参考信息)
- 物理名称长度:表示单词物理名称的长度,如果超过“单词物理名称的最大长度”,则单元格的背景颜色设置为红色。 (自动设置为条件格式)
- 逻辑名重复CHK:表示字逻辑名的个数,检查字逻辑名是否重复。如果超过2个,即如果它们重叠,则单元格的背景颜色设置为红色。 (自动设置为条件格式)
- 物理名称重复CHK:表示单词物理名称的数量,以检查单词物理名称是否重复。如果超过2个,即如果它们重叠,则单元格的背景颜色设置为红色。 (自动设置为条件格式)
- 单词物理名称最大长度:用作条件格式的比较标准值,设置单词物理名称的最大长度,并设置物理名称长度超过该值的单元格的背景颜色。在超过指定长度的 <物理名称长度> 列中设置红色背景颜色。
2.3.3.标准术语词典构成示例和项目描述
标准术语词典的结构如下。
各项目的说明如下。
- 术语逻辑名:由可用作属性逻辑名的标准词组成的单元
- 词逻辑名组合:构成术语逻辑名的标准词逻辑名的组合(用下划线(_)字符连接词逻辑名)
- 术语物理名称:构成逻辑术语名称的标准单词物理名称(缩写)的组合(用下划线(_)字符连接单词物理名称)
- 术语表:术语逻辑名称的含义。描述相关工作中使用的含义而不是字典含义,但如果术语逻辑名称本身可以详细解释含义,那么至少使用术语逻辑名称是可以的。
- 域逻辑名称:术语中指定的域的逻辑名称。
- 数据类型名称:术语中指定的域的数据类型名称(例如 NUMBER、VARCHAR2 等)。它可以用作逻辑数据类型,但目前建议使用物理数据类型。
- 长度:术语中指定的域中的数据长度。字符串类型为长度,数字类型为精度,如果不需要长度指定则为0,例如BLOB/DATE。
- 度:术语中指定的域中的数据的度。仅当它是数字类型时才有意义;其他类型描述0。
- 定义任务:首次注册术语时使用该术语的任务名称(以确认该术语的来源)
- TypeSize:将数据类型名称、长度和程度连接成一个的值。
- 物理名称长度:表示术语物理名称的长度。
- _Number:物理术语名称中包含的下划线(_)的数量(比单词数少1)
- 字数:组成物理术语名称的字数。用于检查它是否包含太多单词(例如6个或更多等)
- 逻辑名称重复CHK:表示逻辑术语名称的数量,以检查逻辑术语名称是否存在重复。如果超过2个,即如果它们重叠,则单元格的背景颜色设置为红色。 (自动设置为条件格式)
- 物理名称重复CHK:表示要检查重复物理名称的物理术语名称的数量。如果超过2个,即如果它们重叠,则单元格的背景颜色设置为红色。 (自动设置为条件格式)
2.3.4.标准域词典配置示例及项说明
标准域字典的结构如下。
各项目的说明如下。
- 域分类名称:对各个域进行分组的分类语句。它被指定并连接到属性的分类词。
- 域逻辑名称:域的逻辑名称。虽然它不是直接使用的名称,但它的定义是有意义的并且没有重复。
- 域物理名称:域的物理名称。虽然它不是直接使用的名称,但它的定义是有意义的并且没有重复。
- 域名描述:对域名独特特征等的描述。
- 数据类型名称:域数据类型名称(例如 NUMBER、VARCHAR2 等)。它可以用作逻辑数据类型,但目前建议使用物理数据类型。
- 长度:域中数据的长度。字符串类型为长度,数字类型为精度,如果不需要长度指定则为0,例如BLOB/DATE。
- 度:域中数据的度。仅当它是数字类型时才有意义;其他类型描述0。
- TypeSize:将数据类型名称、长度和程度连接成一个的值。
2.3.5。参考:标准词典表的条件格式设置
每张工作表上每个单元格的背景颜色和字体颜色都是使用条件格式设置的。 (标准域词典除外)如果要更改颜色设置,请更改条件格式中的规则、格式和应用程序目标。
属性标准检验表采用条件格式,根据检验结果自动设置字体颜色或背景颜色。橙色或红色表示需要补充的对象,蓝色表示参考信息。
在标准单词词典表中,条件格式用于在物理名称长度超过指定的最大长度或单词的逻辑名称重复时设置背景颜色。
标准术语词典表中,当术语的单词组合数量超过5个或术语的逻辑名称重复时,使用条件格式设置背景颜色。
至此,我们已经了解了标准检查工具的功能以及标准词典的构成。接下来,我们将看一下标准检查结果的示例。
<< 相关文章列表 >>