数据标准检查工具_2.1.画面构成,2.2.标准检查功能
检查标准数据检查工具屏幕构成、标准检查功能和选项输入/输出项目。您可以查看数据标准检查工具的整体功能。
2、标准检查功能和标准词典配置
2.1.标准检具画面构成
数据标准检查工具为Excel VBA(注: Excel VBA课程(一):Excel VBA概述), 并具有以下画面组成。
以下是每个区域的简要说明。
- 功能和选项:设置和运行标准检测选项
 - 检查属性列表:标准检查属性的名称、数据类型、长度(输入)
 - 检查结果:标准逻辑名、物理名、数据类型、长度、停用词、域和每个待检查属性的附加候选词(输出)
 - 标准词典:标准检验的参考数据(输入)
 
下表仅供参考。 (请仔细阅读许可条款。)
- 配置:用于从数据库更新标准字典的连接和 SQL 设置
 - # License, History#: 这个工具的作者,电子邮件,博客,许可证通知的内容,工具的开发历史
 
※ 执照
| 分配 | 内容 | 
| 作家 | 李英敏 | 
| 电子邮件 | leeyoungmin@gmail.com | 
| 博客 | https://prodskill.com/ | 
| Github | https://github.com/DAToolset/ToolsForDataStandard | 
| 许可内容 | 默认情况下,它遵循 github 存储库中指定的 BSD-2 许可证。如果未指定,请按照以下说明进行操作。 —————————————————————————– 1.版权人的声明:版权人的姓名、邮箱地址、博客地址、github仓库地址必须原样使用。如果更改源代码并使用它,您可以添加与第二作者相关的内容。 2.免责声明:版权人不对因使用本源代码和工具而引起的任何问题负责。 —————————————————————————– 如果满足上述条件,则允许用于所有目的,例如学习/利用等个人使用,在工作中使用本工具,或通过更改源代码将本工具包含在商业产品中使用. 无法删除此许可证内容。  | 
| 告诉我 | 您不必公开衍生作品的源代码。但是,如果这不是问题,我希望您能告诉我您将它用于哪个辅助工作。您可以通过电子邮件发送或作为博客评论留下。 还请将工具功能中的错误或改进请求、指南文档中的错误或通过电子邮件或博客评论提出的改进请求通知我们。  | 
2.2.标准检查功能和选项、输入/输出项目
让我们仔细看看功能、选项和输入/输出项目。
2.2.1.标准检查功能
它提供了以下检查功能。
- 标准检查:基于标准词词典、标准术语词典、标准领域词典,对列表标准检查的属性名称和数据类型/长度进行标准检查
 - 仅限可选属性
- 选择标准检查目标的选项(如果选中:仅对所选属性进行标准检查,未选中:所有属性标准检查)
 - 即使未选中,如果在按住 Shift 键的同时单击“标准选中”按钮,其操作与选中时相同。
 
 - 清晰:清晰的标准检查结果
 - 标准词典刷新
- 从标准词典存储库下载并刷新单词/术语/域词典
 - 运行标准检查时可以勾选“刷新标准词典”复选框,但不运行标准检查只刷新标准词典时使用。
 - 刷新标准词典时,之前的词典备份为“_Bak”表,右上角显示新标准词典的标准日期和时间以及备份词典的标准日期和时间。
 
 - 配置:移至“配置”表以设置 SQL 以获取用于访问标准词典存储库和标准词/术语/域列表的连接字符串
 - 关于... :显示工具说明和许可内容
 - 添加到词典:将其他候选词添加到词典列表中。
 
2.2.2.标准检查选项
您可以使用以下选项控制该功能。
- Word Combination Direction:设置查找属性名的词组的方向(默认设置:Left->Right,Right->Left均勾选)
- 左 -> 右
- 从左到右搜索属性名的词结构
 
 - 右 -> 左
- 从右到左查找属性名的词结构
 - 由于首先找到属性分类器(用于域指定),因此更准确
 
 - 笔记
- 关于组合方向,建议默认都选择,如果只选择一个,建议“right->left”。
 - 可以在一个方向上进行组合的情况有很多,但是选择最长的匹配词来形成逻辑/物理名称组合结果。
 - 同时选择“左->右”和“右->左”进行标准检查时,单词组合可能不同,此时结果是单元格背景色自动设置为橙色(条件格式使用),并且可以被识别
 
 
 - 左 -> 右
 - 查找标准词典:设置与哪个标准词典组合单词(默认设置:Word & Term)
- Words & Terms:首先在标准词词典中查找与标准词匹配的标准词,使用对应的标准词,如果没有,则与标准词组合
 - Word: Combined with standard words only(即使有标准词,也是只用word组合)
 - 术语:仅在标准词汇表中查找匹配的标准术语
 
 - 标准词典刷新:设置是否在标准检查时从标准库中更新标准词/标准术语/标准域
 - 允许标准词的重复逻辑名称(消歧)
- 选择允许标准词的逻辑名称重复,即同音异义词,如果不允许同音异义词则取消选择。
 - 取消选择执行时,如果有同音字,则显示对应的重复历史并停止执行
 
 - 允许重复的标准词物理名称(异音同义词)
- 选择是否允许重复同义词,即标准词的物理名称,如果不允许异义词则取消选择。
 - 当取消选择并执行时,如果有异音同义词,则显示相应的重复历史并停止执行。
 - 不在标准词典中登记异音同义词在标准质量方面是好的,但仅在不可避免时限制使用
 
 - 物理名称最大长度
- 如果设置的物理名称超过最大长度,则使用条件格式更改颜色(红色背景)
 - 显示列:物理名称长度(M列)
 
 
2.2.3.标准支票录入
接下来,让我们看看输入项目和输出(检查结果)项目。
-  属性名称
- 标检物业名称
 - 默认情况下,属性名称不使用空格,但如果使用空格,则将其识别为以空格为单位的单个单词并进行检查。
 - 示例:国家代码
 
 - 数据类型/长度
- 要分配给属性的数据的类型/大小
 - 如果未输入(值为空),则不检查
 - 示例:VARCHAR2(20)
 
 
2.2.4.标准检验输出(检查结果)项目
输出(检查结果)项目如下。
- 标准字逻辑名组合
- 将构成属性名的标准词的逻辑名与分隔符'_'组合的结果
 - 如果根据单词组合的方向得到不同的结果,left->right,right->left,两者都会显示。
 - 示例:国家代码
 
 - 标准词物理名称组合
- 将构成属性名称的标准词的物理名称与分隔符'_'组合的结果
 - 如果根据单词组合的方向得到不同的结果,left->right,right->left,两者都会显示。
 - 示例:CNTRY_CD
 
 - 属性名称检查结果
- 词标准:标准词组合、标准词组合(用户自定义)、无标准词、无标准词(用户自定义)
(这里,'custom' 表示词组合是用户有意指定的,因为属性名称中有空格。) - 术语标准:标准术语匹配,无标准术语
 - 示例:标准术语匹配
 
 - 词标准:标准词组合、标准词组合(用户自定义)、无标准词、无标准词(用户自定义)
 - 标准条款 类型/尺寸
- 如果属性名称检查结果为“与标准术语一致”,则标准术语的数据类型/大小
 - 示例:VARCHAR2(20)
 
 - 属性名称终止符
- 属性名称中的最后一个词(大多数域中使用的属性分类器)
 - 示例:代码
 
 - 属性名称终止符检查结果
- 分类词:当结尾词是分类词时
 - 基础词:如果结束词是基础词 –> 需要把结束词改成其他分类词或者把结束词改成分类词
 - No word: 如果结束词不在标准词典中 –> 结束词需要在标准词典中注册
 - 示例:分类词
 
 - 域、数据类型检查结果
- 检查输入属性名称的数据Type/Size是否与标准词匹配的结果,或者单词终止符是否为属性分类器,是否存在于与域分类连接的域列表中,类型和大小是否匹配.
 - 示例:域类型/大小匹配
 
 - 附加候选词
- 组成属性名的词中,标准词典中没有的词
 - 在某些情况下,不需要作为标准词,因此检查它并将其注册为标准词。
 
 
2.2.5.标准词典存储库设置
与标准词典Repository 相关的设置如下。
- 连接字符串
- 标准字典存储库连接的字符串
 - 通过单击“创建连接字符串”按钮创建
 - 如果点击按钮出错,删除连接字符串内容,再次点击执行。
 
 - 标准词典查询:SQL获取标准词典列表
 - 标准词汇表查询:SQL 获取标准词汇表列表
 - 标准领域词典查询:SQL获取标准领域词典列表
 
这些是与配置相关的注释。
- 不管是哪种标准管理系统(元数据管理系统),只要能通过DB连接和SQL获取列表就可以使用。
 - 在共享 Excel 文件并将其用作标准词典的情况下,您可以通过选择“Microsoft.Jet.OLEDB.4.0”作为提供者来使用它。 (不推荐)但是,“Microsoft.Jet.OLEDB.4.0”不提供64位提供程序,因此只能与32位Excel一起使用。
 - 如果在单击“创建连接字符串”按钮时发生错误(见下文),只需删除连接字符串值(上图中的单元格 B3)并重试。 (错误消息:无法从 IDataInitialize 检索初始化字符串。类未注册。)
 
至此,我们已经了解了数据标准检查工具和标准检查功能的屏幕组成。
<< 相关文章列表 >>












基于 SQL Server,使用 VARCHAR(MAX) 数据类型/长度。
如果标准域字典的TypeSize为VARCHAR(MAX),则在进行属性标准检查时会出现调试错误。
猜测原因,好像是VB中把长度当成Integer变量导致的问题。
你的猜测是正确的。
需要一个补丁,这样 VARCHAR(MAX) 的 MAX 就可以在不转换为整数类型的情况下进行比较。
感谢您的报告。
有空我会补上,发到我的博客上。
上传了一个版本,修复了使用 VARCHAR(MAX) 时的错误。
https://prodskill.com/ko/data-standard-checker-v1-34/
请尝试一下,如果还有其他错误,请告诉我。