Herramienta de inspección de estándares de datos_2.3 Composición del diccionario de estándares de datos
Esta es una continuación del artículo anterior. Echemos un vistazo a la configuración del diccionario estándar de datos.
2.3. Estándares de datos preconfigurados
El diccionario estándar de datos es la entrada y el estándar para la inspección estándar. Un diccionario estándar consta de tres categorías: palabras estándar, términos estándar y dominios estándar. Examine cada componente del diccionario estándar y su relación.
2.3.1. Descripción general de la preconfiguración estándar de datos
El diccionario de palabras, términos y dominios estándar consta de los siguientes elementos. Los títulos de las columnas con fondo amarillo son una entrada obligatoria, el fondo gris es una entrada opcional, el fondo rojo es una entrada obligatoria condicional, el fondo verde se calcula automáticamente mediante fórmula y algunos (longitud, CHK duplicado, etc.) son color de fondo mediante formato condicional.
Los siguientes puntos son clave aquí:
▼ Relación entre el diccionario de palabras estándar y el diccionario de dominio estándar
- El nombre de clasificación de dominio del diccionario de palabras estándar está vinculado al nombre de clasificación de dominio del diccionario de dominio estándar. Solo son aplicables las palabras estándar cuyo clasificador de atributo es "Y".
- Por ejemplo, en la imagen de arriba, la palabra "cantidad" es el clasificador de atributo "Y", el nombre de clasificación del dominio es "cantidad" y hay 3 dominios (cantidad 14_2, cantidad 20_5, cantidad 22_4) que se pueden usar en el diccionario de dominio estándar vinculado.
▼ Relación entre el diccionario de terminología estándar y el diccionario de dominio estándar
- El nombre lógico de dominio del diccionario de términos estándar está conectado al nombre lógico de dominio del diccionario de dominio estándar.
- Todos los términos estándar deben especificar un nombre lógico de dominio y el nombre lógico de dominio debe estar definido en el diccionario de dominio estándar.
2.3.2. Ejemplo de configuración de diccionario de palabras estándar y descripción del elemento
El diccionario de palabras estándar se compone de la siguiente manera.
Una descripción de cada elemento es la siguiente.
- Nombre lógico de palabra: una unidad que se puede utilizar como componente de un nombre lógico de término estándar
- Nombre físico de la palabra: Abreviatura del nombre completo de la palabra. Se utiliza al crear nombres de columnas (nombres físicos) para nombres de atributos (nombres lógicos).
- Nombre de la palabra en inglés: nombre en inglés correspondiente al significado de la palabra nombre lógico Nombre completo
- Descripción de la palabra: El significado de la palabra nombre lógico. Describa el significado usado en el trabajo en lugar del significado del diccionario.
- Estándar: 'Y' para palabras estándar, 'N' para palabras no estándar (las palabras no estándar se usan cuando se administran sinónimos alófonos)
- Clasificador de atributo: uno de los dos siguientes (si está vacío o no es Y, se considera N)
- N=Palabra básica: se puede utilizar como unidad estructural de un término estándar o nombre lógico, pero no se puede utilizar como palabra de clasificación.
- Y = Palabra de clasificación: se puede utilizar como unidad estructural y palabra de clasificación para términos estándar y nombres lógicos. Se debe especificar un nombre de clasificación de dominio.
- Nombre de lógica estándar: Obligatorio si la estandarización es 'N'. Especifique el nombre lógico estándar de la palabra no estándar (reemplazado con la palabra estándar conectada al verificar el estándar para la palabra no estándar)
- Sinónimos: una lista de sinónimos relacionados con la palabra (información de referencia)
- Nombre de clasificación de dominio: Obligatorio si el clasificador de atributos es 'Y'. En el caso de una palabra de clasificación de atributo, especifique a qué nombre de clasificación de dominio está conectada la palabra de clasificación correspondiente. Dejar en blanco si no es un clasificador de atributos.
- Nombre de palabra lógica (original): Nombre original de la palabra en caso de que haya un cambio como refinar o integrar el nombre lógico de la palabra original (información de referencia)
- Fuente: tecnología de la información que puede verificar la fuente, como el nombre del sistema que recopiló la palabra, el nombre del archivo de datos, el nombre de la tabla y el nombre de la columna (información de referencia)
- Nota: descripción de la nota requerida para el refinamiento, la estandarización o la revisión de eliminación (información de referencia)
- Longitud del nombre físico: Indica la longitud del nombre físico de la palabra, si supera la “longitud máxima del nombre físico de una palabra”, el color de fondo de la celda se establece en rojo. (establecido automáticamente como formato condicional)
- Nombre lógico duplicado CHK: Expresa el número de nombres de palabras lógicas para verificar si los nombres de palabras lógicas están duplicados. Si son 2 o más, es decir, si se superponen, el color de fondo de la celda correspondiente se establece en rojo. (establecido automáticamente como formato condicional)
- Nombre físico duplicado CHK: Expresa el número de nombres de palabras físicas para verificar si los nombres de palabras físicas están duplicados. Si son 2 o más, es decir, si se superponen, el color de fondo de la celda correspondiente se establece en rojo. (establecido automáticamente como formato condicional)
- Longitud máxima del nombre físico de la palabra: se utiliza como estándar de comparación para el formato condicional que establece la longitud máxima del nombre físico de la palabra y establece el color de fondo de la celda con la longitud del nombre físico que excede el valor. Se establece un color de fondo rojo para la columna <longitud del nombre físico> que supera la longitud especificada.
2.3.3. Ejemplos de composición de diccionario de terminología estándar y descripción de elementos
El diccionario de terminología estándar se compone de la siguiente manera.
Una descripción de cada elemento es la siguiente.
- Nombre lógico de término: una unidad que se compone de palabras estándar y se puede utilizar como un nombre lógico de atributo
- Combinación de nombres lógicos de palabras: combinación de nombres lógicos de palabras estándar que constituye un nombre lógico de términos (que conecta nombres de palabras lógicas con un carácter de subrayado (_))
- Nombre terminológico: Combinación de nombres físicos de palabras estándar (abreviaturas) que constituyen nombres terminológicos (que conectan nombres físicos de palabras con caracteres de subrayado (_))
- Terminología: El significado del término nombre lógico. Se debe describir el significado utilizado en el negocio relevante en lugar del significado del diccionario, pero si el término nombre lógico en sí mismo puede explicar el significado en detalle, está bien usar al menos el término nombre lógico.
- Nombre lógico del dominio: el nombre lógico del dominio asignado al término
- Nombre del tipo de datos: el nombre del tipo de datos del dominio especificado en el término (por ejemplo, NÚMERO, VARCHAR2, etc.). Se puede utilizar como un tipo de datos lógicos, pero actualmente se recomienda el tipo de datos físicos.
- Longitud: La longitud de los datos del dominio especificado en el término. Longitud en caso de tipo de cadena, Precisión en caso de tipo de número, 0 si no se requiere designación de longitud como BLOB/DATE
- Grado: El grado de datos en el dominio especificado en el término. Tiene significado solo para tipos numéricos y describe 0 para otros tipos.
- Tarea de justicia: el nombre de la tarea que utiliza el término cuando se registra inicialmente el término (para confirmar la tarea de origen del término)
- TypeSize: un valor concatenado de nombre de tipo de datos, longitud y grado
- Longitud del nombre físico: indica la longitud del término nombre físico
- _count: el número de guiones bajos (_) incluidos en el término nombre físico (uno menos que el número de palabras)
- Número de palabras: El número de palabras que constituyen el nombre terminológico. Se utiliza para comprobar si consta de demasiadas palabras (por ejemplo, 6 o más)
- CHK de duplicación de nombres lógicos: expresa el número de nombres de términos lógicos para verificar si los nombres lógicos de términos están duplicados. Si son 2 o más, es decir, si se superponen, el color de fondo de la celda correspondiente se establece en rojo. (establecido automáticamente como formato condicional)
- Nombre físico duplicado CHK: Expresa el número de nombres de términos físicos para verificar si los nombres de términos físicos están duplicados. Si son 2 o más, es decir, si se superponen, el color de fondo de la celda correspondiente se establece en rojo. (establecido automáticamente como formato condicional)
2.3.4. Ejemplos de configuración de diccionario de dominio estándar y descripción de elementos
El diccionario de dominio estándar se configura de la siguiente manera.
Una descripción de cada elemento es la siguiente.
- Nombre de clasificación de dominio: una guía clara para la clasificación mediante la agrupación de dominios individuales. Asignado y conectado a la palabra de clasificación de la propiedad.
- Nombre lógico del dominio: el nombre lógico del dominio. No es un nombre que se use directamente, sino que se define de manera significativa y no redundante.
- Nombre Físico del Dominio: El nombre físico del dominio. No es un nombre que se use directamente, sino que se define de manera significativa y no redundante.
- Descripción del dominio: descripción de los detalles del dominio
- Nombre del tipo de datos: el nombre del tipo de datos del dominio (por ejemplo, NÚMERO, VARCHAR2, etc.). Se puede utilizar como un tipo de datos lógicos, pero actualmente se recomienda el tipo de datos físicos.
- Longitud: la longitud de los datos del dominio. Longitud en caso de tipo de cadena, Precisión en caso de tipo de número, 0 si no se requiere designación de longitud como BLOB/DATE
- Extensión: el grado de datos en el dominio. Tiene significado solo para tipos numéricos y describe 0 para otros tipos.
- TypeSize: un valor concatenado de nombre de tipo de datos, longitud y grado
2.3.5. Nota: Formato condicional de hojas de diccionario estándar
El color de fondo y el color de fuente de cada celda en cada hoja se establecen mediante formato condicional. (Excluyendo el diccionario de dominio estándar) Si desea cambiar la configuración de color, cambie las reglas, los formatos y los objetivos de la aplicación en el formato condicional y aplíquelos.
En la hoja de inspección estándar de atributos, el formato condicional se utiliza para establecer automáticamente el color de fuente o el color de fondo de acuerdo con el resultado de la inspección. La serie naranja o roja significa el objeto a complementar, y la serie azul significa la información de referencia.
En la hoja de diccionario de palabras estándar, el formato condicional se usa para establecer el color de fondo cuando la longitud del nombre físico excede la longitud máxima designada o cuando el nombre lógico de una palabra se superpone.
En la hoja de glosario estándar, el formato condicional se utiliza para establecer el color de fondo cuando el número de combinaciones de palabras de un término supera las 5 o cuando se duplica el nombre lógico de un término.
Hasta ahora, hemos analizado las funciones de la herramienta de inspección estándar y la composición del diccionario estándar. A continuación, veremos un ejemplo de un resultado de verificación estándar.
<< Lista de artículos relacionados >>
- Herramienta de verificación estándar de datos_1.Descripción general
- Herramienta de inspección estándar de datos_2.1 Composición de la pantalla, 2.2 Función de inspección estándar
- Herramienta de inspección de estándares de datos_2.3 Composición del diccionario de estándares de datos
- Herramienta de inspección estándar de datos_3. Resultados de inspección estándar por caso
- Herramienta de verificación estándar de datos_4.Adjunto
- Cómo reparar la herramienta de verificación estándar de datos_v1.33 Error "No hay suficiente memoria"
- Herramienta de verificación estándar de datos Descripción Contenido, Descargar