Lanzamiento de Word Extraction Tool v0.42: Corrección de errores

Tiempo para cambiar
fuente: https://pixabay.com/images/id-3842467/

Hubo un error en la herramienta de extracción de palabras v0.41 que se lanzó la última vez. Distribuya la herramienta de extracción de palabras v0.42 que corrige el error que causa KeyError: error "Columna (s) ['DBSchema'] no existe".

Artículos relacionados: Lanzamiento de la herramienta de extracción de palabras v0.41: agregue la frecuencia de aparición de DBSchema del elemento de palabras

Kim Ki-young informó el error con el siguiente comentario.

단어 추출 도구 v0.41 버그 내용KeyError: "Column(s) ['DBSchema'] do not exist"
Contenido de error de Word Extraction Tool v0.41
KeyError: "La(s) columna(s) ['DBSchema'] no existen"

¡hola!

Cuando se utiliza el método de extracción de palabras de un archivo sin un comentario DB, que es uno de los tres métodos de ejecución
(python word_extractor.py –in_path .\in –out_path .\out)

txt, palabra, ppt todo

miniconda3\envs\wordextr\lib\site-packages\pandas\core\apply.py”, línea 601, en normalize_dictlike_arg raise KeyError(f”La(s) columna(s) {cols_sorted} no existen”)

KeyError: "La(s) columna(s) ['DBSchema'] no existen"

Está saliendo con un error.

Los métodos de ejecución 2 y 3, donde se ingresa el archivo de comentarios de la base de datos, funcionan sin errores.

Puse 'DBSchema': [db_schema] en la línea 97, pero esta vez

En get_grouper, aumente KeyError (gpr) KeyError: se muestra el error 'Word'.

gracias

El código modificado es el siguiente.

    if 'DB' in df_result.columns:
        df_group = df_result.groupby('Word').agg({
            'Word': 'count',
            'Source': lambda x: '\n'.join(list(x)[:10]),
            'DBSchema': 'nunique'
        }).rename(columns={
            'Word': 'Freq',
            'Source': 'Source',
            'DBSchema': 'DBSchema_Freq'
        })
    else:
        df_result['DB'] = ''
        df_result['Schema'] = ''
        df_result['Table'] = ''
        df_result['Column'] = ''
        df_result['DBSchema'] = ''

        df_group = df_result.groupby('Word').agg({
            'Word': 'count',
            'Source': lambda x: '\n'.join(list(x)[:10])
        }).rename(columns={
            'Word': 'Freq',
            'Source': 'Source'
        })

El caso en el que existe 'DB' y no existe en la lista de columnas se divide en procesamiento.

El código fuente completo de Word Extraction Tool v0.42 se puede encontrar en la siguiente URL.

https://github.com/DAToolset/ToolsForDataStandard/blob/main/WordExtractor/word_extractor.py

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

es_ESEspañol