Version des Word Extraction Tool v0.42: Fehlerbehebung
Es gab einen Fehler im Wortextraktionstool v0.41, das beim letzten Mal veröffentlicht wurde. Verteilen Sie das Wortextraktionstool v0.42, das den Fehler behebt, der den Fehler KeyError: „Column(s) ['DBSchema'] do not exist“ verursacht.
In Verbindung stehende Artikel: Release Word Extraction Tool v0.41: DBSchema-Vorkommenshäufigkeit von Wörtern hinzugefügt
Kim Ki-young meldete den Fehler mit folgendem Kommentar.
Hallo!
Bei Verwendung der Methode zum Extrahieren von Wörtern aus einer Datei ohne DB-Kommentar, die eine der drei Ausführungsmethoden ist
(python word_extractor.py –in_path .\in –out_path .\out)txt, Wort, ppt alle
miniconda3\envs\wordextr\lib\site-packages\pandas\core\apply.py“, Zeile 601, in normalize_dictlike_arg raise KeyError(f“Column(s) {cols_sorted} do not exist“)
KeyError: „Spalte(n) ['DBSchema'] existieren nicht“
Es wird mit einem Fehler beendet.
Die Ausführungsmethoden 2 und 3, bei denen die DB-Kommentardatei eingetragen wird, funktionieren fehlerfrei.
Ich habe 'DBSchema': [db_schema] in Zeile 97 eingefügt, aber dieses Mal
In get_grouper raise KeyError(gpr) KeyError: „Wort“-Fehler wird angezeigt.
Danke
Der geänderte Code lautet wie folgt.
if 'DB' in df_result.columns: df_group = df_result.groupby('Word').agg({ 'Word': 'count', 'Source': lambda x: '\n'.join(list(x)[:10]), 'DBSchema': 'nunique' }).rename(columns={ 'Word': 'Freq', 'Source': 'Source', 'DBSchema': 'DBSchema_Freq' }) else: df_result['DB'] = '' df_result['Schema'] = '' df_result['Table'] = '' df_result['Column'] = '' df_result['DBSchema'] = '' df_group = df_result.groupby('Word').agg({ 'Word': 'count', 'Source': lambda x: '\n'.join(list(x)[:10]) }).rename(columns={ 'Word': 'Freq', 'Source': 'Source' })
Der Fall, wo 'DB' existiert und nicht in der Spaltenliste existiert, wird in Verarbeitung unterteilt.
Den gesamten Quellcode des Word Extraction Tool v0.42 finden Sie unter der folgenden URL.
https://github.com/DAToolset/ToolsForDataStandard/blob/main/WordExtractor/word_extractor.py