Vollständiger Inhalt der Beschreibung des Word Extraction Tools, Download
Ich habe eine Erklärung des Wortextraktions-Tools in sechs Teilen geschrieben und sie alle in meinem Blog veröffentlicht. Schreiben Sie das gesamte Inhaltsverzeichnis der Beschreibung des Wortextraktionstools und veröffentlichen Sie es als separaten Artikel.
- 2. Konfiguration der Ausführungsumgebung des Wortextraktionswerkzeugs
- 3. Führen Sie das Wortextraktionstool aus
- 3.1. Laden Sie das Wortextraktionstool herunter
- 3.2. So führen Sie das Wortextraktionstool aus
- 3.2.1. Entpacken Sie die heruntergeladene Datei und aktivieren Sie die virtuelle Python-Umgebung
- 3.2.2. Überprüfen Sie die Hilfe
- 3.2.3. Methode 1 Wörter nur aus Dokumentdateien extrahieren
- 3.2.4. Methode 2 Wörter nur aus DB-Tabelle, Spaltenkommentare extrahieren
- 3.2.5. Ausführungsmethode 3 Wörter aus allen Dokumentdateien, DB-Tabellen und Spaltenkommentaren extrahieren
- 3.2.6. So überprüfen Sie Ausführungsergebnisse
- 3.2.7. Vorsichtsmaßnahmen/Hinweise zur Ausführung
- 4. Quellcode des Wortextraktionstools
- 4.1. Gliederung
- 4.2. Hauptfunktion
- 4.2.1. Argumentanalyse
- 4.2.2. Liste der zu verarbeitenden Dateien extrahieren
- 4.2.3. Führen Sie get_file_text mit Mehrfachverarbeitung aus
- 4.2.4. Führen Sie get_word_list mit Mehrfachverarbeitung aus
- 4.2.5. Holen Sie sich Worthäufigkeiten und führen Sie make_word_cloud aus
- 4.2.6. Speichern Sie die extrahierte Wortliste und Worthäufigkeit als Excel-Datei, drucken Sie die Ausführungszeit und beenden Sie
- 4.3. get_file_text-Funktion
- 4.4. get_word_list-Funktion
- 4.5. make_word_cloud-Funktion
Das Wortextraktionstool kann unten aus dem Github-Repository heruntergeladen werden.
https://github.com/DAToolset/ToolsForDataStandard/tree/main/WordExtractor
Quellcodes, Schriftarten, Tabellen-/Spaltenlistenbeispieldateien und Ausgabebeispieldateien, die für die Ausführung erforderlich sind, sind in einer komprimierten Datei zur Verteilung gebündelt, sodass Sie diese Datei herunterladen können.
https://github.com/DAToolset/ToolsForDataStandard/raw/main/WordExtractor/word_extractor.7z
Ich hoffe, dass dies bei der Datenstandardisierung hilfreich sein wird.