Word-Extraktionstool (2): Konfigurieren Sie die Ausführungsumgebung des Word-Extraktionstools
Das Wortextraktionstool ist ein in Python entwickeltes Tool und erfordert einen Umgebungskonfigurationsprozess wie die Installation von Python und erforderlichen Paketen vor der Ausführung. Werfen wir einen Blick auf die Konfiguration der Ausführungsumgebung des Wortextraktionstools.
Dies ist eine Fortsetzung des vorherigen Artikels.
Wortextraktionstool(1): Überblick über das Wortextraktionstool
2. Konfiguration der Ausführungsumgebung des Wortextraktionswerkzeugs
2.1. Übersicht über die Umgebungskonfiguration
2.1.1. Empfehlungen
Es wird empfohlen, Miniconda statt Anaconda zu installieren. Anaconda installiert zu viele Pakete in der Standardumgebung, wodurch sie groß wird. Wir empfehlen die Verwendung von Miniconda, da es zunächst klein und leicht ist.
Wenn Miniconda nicht installiert ist, wird die Installation von virtualenv empfohlen. Wenn Sie das Paket in einer separaten Umgebung installieren, die von der Basisumgebung isoliert ist, können Sie Probleme wie Paketversionskonflikte vermeiden.
Wenn beurteilt wird, dass kein Problem vorliegt oder nur der Wortextraktor verwendet wird, ist es in Ordnung, die Standardumgebung zu verwenden. Dieser Artikel erklärt, wie man Miniconda unter Windows 10 64bit verwendet.
2.1.2. Wählen Sie einen Stemmer: Mecab
Mecab wurde ausgewählt, weil es unter den offenen Morphemanalysatoren für natürliche Sprache am schnellsten auszuführen und für den Zweck der Wortextraktion am besten geeignet war. Um einen anderen Morphemanalysator als Mecab zu verwenden, können Sie die Funktion get_word_list() umschreiben.
2.1.3. Gesamtreihenfolge der Umgebungskonfiguration
- Miniconda installieren
- Erstellen und Aktivieren einer virtuellen Umgebung
- Installieren Sie Python in einer virtuellen Umgebung
- Installieren Sie die für die virtuelle Umgebung erforderlichen Pakete (in der Basisumgebung installieren, wenn die virtuelle Umgebung nicht verwendet wird)
2.2. Miniconda installieren
https://conda.io/en/latest/miniconda.html#windows-installers Wählen Sie die Python-Version aus und laden Sie sie herunter. Das Wortextraktionstool wurde in Python 3.8 entwickelt und funktioniert gut in 3.9. Hier werden wir 3.9 herunterladen und installieren.
Führen Sie die heruntergeladene Datei (Miniconda3-py39_4.10.3-Windows-x86_64.exe) aus, um mit der Installation fortzufahren. Klicken Sie mehrmals auf die Schaltfläche Weiter, um die Installation abzuschließen.
Nachfolgende Aufgaben werden von der Miniconda-Eingabeaufforderung ausgeführt. Sie können es über den folgenden Pfad ausführen.
Startmenü > Anaconda3 (64bit) > Anaconda-Eingabeaufforderung (miniconda3)
2.3. Erstellen und Aktivieren einer virtuellen Umgebung
Wenn Sie Miniconda Prompt zum ersten Mal ausführen, wird die Basisumgebung (base) aktiviert. (siehe Bild oben)
Erstellen Sie eine separate virtuelle Umgebung für das Wortextraktionstool.
(base) C:\Users\ymlee>conda create -n wordextr
Aktivieren Sie die erstellte virtuelle Umgebung mit dem folgenden Befehl. Wenn der Name der virtuellen Umgebung (wordextr) nach der Ausführung des Befehls vorangestellt wird, ist er normalerweise aktiviert.
(base) C:\Users\ymlee>conda activate wordextr (wordextr) C:\Users\ymlee>
2.4. Installieren Sie Python in einer virtuellen Umgebung
Führen Sie den folgenden Befehl aus.
(wordextr) C:\Users\ymlee>conda install python
Es wird etwa Folgendes ausgegeben:
(wordextr) C:\Users\ymlee>conda install python Collecting package metadata (current_repodata.json): done Solving environment: done ## Package Plan ## environment location: C:\Users\ymlee\miniconda3\envs\wordextr added / updated specs: - python The following NEW packages will be INSTALLED: ca-certificates pkgs/main/win-64::ca-certificates-2021.7.5-haa95532_1 certifi pkgs/main/win-64::certifi-2021.5.30-py39haa95532_0 openssl pkgs/main/win-64::openssl-1.1.1l-h2bbff1b_0 pip pkgs/main/win-64::pip-21.2.4-py38haa95532_0 python pkgs/main/win-64::python-3.9.7-h6244533_1 setuptools pkgs/main/win-64::setuptools-58.0.4-py39haa95532_0 sqlite pkgs/main/win-64::sqlite-3.36.0-h2bbff1b_0 tzdata pkgs/main/noarch::tzdata-2021a-h5d7bf9c_0 vc pkgs/main/win-64::vc-14.2-h21ff451_1 vs2015_runtime pkgs/main/win-64::vs2015_runtime-14.27.29016-h5e58377_2 wheel pkgs/main/noarch::wheel-0.37.0-pyhd3eb1b0_1 wincertstore pkgs/main/win-64::wincertstore-0.2-py39h2bbff1b_0 Proceed ([y]/n)?
Drücken Sie einfach die Eingabetaste oder geben Sie y ein und drücken Sie die Eingabetaste, um die Installation zu starten. Wenn Sie es nicht installieren möchten, geben Sie zu Referenzzwecken n ein und drücken Sie die Eingabetaste.
2.5. Installieren Sie die erforderlichen Pakete
Installieren Sie die erforderlichen Pakete mit dem folgenden Befehl: Da wordcloud und eunjeon nicht von conda bereitgestellt werden, müssen sie mit pip installiert werden.
conda install pywin32 conda install pandas conda install Jinja2 conda install xlsxwriter pip install wordcloud pip install eunjeon
Der Zweck jedes Pakets ist wie folgt.
- pywin32: Wird zum Öffnen und Lesen von MS Word-, PowerPoint- und Excel-Dateien in der OLE-Automatisierung verwendet
- Pandas: Wird verwendet, um die Ergebnisse der Wortextraktion im Speicher zu verwalten und sie am Ende in einer Excel-Datei zu speichern
- Jinja2, xlsxwriter: Wird für ExcelWriter in Pandas verwendet
- wordcloud: Wird verwendet, um die Ergebnisse der Wortextraktion zu visualisieren
- eunjeon: mit dem koreanischen Morphemanalysator Mecab
Bei der Installation von eunjeon ist „Microsoft Visual C++ 14.0 oder höher erforderlich.“ Wenn ein Fehler auftritt, laden Sie „Microsoft Build Tools 2015 Update 3“ unter „Reistributable Packages and Build Tools“ von der unten stehenden URL herunter und installieren Sie es. Versuchen Sie es erneut.
https://visualstudio.microsoft.com/ko/vs/older-downloads/#microsoft-build-tools-2015-update-3
Wählen Sie bei der Installation „Desktop-Entwicklung mit C++“ und installieren Sie. (Der folgende Bildschirm ist ein nach der Installation aufgenommener Bildschirm und weicht geringfügig vom Bildschirm während der Installation ab.)
Installieren Sie nach der Installation von „Microsoft Build Tools 2015 Update 3“ eunjeon mit dem folgenden Befehl.
pip install eunjeon
Wenn die Installation von eunjeon abgeschlossen ist, können Sie „Microsoft Build Tools 2015 Update 3“ entfernen.
Führen Sie „Visual Studio Installer“ aus dem Startmenü aus, deaktivieren Sie „Desktop-Entwicklung mit C++“ und klicken Sie unten rechts auf die Schaltfläche „Ändern“, um es zu entfernen.
An dieser Stelle ist die Konfiguration der Umgebung abgeschlossen. Als Nächstes sehen wir uns an, wie man das Wortextraktionstool ausführt und die Ergebnisse überprüft.
<< Liste verwandter Artikel >>
- Wortextraktionstool(1): Überblick über das Wortextraktionstool
- Word-Extraktionstool (2): Konfigurieren Sie die Ausführungsumgebung des Word-Extraktionstools
- Wortextraktionstool (3): So führen Sie das Wortextraktionstool aus und überprüfen die Ergebnisse
- Wortextraktionstool(4): Beschreibung des Quellcodes des Wortextraktionstools(1)
- Wortextraktionstool(5): Beschreibung des Quellcodes des Wortextraktionstools(2)
- Wortextraktionstool (6): Zusätzliche Beschreibung des Wortextraktionstools
- Vollständiger Inhalt der Beschreibung des Word Extraction Tools, Download
(wordextr) E:\WordExtractor>python word_extractor.py –in_path .\in –out_path .\out
Ich bin ein Anfänger, der Python zum ersten Mal verwendet. Ich habe es wie oben ausgeführt und das folgende Ergebnis erhalten. Es scheint etwas mit der Routenbezeichnung nicht zu stimmen, aber ich bin ein Neuling und kann es nicht lösen. Ich würde mich über Ihre Hilfe freuen (die In- und Out-Ordner wurden korrekt erstellt).
E:\WordExtractor\word_extractor.py:382: SyntaxWarning: ungültige Escape-Sequenz „\o“
use_description = „““ – Beschreibung –
E:\WordExtractor\word_extractor.py:406: SyntaxWarning: ungültige Escape-Sequenz „\i“
parser.add_argument('–in_path', erforderlich=False, help='Pfadname der Eingabedatei (ppt, doc, txt) (z. B. .\in) ')
E:\WordExtractor\word_extractor.py:407: SyntaxWarning: ungültige Escape-Sequenz „\o“
parser.add_argument('–out_path', erforderlich=True, help='Pfadname der Ausgabedatei (xlsx, png) (z. B. .\out)')
————————————————————
Start von Word Extractor v0.41 – 20.11.2023 03:13:07.584787
##### Argumente #####
multi_process_count: 32
db_comment_file: Keine
in_path: .\in
out_path: .\out
————————————————————
[20.11.2023 03:13:07.586789] Dateiliste abrufen starten…
[2023-11-20 03:13:07.586789] Beenden Sie das Abrufen der Dateiliste.
— Dateiliste —
E:\WordExtractor\in\test.txt
[2023-11-20 03:13:07.588790] Dateitext abrufen starten…
E:\WordExtractor\word_extractor.py:382: SyntaxWarning: ungültige Escape-Sequenz „\o“
use_description = „““ – Beschreibung –
E:\WordExtractor\word_extractor.py:406: SyntaxWarning: ungültige Escape-Sequenz „\i“
parser.add_argument('–in_path', erforderlich=False, help='Pfadname der Eingabedatei (ppt, doc, txt) (z. B. .\in) ')
E:\WordExtractor\word_extractor.py:407: SyntaxWarning: ungültige Escape-Sequenz „\o“
parser.add_argument('–out_path', erforderlich=True, help='Pfadname der Ausgabedatei (xlsx, png) (z. B. .\out)')
E:\WordExtractor\word_extractor.py:382: SyntaxWarning: ungültige Escape-Sequenz „\o“
use_description = „““ – Beschreibung –
E:\WordExtractor\word_extractor.py:406: SyntaxWarning: ungültige Escape-Sequenz „\i“
parser.add_argument('–in_path', erforderlich=False, help='Pfadname der Eingabedatei (ppt, doc, txt) (z. B. .\in) ')
E:\WordExtractor\word_extractor.py:407: SyntaxWarning: ungültige Escape-Sequenz „\o“
parser.add_argument('–out_path', erforderlich=True, help='Pfadname der Ausgabedatei (xlsx, png) (z. B. .\out)')
E:\WordExtractor\word_extractor.py:382: SyntaxWarning: ungültige Escape-Sequenz „\o“
use_description = „““ – Beschreibung –
E:\WordExtractor\word_extractor.py:406: SyntaxWarning: ungültige Escape-Sequenz „\i“
parser.add_argument('–in_path', erforderlich=False, help='Pfadname der Eingabedatei (ppt, doc, txt) (z. B. .\in) ')
E:\WordExtractor\word_extractor.py:407: SyntaxWarning: ungültige Escape-Sequenz „\o“
parser.add_argument('–out_path', erforderlich=True, help='Pfadname der Ausgabedatei (xlsx, png) (z. B. .\out)')
E:\WordExtractor\word_extractor.py:382: SyntaxWarning: ungültige Escape-Sequenz „\o“
use_description = „““ – Beschreibung –
E:\WordExtractor\word_extractor.py:406: SyntaxWarning: ungültige Escape-Sequenz „\i“
parser.add_argument('–in_path', erforderlich=False, help='Pfadname der Eingabedatei (ppt, doc, txt) (z. B. .\in) ')
E:\WordExtractor\word_extractor.py:407: SyntaxWarning: ungültige Escape-Sequenz „\o“
parser.add_argument('–out_path', erforderlich=True, help='Pfadname der Ausgabedatei (xlsx, png) (z. B. .\out)')
E:\WordExtractor\word_extractor.py:382: SyntaxWarning: ungültige Escape-Sequenz „\o“
use_description = „““ – Beschreibung –
E:\WordExtractor\word_extractor.py:406: SyntaxWarning: ungültige Escape-Sequenz „\i“
parser.add_argument('–in_path', erforderlich=False, help='Pfadname der Eingabedatei (ppt, doc, txt) (z. B. .\in) ')
E:\WordExtractor\word_extractor.py:407: SyntaxWarning: ungültige Escape-Sequenz „\o“
parser.add_argument('–out_path', erforderlich=True, help='Pfadname der Ausgabedatei (xlsx, png) (z. B. .\out)')
E:\WordExtractor\word_extractor.py:382: SyntaxWarning: ungültige Escape-Sequenz „\o“
use_description = „““ – Beschreibung –
E:\WordExtractor\word_extractor.py:406: SyntaxWarning: ungültige Escape-Sequenz „\i“
parser.add_argument('–in_path', erforderlich=False, help='Pfadname der Eingabedatei (ppt, doc, txt) (z. B. .\in) ')
E:\WordExtractor\word_extractor.py:407: SyntaxWarning: ungültige Escape-Sequenz „\o“
parser.add_argument('–out_path', erforderlich=True, help='Pfadname der Ausgabedatei (xlsx, png) (z. B. .\out)')
E:\WordExtractor\word_extractor.py:382: SyntaxWarning: ungültige Escape-Sequenz „\o“
use_description = „““ – Beschreibung –
E:\WordExtractor\word_extractor.py:406: SyntaxWarning: ungültige Escape-Sequenz „\i“
parser.add_argument('–in_path', erforderlich=False, help='Pfadname der Eingabedatei (ppt, doc, txt) (z. B. .\in) ')
E:\WordExtractor\word_extractor.py:407: SyntaxWarning: ungültige Escape-Sequenz „\o“
parser.add_argument('–out_path', erforderlich=True, help='Pfadname der Ausgabedatei (xlsx, png) (z. B. .\out)')
E:\WordExtractor\word_extractor.py:382: SyntaxWarning: ungültige Escape-Sequenz „\o“
use_description = „““ – Beschreibung –
E:\WordExtractor\word_extractor.py:406: SyntaxWarning: ungültige Escape-Sequenz „\i“
parser.add_argument('–in_path', erforderlich=False, help='Pfadname der Eingabedatei (ppt, doc, txt) (z. B. .\in) ')
E:\WordExtractor\word_extractor.py:407: SyntaxWarning: ungültige Escape-Sequenz „\o“
parser.add_argument('–out_path', erforderlich=True, help='Pfadname der Ausgabedatei (xlsx, png) (z. B. .\out)')
E:\WordExtractor\word_extractor.py:382: SyntaxWarning: ungültige Escape-Sequenz „\o“
use_description = „““ – Beschreibung –
E:\WordExtractor\word_extractor.py:406: SyntaxWarning: ungültige Escape-Sequenz „\i“
parser.add_argument('–in_path', erforderlich=False, help='Pfadname der Eingabedatei (ppt, doc, txt) (z. B. .\in) ')
E:\WordExtractor\word_extractor.py:407: SyntaxWarning: ungültige Escape-Sequenz „\o“
parser.add_argument('–out_path', erforderlich=True, help='Pfadname der Ausgabedatei (xlsx, png) (z. B. .\out)')
E:\WordExtractor\word_extractor.py:382: SyntaxWarning: ungültige Escape-Sequenz „\o“
use_description = „““ – Beschreibung –
E:\WordExtractor\word_extractor.py:406: SyntaxWarning: ungültige Escape-Sequenz „\i“
parser.add_argument('–in_path', erforderlich=False, help='Pfadname der Eingabedatei (ppt, doc, txt) (z. B. .\in) ')
E:\WordExtractor\word_extractor.py:407: SyntaxWarning: ungültige Escape-Sequenz „\o“
parser.add_argument('–out_path', erforderlich=True, help='Pfadname der Ausgabedatei (xlsx, png) (z. B. .\out)')
E:\WordExtractor\word_extractor.py:382: SyntaxWarning: ungültige Escape-Sequenz „\o“
use_description = „““ – Beschreibung –
E:\WordExtractor\word_extractor.py:406: SyntaxWarning: ungültige Escape-Sequenz „\i“
parser.add_argument('–in_path', erforderlich=False, help='Pfadname der Eingabedatei (ppt, doc, txt) (z. B. .\in) ')
E:\WordExtractor\word_extractor.py:407: SyntaxWarning: ungültige Escape-Sequenz „\o“
parser.add_argument('–out_path', erforderlich=True, help='Pfadname der Ausgabedatei (xlsx, png) (z. B. .\out)')
E:\WordExtractor\word_extractor.py:382: SyntaxWarning: ungültige Escape-Sequenz „\o“
use_description = „““ – Beschreibung –
E:\WordExtractor\word_extractor.py:406: SyntaxWarning: ungültige Escape-Sequenz „\i“
parser.add_argument('–in_path', erforderlich=False, help='Pfadname der Eingabedatei (ppt, doc, txt) (z. B. .\in) ')
E:\WordExtractor\word_extractor.py:407: SyntaxWarning: ungültige Escape-Sequenz „\o“
parser.add_argument('–out_path', erforderlich=True, help='Pfadname der Ausgabedatei (xlsx, png) (z. B. .\out)')
E:\WordExtractor\word_extractor.py:382: SyntaxWarning: ungültige Escape-Sequenz „\o“
use_description = „““ – Beschreibung –
E:\WordExtractor\word_extractor.py:406: SyntaxWarning: ungültige Escape-Sequenz „\i“
parser.add_argument('–in_path', erforderlich=False, help='Pfadname der Eingabedatei (ppt, doc, txt) (z. B. .\in) ')
E:\WordExtractor\word_extractor.py:407: SyntaxWarning: ungültige Escape-Sequenz „\o“
parser.add_argument('–out_path', erforderlich=True, help='Pfadname der Ausgabedatei (xlsx, png) (z. B. .\out)')
E:\WordExtractor\word_extractor.py:382: SyntaxWarning: ungültige Escape-Sequenz „\o“
use_description = „““ – Beschreibung –
E:\WordExtractor\word_extractor.py:406: SyntaxWarning: ungültige Escape-Sequenz „\i“
parser.add_argument('–in_path', erforderlich=False, help='Pfadname der Eingabedatei (ppt, doc, txt) (z. B. .\in) ')
E:\WordExtractor\word_extractor.py:407: SyntaxWarning: ungültige Escape-Sequenz „\o“
parser.add_argument('–out_path', erforderlich=True, help='Pfadname der Ausgabedatei (xlsx, png) (z. B. .\out)')
E:\WordExtractor\word_extractor.py:382: SyntaxWarning: ungültige Escape-Sequenz „\o“
use_description = „““ – Beschreibung –
E:\WordExtractor\word_extractor.py:406: SyntaxWarning: ungültige Escape-Sequenz „\i“
parser.add_argument('–in_path', erforderlich=False, help='Pfadname der Eingabedatei (ppt, doc, txt) (z. B. .\in) ')
E:\WordExtractor\word_extractor.py:407: SyntaxWarning: ungültige Escape-Sequenz „\o“
parser.add_argument('–out_path', erforderlich=True, help='Pfadname der Ausgabedatei (xlsx, png) (z. B. .\out)')
E:\WordExtractor\word_extractor.py:382: SyntaxWarning: ungültige Escape-Sequenz „\o“
use_description = „““ – Beschreibung –
E:\WordExtractor\word_extractor.py:406: SyntaxWarning: ungültige Escape-Sequenz „\i“
parser.add_argument('–in_path', erforderlich=False, help='Pfadname der Eingabedatei (ppt, doc, txt) (z. B. .\in) ')
E:\WordExtractor\word_extractor.py:407: SyntaxWarning: ungültige Escape-Sequenz „\o“
parser.add_argument('–out_path', erforderlich=True, help='Pfadname der Ausgabedatei (xlsx, png) (z. B. .\out)')
E:\WordExtractor\word_extractor.py:382: SyntaxWarning: ungültige Escape-Sequenz „\o“
use_description = „““ – Beschreibung –
E:\WordExtractor\word_extractor.py:406: SyntaxWarning: ungültige Escape-Sequenz „\i“
parser.add_argument('–in_path', erforderlich=False, help='Pfadname der Eingabedatei (ppt, doc, txt) (z. B. .\in) ')
E:\WordExtractor\word_extractor.py:407: SyntaxWarning: ungültige Escape-Sequenz „\o“
parser.add_argument('–out_path', erforderlich=True, help='Pfadname der Ausgabedatei (xlsx, png) (z. B. .\out)')
E:\WordExtractor\word_extractor.py:382: SyntaxWarning: ungültige Escape-Sequenz „\o“
use_description = „““ – Beschreibung –
E:\WordExtractor\word_extractor.py:406: SyntaxWarning: ungültige Escape-Sequenz „\i“
parser.add_argument('–in_path', erforderlich=False, help='Pfadname der Eingabedatei (ppt, doc, txt) (z. B. .\in) ')
E:\WordExtractor\word_extractor.py:407: SyntaxWarning: ungültige Escape-Sequenz „\o“
parser.add_argument('–out_path', erforderlich=True, help='Pfadname der Ausgabedatei (xlsx, png) (z. B. .\out)')
E:\WordExtractor\word_extractor.py:382: SyntaxWarning: ungültige Escape-Sequenz „\o“
use_description = „““ – Beschreibung –
E:\WordExtractor\word_extractor.py:406: SyntaxWarning: ungültige Escape-Sequenz „\i“
parser.add_argument('–in_path', erforderlich=False, help='Pfadname der Eingabedatei (ppt, doc, txt) (z. B. .\in) ')
E:\WordExtractor\word_extractor.py:407: SyntaxWarning: ungültige Escape-Sequenz „\o“
parser.add_argument('–out_path', erforderlich=True, help='Pfadname der Ausgabedatei (xlsx, png) (z. B. .\out)')
E:\WordExtractor\word_extractor.py:382: SyntaxWarning: ungültige Escape-Sequenz „\o“
use_description = „““ – Beschreibung –
E:\WordExtractor\word_extractor.py:406: SyntaxWarning: ungültige Escape-Sequenz „\i“
parser.add_argument('–in_path', erforderlich=False, help='Pfadname der Eingabedatei (ppt, doc, txt) (z. B. .\in) ')
E:\WordExtractor\word_extractor.py:407: SyntaxWarning: ungültige Escape-Sequenz „\o“
parser.add_argument('–out_path', erforderlich=True, help='Pfadname der Ausgabedatei (xlsx, png) (z. B. .\out)')
E:\WordExtractor\word_extractor.py:382: SyntaxWarning: ungültige Escape-Sequenz „\o“
use_description = „““ – Beschreibung –
E:\WordExtractor\word_extractor.py:406: SyntaxWarning: ungültige Escape-Sequenz „\i“
parser.add_argument('–in_path', erforderlich=False, help='Pfadname der Eingabedatei (ppt, doc, txt) (z. B. .\in) ')
E:\WordExtractor\word_extractor.py:407: SyntaxWarning: ungültige Escape-Sequenz „\o“
parser.add_argument('–out_path', erforderlich=True, help='Pfadname der Ausgabedatei (xlsx, png) (z. B. .\out)')
E:\WordExtractor\word_extractor.py:382: SyntaxWarning: ungültige Escape-Sequenz „\o“
use_description = „““ – Beschreibung –
E:\WordExtractor\word_extractor.py:406: SyntaxWarning: ungültige Escape-Sequenz „\i“
parser.add_argument('–in_path', erforderlich=False, help='Pfadname der Eingabedatei (ppt, doc, txt) (z. B. .\in) ')
E:\WordExtractor\word_extractor.py:407: SyntaxWarning: ungültige Escape-Sequenz „\o“
parser.add_argument('–out_path', erforderlich=True, help='Pfadname der Ausgabedatei (xlsx, png) (z. B. .\out)')
E:\WordExtractor\word_extractor.py:382: SyntaxWarning: ungültige Escape-Sequenz „\o“
use_description = „““ – Beschreibung –
E:\WordExtractor\word_extractor.py:406: SyntaxWarning: ungültige Escape-Sequenz „\i“
parser.add_argument('–in_path', erforderlich=False, help='Pfadname der Eingabedatei (ppt, doc, txt) (z. B. .\in) ')
E:\WordExtractor\word_extractor.py:407: SyntaxWarning: ungültige Escape-Sequenz „\o“
parser.add_argument('–out_path', erforderlich=True, help='Pfadname der Ausgabedatei (xlsx, png) (z. B. .\out)')
E:\WordExtractor\word_extractor.py:382: SyntaxWarning: ungültige Escape-Sequenz „\o“
use_description = „““ – Beschreibung –
E:\WordExtractor\word_extractor.py:406: SyntaxWarning: ungültige Escape-Sequenz „\i“
parser.add_argument('–in_path', erforderlich=False, help='Pfadname der Eingabedatei (ppt, doc, txt) (z. B. .\in) ')
E:\WordExtractor\word_extractor.py:407: SyntaxWarning: ungültige Escape-Sequenz „\o“
parser.add_argument('–out_path', erforderlich=True, help='Pfadname der Ausgabedatei (xlsx, png) (z. B. .\out)')
E:\WordExtractor\word_extractor.py:382: SyntaxWarning: ungültige Escape-Sequenz „\o“
use_description = „““ – Beschreibung –
E:\WordExtractor\word_extractor.py:406: SyntaxWarning: ungültige Escape-Sequenz „\i“
parser.add_argument('–in_path', erforderlich=False, help='Pfadname der Eingabedatei (ppt, doc, txt) (z. B. .\in) ')
E:\WordExtractor\word_extractor.py:407: SyntaxWarning: ungültige Escape-Sequenz „\o“
parser.add_argument('–out_path', erforderlich=True, help='Pfadname der Ausgabedatei (xlsx, png) (z. B. .\out)')
E:\WordExtractor\word_extractor.py:382: SyntaxWarning: ungültige Escape-Sequenz „\o“
use_description = „““ – Beschreibung –
E:\WordExtractor\word_extractor.py:406: SyntaxWarning: ungültige Escape-Sequenz „\i“
parser.add_argument('–in_path', erforderlich=False, help='Pfadname der Eingabedatei (ppt, doc, txt) (z. B. .\in) ')
E:\WordExtractor\word_extractor.py:407: SyntaxWarning: ungültige Escape-Sequenz „\o“
parser.add_argument('–out_path', erforderlich=True, help='Pfadname der Ausgabedatei (xlsx, png) (z. B. .\out)')
E:\WordExtractor\word_extractor.py:382: SyntaxWarning: ungültige Escape-Sequenz „\o“
use_description = „““ – Beschreibung –
E:\WordExtractor\word_extractor.py:406: SyntaxWarning: ungültige Escape-Sequenz „\i“
parser.add_argument('–in_path', erforderlich=False, help='Pfadname der Eingabedatei (ppt, doc, txt) (z. B. .\in) ')
E:\WordExtractor\word_extractor.py:407: SyntaxWarning: ungültige Escape-Sequenz „\o“
parser.add_argument('–out_path', erforderlich=True, help='Pfadname der Ausgabedatei (xlsx, png) (z. B. .\out)')
E:\WordExtractor\word_extractor.py:382: SyntaxWarning: ungültige Escape-Sequenz „\o“
use_description = „““ – Beschreibung –
E:\WordExtractor\word_extractor.py:406: SyntaxWarning: ungültige Escape-Sequenz „\i“
parser.add_argument('–in_path', erforderlich=False, help='Pfadname der Eingabedatei (ppt, doc, txt) (z. B. .\in) ')
E:\WordExtractor\word_extractor.py:407: SyntaxWarning: ungültige Escape-Sequenz „\o“
parser.add_argument('–out_path', erforderlich=True, help='Pfadname der Ausgabedatei (xlsx, png) (z. B. .\out)')
E:\WordExtractor\word_extractor.py:382: SyntaxWarning: ungültige Escape-Sequenz „\o“
use_description = „““ – Beschreibung –
E:\WordExtractor\word_extractor.py:406: SyntaxWarning: ungültige Escape-Sequenz „\i“
parser.add_argument('–in_path', erforderlich=False, help='Pfadname der Eingabedatei (ppt, doc, txt) (z. B. .\in) ')
E:\WordExtractor\word_extractor.py:407: SyntaxWarning: ungültige Escape-Sequenz „\o“
parser.add_argument('–out_path', erforderlich=True, help='Pfadname der Ausgabedatei (xlsx, png) (z. B. .\out)')
E:\WordExtractor\word_extractor.py:382: SyntaxWarning: ungültige Escape-Sequenz „\o“
use_description = „““ – Beschreibung –
E:\WordExtractor\word_extractor.py:406: SyntaxWarning: ungültige Escape-Sequenz „\i“
parser.add_argument('–in_path', erforderlich=False, help='Pfadname der Eingabedatei (ppt, doc, txt) (z. B. .\in) ')
E:\WordExtractor\word_extractor.py:407: SyntaxWarning: ungültige Escape-Sequenz „\o“
parser.add_argument('–out_path', erforderlich=True, help='Pfadname der Ausgabedatei (xlsx, png) (z. B. .\out)')
E:\WordExtractor\word_extractor.py:382: SyntaxWarning: ungültige Escape-Sequenz „\o“
use_description = „““ – Beschreibung –
E:\WordExtractor\word_extractor.py:406: SyntaxWarning: ungültige Escape-Sequenz „\i“
parser.add_argument('–in_path', erforderlich=False, help='Pfadname der Eingabedatei (ppt, doc, txt) (z. B. .\in) ')
E:\WordExtractor\word_extractor.py:407: SyntaxWarning: ungültige Escape-Sequenz „\o“
parser.add_argument('–out_path', erforderlich=True, help='Pfadname der Ausgabedatei (xlsx, png) (z. B. .\out)')
E:\WordExtractor\word_extractor.py:382: SyntaxWarning: ungültige Escape-Sequenz „\o“
use_description = „““ – Beschreibung –
E:\WordExtractor\word_extractor.py:406: SyntaxWarning: ungültige Escape-Sequenz „\i“
parser.add_argument('–in_path', erforderlich=False, help='Pfadname der Eingabedatei (ppt, doc, txt) (z. B. .\in) ')
E:\WordExtractor\word_extractor.py:407: SyntaxWarning: ungültige Escape-Sequenz „\o“
parser.add_argument('–out_path', erforderlich=True, help='Pfadname der Ausgabedatei (xlsx, png) (z. B. .\out)')
get_txt_text: E:\WordExtractor\in\test.txt
multiprocessing.pool.RemoteTraceback:
“””
Traceback (letzter Anruf zuletzt):
Datei „C:\ProgramData\miniconda3\envs\wordextr\Lib\multiprocessing\pool.py“, Zeile 125, im Worker
result = (True, func(*args, **kwds))
^^^^^^^^^^^^^^^^^^^
Datei „C:\ProgramData\miniconda3\envs\wordextr\Lib\multiprocessing\pool.py“, Zeile 48, in Mapstar
Rückgabeliste(map(*args))
^^^^^^^^^^^^^^^^
Datei „E:\WordExtractor\word_extractor.py“, Zeile 367, in get_file_text
df_text = get_txt_text(file_name)
^^^^^^^^^^^^^^^^^^^^^^^
Datei „E:\WordExtractor\word_extractor.py“, Zeile 238, in get_txt_text
df_text = df_text.append(sr_text,ignore_index=True)
^^^^^^^^^^^^^^
Datei „C:\ProgramData\miniconda3\envs\wordextr\Lib\site-packages\pandas\core\generic.py“, Zeile 6204, in __getattr__
return object.__getattribute__(self, name)
^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
AttributeError: Das „DataFrame“-Objekt hat kein Attribut „append“. Meinten Sie: '_append'?
“””
Die obige Ausnahme war die direkte Ursache für die folgende Ausnahme:
Traceback (letzter Anruf zuletzt):
Datei „E:\WordExtractor\word_extractor.py“, Zeile 559, in
hauptsächlich()
Datei „E:\WordExtractor\word_extractor.py“, Zeile 460, im Hauptverzeichnis
mp_text_result = pool.map(get_file_text, file_list)
^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
Datei „C:\ProgramData\miniconda3\envs\wordextr\Lib\multiprocessing\pool.py“, Zeile 367, in der Karte
return self._map_async(func, iterable, mapstar, chunksize).get()
^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
Datei „C:\ProgramData\miniconda3\envs\wordextr\Lib\multiprocessing\pool.py“, Zeile 774, in get
Selbstwert erhöhen
AttributeError: „DataFrame“-Objekt hat kein Attribut „append“
(wordextr) E:\WordExtractor>
Hallo, schön dich kennen zu lernen.
Da es sich hierbei um einen Fehler handelt, den ich noch nicht erlebt habe, ist es schwierig, Ihnen sofort zu sagen, wie Sie ihn beheben können.
Könnten Sie bitte die Python-Version, die Numpy- und die Pandas-Version überprüfen und mir diese mitteilen?
Ich denke, Sie müssen dies überprüfen, da die Version unterschiedlich ist.
Als Referenz ist die Version der Umgebung, die ich implementiert und getestet habe, wie folgt.
– Python: 3.9.6 (So überprüfen Sie: Python-Version)
– numpy: 1.20.3 (So überprüfen Sie: Pip-Liste) (Sie können Pandas unten auch sofort überprüfen)
– Pandas: 1.3.1
Ich hatte auch den gleichen Fehler. Ich habe es gemäß den Versionen der von Ihnen freigegebenen Pakete ausgeführt und es war erfolgreich.
Hallo. Ich habe eine Frage zur Anaconda-Installation. Ich würde innerhalb des Unternehmens gerne ein Wortextraktionstool verwenden, aber da Anaconda kostenpflichtig ist, empfiehlt das Unternehmen die Verwendung von Miniforge. Gibt es einen Unterschied in der Funktionalität, wenn ich nach der Installation von Miniforge das Wortextraktionstool verwende?
Ich habe Miniforge nicht verwendet, daher weiß ich nicht, ob es einen funktionalen Unterschied geben wird.
Der Zweck der Installation von Miniconda bestand darin, auf einfache Weise eine virtuelle Umgebung zu erstellen und zu verwalten, und nicht darin, die Paketinstallation zu erleichtern.
Versuche dies:
– Verwenden Sie venv oder virtualenv anstelle von miniconda (siehe: https://richwind.co.kr/193)
– „2.5. Ändern Sie im Inhalt „Erforderliche Pakete installieren“ „conda install“ in „pip install“.
Ich hoffe, es geht gut.
Zuerst habe ich Miniforge installiert und den oben genannten Vorgang an der Miniforge-Eingabeaufforderung ausgeführt, aber nichts ist passiert.
Und das von Ihnen erwähnte „Microsoft Build Tools 2015 Update 3“ ließ sich nicht gut installieren, also habe ich Microsoft Build Tools 2022 installiert und eunjeon erhalten.
Jetzt werde ich das Extraktionstool ausprobieren und Ihnen Feedback geben 🙂
Ich hoffe, es läuft gut ^^