Word-Extraktionstool (2): Konfigurieren Sie die Ausführungsumgebung des Word-Extraktionstools

Das Wortextraktionstool ist ein in Python entwickeltes Tool und erfordert einen Umgebungskonfigurationsprozess wie die Installation von Python und erforderlichen Paketen vor der Ausführung. Werfen wir einen Blick auf die Konfiguration der Ausführungsumgebung des Wortextraktionstools.

Dies ist eine Fortsetzung des vorherigen Artikels.

Wortextraktionstool(1): Überblick über das Wortextraktionstool

2. Konfiguration der Ausführungsumgebung des Wortextraktionswerkzeugs

2.1. Übersicht über die Umgebungskonfiguration

2.1.1. Empfehlungen

Es wird empfohlen, Miniconda statt Anaconda zu installieren. Anaconda installiert zu viele Pakete in der Standardumgebung, wodurch sie groß wird. Wir empfehlen die Verwendung von Miniconda, da es zunächst klein und leicht ist.

Wenn Miniconda nicht installiert ist, wird die Installation von virtualenv empfohlen. Wenn Sie das Paket in einer separaten Umgebung installieren, die von der Basisumgebung isoliert ist, können Sie Probleme wie Paketversionskonflikte vermeiden.

Wenn beurteilt wird, dass kein Problem vorliegt oder nur der Wortextraktor verwendet wird, ist es in Ordnung, die Standardumgebung zu verwenden. Dieser Artikel erklärt, wie man Miniconda unter Windows 10 64bit verwendet.

2.1.2. Wählen Sie einen Stemmer: Mecab

Mecab wurde ausgewählt, weil es unter den offenen Morphemanalysatoren für natürliche Sprache am schnellsten auszuführen und für den Zweck der Wortextraktion am besten geeignet war. Um einen anderen Morphemanalysator als Mecab zu verwenden, können Sie die Funktion get_word_list() umschreiben.

2.1.3. Gesamtreihenfolge der Umgebungskonfiguration

  1. Miniconda installieren
  2. Erstellen und Aktivieren einer virtuellen Umgebung
  3. Installieren Sie Python in einer virtuellen Umgebung
  4. Installieren Sie die für die virtuelle Umgebung erforderlichen Pakete (in der Basisumgebung installieren, wenn die virtuelle Umgebung nicht verwendet wird)

2.2. Miniconda installieren

https://conda.io/en/latest/miniconda.html#windows-installers Wählen Sie die Python-Version aus und laden Sie sie herunter. Das Wortextraktionstool wurde in Python 3.8 entwickelt und funktioniert gut in 3.9. Hier werden wir 3.9 herunterladen und installieren.

Miniconda Windows Installers version
Miniconda Windows Installer-Version

Führen Sie die heruntergeladene Datei (Miniconda3-py39_4.10.3-Windows-x86_64.exe) aus, um mit der Installation fortzufahren. Klicken Sie mehrmals auf die Schaltfläche Weiter, um die Installation abzuschließen.

Miniconda 설치 화면
Miniconda-Installationsbildschirm

Nachfolgende Aufgaben werden von der Miniconda-Eingabeaufforderung ausgeführt. Sie können es über den folgenden Pfad ausführen.

Startmenü > Anaconda3 (64bit) > Anaconda-Eingabeaufforderung (miniconda3)

Miniconda Prompt 실행
Führen Sie die Miniconda-Eingabeaufforderung aus

2.3. Erstellen und Aktivieren einer virtuellen Umgebung

Wenn Sie Miniconda Prompt zum ersten Mal ausführen, wird die Basisumgebung (base) aktiviert. (siehe Bild oben)

Erstellen Sie eine separate virtuelle Umgebung für das Wortextraktionstool.

(base) C:\Users\ymlee>conda create -n wordextr

Aktivieren Sie die erstellte virtuelle Umgebung mit dem folgenden Befehl. Wenn der Name der virtuellen Umgebung (wordextr) nach der Ausführung des Befehls vorangestellt wird, ist er normalerweise aktiviert.

(base) C:\Users\ymlee>conda activate wordextr
(wordextr) C:\Users\ymlee>

2.4. Installieren Sie Python in einer virtuellen Umgebung

Führen Sie den folgenden Befehl aus.

(wordextr) C:\Users\ymlee>conda install python

Es wird etwa Folgendes ausgegeben:

(wordextr) C:\Users\ymlee>conda install python
Collecting package metadata (current_repodata.json): done
Solving environment: done

## Package Plan ##

  environment location: C:\Users\ymlee\miniconda3\envs\wordextr

  added / updated specs:
    - python


The following NEW packages will be INSTALLED:

  ca-certificates    pkgs/main/win-64::ca-certificates-2021.7.5-haa95532_1
  certifi            pkgs/main/win-64::certifi-2021.5.30-py39haa95532_0
  openssl            pkgs/main/win-64::openssl-1.1.1l-h2bbff1b_0
  pip                pkgs/main/win-64::pip-21.2.4-py38haa95532_0
  python             pkgs/main/win-64::python-3.9.7-h6244533_1
  setuptools         pkgs/main/win-64::setuptools-58.0.4-py39haa95532_0
  sqlite             pkgs/main/win-64::sqlite-3.36.0-h2bbff1b_0
  tzdata             pkgs/main/noarch::tzdata-2021a-h5d7bf9c_0
  vc                 pkgs/main/win-64::vc-14.2-h21ff451_1
  vs2015_runtime     pkgs/main/win-64::vs2015_runtime-14.27.29016-h5e58377_2
  wheel              pkgs/main/noarch::wheel-0.37.0-pyhd3eb1b0_1
  wincertstore       pkgs/main/win-64::wincertstore-0.2-py39h2bbff1b_0


Proceed ([y]/n)?

Drücken Sie einfach die Eingabetaste oder geben Sie y ein und drücken Sie die Eingabetaste, um die Installation zu starten. Wenn Sie es nicht installieren möchten, geben Sie zu Referenzzwecken n ein und drücken Sie die Eingabetaste.

2.5. Installieren Sie die erforderlichen Pakete

Installieren Sie die erforderlichen Pakete mit dem folgenden Befehl: Da wordcloud und eunjeon nicht von conda bereitgestellt werden, müssen sie mit pip installiert werden.

conda install pywin32
conda install pandas
conda install Jinja2
conda install xlsxwriter
pip install wordcloud
pip install eunjeon

Der Zweck jedes Pakets ist wie folgt.

  • pywin32: Wird zum Öffnen und Lesen von MS Word-, PowerPoint- und Excel-Dateien in der OLE-Automatisierung verwendet
  • Pandas: Wird verwendet, um die Ergebnisse der Wortextraktion im Speicher zu verwalten und sie am Ende in einer Excel-Datei zu speichern
  • Jinja2, xlsxwriter: Wird für ExcelWriter in Pandas verwendet
  • wordcloud: Wird verwendet, um die Ergebnisse der Wortextraktion zu visualisieren
  • eunjeon: mit dem koreanischen Morphemanalysator Mecab

Bei der Installation von eunjeon ist „Microsoft Visual C++ 14.0 oder höher erforderlich.“ Wenn ein Fehler auftritt, laden Sie „Microsoft Build Tools 2015 Update 3“ unter „Reistributable Packages and Build Tools“ von der unten stehenden URL herunter und installieren Sie es. Versuchen Sie es erneut.

https://visualstudio.microsoft.com/ko/vs/older-downloads/#microsoft-build-tools-2015-update-3

Wählen Sie bei der Installation „Desktop-Entwicklung mit C++“ und installieren Sie. (Der folgende Bildschirm ist ein nach der Installation aufgenommener Bildschirm und weicht geringfügig vom Bildschirm während der Installation ab.)

Microsoft Build Tools 2015 업데이트 3 설치
Installieren Sie Microsoft Build Tools 2015 Update 3

Installieren Sie nach der Installation von „Microsoft Build Tools 2015 Update 3“ eunjeon mit dem folgenden Befehl.

pip install eunjeon

Wenn die Installation von eunjeon abgeschlossen ist, können Sie „Microsoft Build Tools 2015 Update 3“ entfernen.

Führen Sie „Visual Studio Installer“ aus dem Startmenü aus, deaktivieren Sie „Desktop-Entwicklung mit C++“ und klicken Sie unten rechts auf die Schaltfläche „Ändern“, um es zu entfernen.

Visual Studio Installer 실행
Führen Sie den Visual Studio-Installer aus
Microsoft Build Tools 2015 업데이트 3 제거
Deinstallieren Sie Microsoft Build Tools 2015 Update 3

An dieser Stelle ist die Konfiguration der Umgebung abgeschlossen. Als Nächstes sehen wir uns an, wie man das Wortextraktionstool ausführt und die Ergebnisse überprüft.


<< Liste verwandter Artikel >>

7 Antworten

  1. Avatar-Foto 김철민 sagt:

    (wordextr) E:\WordExtractor>python word_extractor.py –in_path .\in –out_path .\out
    Ich bin ein Anfänger, der Python zum ersten Mal verwendet. Ich habe es wie oben ausgeführt und das folgende Ergebnis erhalten. Es scheint etwas mit der Routenbezeichnung nicht zu stimmen, aber ich bin ein Neuling und kann es nicht lösen. Ich würde mich über Ihre Hilfe freuen (die In- und Out-Ordner wurden korrekt erstellt).

    E:\WordExtractor\word_extractor.py:382: SyntaxWarning: ungültige Escape-Sequenz „\o“
    use_description = „““ – Beschreibung –
    E:\WordExtractor\word_extractor.py:406: SyntaxWarning: ungültige Escape-Sequenz „\i“
    parser.add_argument('–in_path', erforderlich=False, help='Pfadname der Eingabedatei (ppt, doc, txt) (z. B. .\in) ')
    E:\WordExtractor\word_extractor.py:407: SyntaxWarning: ungültige Escape-Sequenz „\o“
    parser.add_argument('–out_path', erforderlich=True, help='Pfadname der Ausgabedatei (xlsx, png) (z. B. .\out)')
    ————————————————————
    Start von Word Extractor v0.41 – 20.11.2023 03:13:07.584787
    ##### Argumente #####
    multi_process_count: 32
    db_comment_file: Keine
    in_path: .\in
    out_path: .\out
    ————————————————————
    [20.11.2023 03:13:07.586789] Dateiliste abrufen starten…
    [2023-11-20 03:13:07.586789] Beenden Sie das Abrufen der Dateiliste.
    — Dateiliste —
    E:\WordExtractor\in\test.txt
    [2023-11-20 03:13:07.588790] Dateitext abrufen starten…
    E:\WordExtractor\word_extractor.py:382: SyntaxWarning: ungültige Escape-Sequenz „\o“
    use_description = „““ – Beschreibung –
    E:\WordExtractor\word_extractor.py:406: SyntaxWarning: ungültige Escape-Sequenz „\i“
    parser.add_argument('–in_path', erforderlich=False, help='Pfadname der Eingabedatei (ppt, doc, txt) (z. B. .\in) ')
    E:\WordExtractor\word_extractor.py:407: SyntaxWarning: ungültige Escape-Sequenz „\o“
    parser.add_argument('–out_path', erforderlich=True, help='Pfadname der Ausgabedatei (xlsx, png) (z. B. .\out)')
    E:\WordExtractor\word_extractor.py:382: SyntaxWarning: ungültige Escape-Sequenz „\o“
    use_description = „““ – Beschreibung –
    E:\WordExtractor\word_extractor.py:406: SyntaxWarning: ungültige Escape-Sequenz „\i“
    parser.add_argument('–in_path', erforderlich=False, help='Pfadname der Eingabedatei (ppt, doc, txt) (z. B. .\in) ')
    E:\WordExtractor\word_extractor.py:407: SyntaxWarning: ungültige Escape-Sequenz „\o“
    parser.add_argument('–out_path', erforderlich=True, help='Pfadname der Ausgabedatei (xlsx, png) (z. B. .\out)')
    E:\WordExtractor\word_extractor.py:382: SyntaxWarning: ungültige Escape-Sequenz „\o“
    use_description = „““ – Beschreibung –
    E:\WordExtractor\word_extractor.py:406: SyntaxWarning: ungültige Escape-Sequenz „\i“
    parser.add_argument('–in_path', erforderlich=False, help='Pfadname der Eingabedatei (ppt, doc, txt) (z. B. .\in) ')
    E:\WordExtractor\word_extractor.py:407: SyntaxWarning: ungültige Escape-Sequenz „\o“
    parser.add_argument('–out_path', erforderlich=True, help='Pfadname der Ausgabedatei (xlsx, png) (z. B. .\out)')
    E:\WordExtractor\word_extractor.py:382: SyntaxWarning: ungültige Escape-Sequenz „\o“
    use_description = „““ – Beschreibung –
    E:\WordExtractor\word_extractor.py:406: SyntaxWarning: ungültige Escape-Sequenz „\i“
    parser.add_argument('–in_path', erforderlich=False, help='Pfadname der Eingabedatei (ppt, doc, txt) (z. B. .\in) ')
    E:\WordExtractor\word_extractor.py:407: SyntaxWarning: ungültige Escape-Sequenz „\o“
    parser.add_argument('–out_path', erforderlich=True, help='Pfadname der Ausgabedatei (xlsx, png) (z. B. .\out)')
    E:\WordExtractor\word_extractor.py:382: SyntaxWarning: ungültige Escape-Sequenz „\o“
    use_description = „““ – Beschreibung –
    E:\WordExtractor\word_extractor.py:406: SyntaxWarning: ungültige Escape-Sequenz „\i“
    parser.add_argument('–in_path', erforderlich=False, help='Pfadname der Eingabedatei (ppt, doc, txt) (z. B. .\in) ')
    E:\WordExtractor\word_extractor.py:407: SyntaxWarning: ungültige Escape-Sequenz „\o“
    parser.add_argument('–out_path', erforderlich=True, help='Pfadname der Ausgabedatei (xlsx, png) (z. B. .\out)')
    E:\WordExtractor\word_extractor.py:382: SyntaxWarning: ungültige Escape-Sequenz „\o“
    use_description = „““ – Beschreibung –
    E:\WordExtractor\word_extractor.py:406: SyntaxWarning: ungültige Escape-Sequenz „\i“
    parser.add_argument('–in_path', erforderlich=False, help='Pfadname der Eingabedatei (ppt, doc, txt) (z. B. .\in) ')
    E:\WordExtractor\word_extractor.py:407: SyntaxWarning: ungültige Escape-Sequenz „\o“
    parser.add_argument('–out_path', erforderlich=True, help='Pfadname der Ausgabedatei (xlsx, png) (z. B. .\out)')
    E:\WordExtractor\word_extractor.py:382: SyntaxWarning: ungültige Escape-Sequenz „\o“
    use_description = „““ – Beschreibung –
    E:\WordExtractor\word_extractor.py:406: SyntaxWarning: ungültige Escape-Sequenz „\i“
    parser.add_argument('–in_path', erforderlich=False, help='Pfadname der Eingabedatei (ppt, doc, txt) (z. B. .\in) ')
    E:\WordExtractor\word_extractor.py:407: SyntaxWarning: ungültige Escape-Sequenz „\o“
    parser.add_argument('–out_path', erforderlich=True, help='Pfadname der Ausgabedatei (xlsx, png) (z. B. .\out)')
    E:\WordExtractor\word_extractor.py:382: SyntaxWarning: ungültige Escape-Sequenz „\o“
    use_description = „““ – Beschreibung –
    E:\WordExtractor\word_extractor.py:406: SyntaxWarning: ungültige Escape-Sequenz „\i“
    parser.add_argument('–in_path', erforderlich=False, help='Pfadname der Eingabedatei (ppt, doc, txt) (z. B. .\in) ')
    E:\WordExtractor\word_extractor.py:407: SyntaxWarning: ungültige Escape-Sequenz „\o“
    parser.add_argument('–out_path', erforderlich=True, help='Pfadname der Ausgabedatei (xlsx, png) (z. B. .\out)')
    E:\WordExtractor\word_extractor.py:382: SyntaxWarning: ungültige Escape-Sequenz „\o“
    use_description = „““ – Beschreibung –
    E:\WordExtractor\word_extractor.py:406: SyntaxWarning: ungültige Escape-Sequenz „\i“
    parser.add_argument('–in_path', erforderlich=False, help='Pfadname der Eingabedatei (ppt, doc, txt) (z. B. .\in) ')
    E:\WordExtractor\word_extractor.py:407: SyntaxWarning: ungültige Escape-Sequenz „\o“
    parser.add_argument('–out_path', erforderlich=True, help='Pfadname der Ausgabedatei (xlsx, png) (z. B. .\out)')
    E:\WordExtractor\word_extractor.py:382: SyntaxWarning: ungültige Escape-Sequenz „\o“
    use_description = „““ – Beschreibung –
    E:\WordExtractor\word_extractor.py:406: SyntaxWarning: ungültige Escape-Sequenz „\i“
    parser.add_argument('–in_path', erforderlich=False, help='Pfadname der Eingabedatei (ppt, doc, txt) (z. B. .\in) ')
    E:\WordExtractor\word_extractor.py:407: SyntaxWarning: ungültige Escape-Sequenz „\o“
    parser.add_argument('–out_path', erforderlich=True, help='Pfadname der Ausgabedatei (xlsx, png) (z. B. .\out)')
    E:\WordExtractor\word_extractor.py:382: SyntaxWarning: ungültige Escape-Sequenz „\o“
    use_description = „““ – Beschreibung –
    E:\WordExtractor\word_extractor.py:406: SyntaxWarning: ungültige Escape-Sequenz „\i“
    parser.add_argument('–in_path', erforderlich=False, help='Pfadname der Eingabedatei (ppt, doc, txt) (z. B. .\in) ')
    E:\WordExtractor\word_extractor.py:407: SyntaxWarning: ungültige Escape-Sequenz „\o“
    parser.add_argument('–out_path', erforderlich=True, help='Pfadname der Ausgabedatei (xlsx, png) (z. B. .\out)')
    E:\WordExtractor\word_extractor.py:382: SyntaxWarning: ungültige Escape-Sequenz „\o“
    use_description = „““ – Beschreibung –
    E:\WordExtractor\word_extractor.py:406: SyntaxWarning: ungültige Escape-Sequenz „\i“
    parser.add_argument('–in_path', erforderlich=False, help='Pfadname der Eingabedatei (ppt, doc, txt) (z. B. .\in) ')
    E:\WordExtractor\word_extractor.py:407: SyntaxWarning: ungültige Escape-Sequenz „\o“
    parser.add_argument('–out_path', erforderlich=True, help='Pfadname der Ausgabedatei (xlsx, png) (z. B. .\out)')
    E:\WordExtractor\word_extractor.py:382: SyntaxWarning: ungültige Escape-Sequenz „\o“
    use_description = „““ – Beschreibung –
    E:\WordExtractor\word_extractor.py:406: SyntaxWarning: ungültige Escape-Sequenz „\i“
    parser.add_argument('–in_path', erforderlich=False, help='Pfadname der Eingabedatei (ppt, doc, txt) (z. B. .\in) ')
    E:\WordExtractor\word_extractor.py:407: SyntaxWarning: ungültige Escape-Sequenz „\o“
    parser.add_argument('–out_path', erforderlich=True, help='Pfadname der Ausgabedatei (xlsx, png) (z. B. .\out)')
    E:\WordExtractor\word_extractor.py:382: SyntaxWarning: ungültige Escape-Sequenz „\o“
    use_description = „““ – Beschreibung –
    E:\WordExtractor\word_extractor.py:406: SyntaxWarning: ungültige Escape-Sequenz „\i“
    parser.add_argument('–in_path', erforderlich=False, help='Pfadname der Eingabedatei (ppt, doc, txt) (z. B. .\in) ')
    E:\WordExtractor\word_extractor.py:407: SyntaxWarning: ungültige Escape-Sequenz „\o“
    parser.add_argument('–out_path', erforderlich=True, help='Pfadname der Ausgabedatei (xlsx, png) (z. B. .\out)')
    E:\WordExtractor\word_extractor.py:382: SyntaxWarning: ungültige Escape-Sequenz „\o“
    use_description = „““ – Beschreibung –
    E:\WordExtractor\word_extractor.py:406: SyntaxWarning: ungültige Escape-Sequenz „\i“
    parser.add_argument('–in_path', erforderlich=False, help='Pfadname der Eingabedatei (ppt, doc, txt) (z. B. .\in) ')
    E:\WordExtractor\word_extractor.py:407: SyntaxWarning: ungültige Escape-Sequenz „\o“
    parser.add_argument('–out_path', erforderlich=True, help='Pfadname der Ausgabedatei (xlsx, png) (z. B. .\out)')
    E:\WordExtractor\word_extractor.py:382: SyntaxWarning: ungültige Escape-Sequenz „\o“
    use_description = „““ – Beschreibung –
    E:\WordExtractor\word_extractor.py:406: SyntaxWarning: ungültige Escape-Sequenz „\i“
    parser.add_argument('–in_path', erforderlich=False, help='Pfadname der Eingabedatei (ppt, doc, txt) (z. B. .\in) ')
    E:\WordExtractor\word_extractor.py:407: SyntaxWarning: ungültige Escape-Sequenz „\o“
    parser.add_argument('–out_path', erforderlich=True, help='Pfadname der Ausgabedatei (xlsx, png) (z. B. .\out)')
    E:\WordExtractor\word_extractor.py:382: SyntaxWarning: ungültige Escape-Sequenz „\o“
    use_description = „““ – Beschreibung –
    E:\WordExtractor\word_extractor.py:406: SyntaxWarning: ungültige Escape-Sequenz „\i“
    parser.add_argument('–in_path', erforderlich=False, help='Pfadname der Eingabedatei (ppt, doc, txt) (z. B. .\in) ')
    E:\WordExtractor\word_extractor.py:407: SyntaxWarning: ungültige Escape-Sequenz „\o“
    parser.add_argument('–out_path', erforderlich=True, help='Pfadname der Ausgabedatei (xlsx, png) (z. B. .\out)')
    E:\WordExtractor\word_extractor.py:382: SyntaxWarning: ungültige Escape-Sequenz „\o“
    use_description = „““ – Beschreibung –
    E:\WordExtractor\word_extractor.py:406: SyntaxWarning: ungültige Escape-Sequenz „\i“
    parser.add_argument('–in_path', erforderlich=False, help='Pfadname der Eingabedatei (ppt, doc, txt) (z. B. .\in) ')
    E:\WordExtractor\word_extractor.py:407: SyntaxWarning: ungültige Escape-Sequenz „\o“
    parser.add_argument('–out_path', erforderlich=True, help='Pfadname der Ausgabedatei (xlsx, png) (z. B. .\out)')
    E:\WordExtractor\word_extractor.py:382: SyntaxWarning: ungültige Escape-Sequenz „\o“
    use_description = „““ – Beschreibung –
    E:\WordExtractor\word_extractor.py:406: SyntaxWarning: ungültige Escape-Sequenz „\i“
    parser.add_argument('–in_path', erforderlich=False, help='Pfadname der Eingabedatei (ppt, doc, txt) (z. B. .\in) ')
    E:\WordExtractor\word_extractor.py:407: SyntaxWarning: ungültige Escape-Sequenz „\o“
    parser.add_argument('–out_path', erforderlich=True, help='Pfadname der Ausgabedatei (xlsx, png) (z. B. .\out)')
    E:\WordExtractor\word_extractor.py:382: SyntaxWarning: ungültige Escape-Sequenz „\o“
    use_description = „““ – Beschreibung –
    E:\WordExtractor\word_extractor.py:406: SyntaxWarning: ungültige Escape-Sequenz „\i“
    parser.add_argument('–in_path', erforderlich=False, help='Pfadname der Eingabedatei (ppt, doc, txt) (z. B. .\in) ')
    E:\WordExtractor\word_extractor.py:407: SyntaxWarning: ungültige Escape-Sequenz „\o“
    parser.add_argument('–out_path', erforderlich=True, help='Pfadname der Ausgabedatei (xlsx, png) (z. B. .\out)')
    E:\WordExtractor\word_extractor.py:382: SyntaxWarning: ungültige Escape-Sequenz „\o“
    use_description = „““ – Beschreibung –
    E:\WordExtractor\word_extractor.py:406: SyntaxWarning: ungültige Escape-Sequenz „\i“
    parser.add_argument('–in_path', erforderlich=False, help='Pfadname der Eingabedatei (ppt, doc, txt) (z. B. .\in) ')
    E:\WordExtractor\word_extractor.py:407: SyntaxWarning: ungültige Escape-Sequenz „\o“
    parser.add_argument('–out_path', erforderlich=True, help='Pfadname der Ausgabedatei (xlsx, png) (z. B. .\out)')
    E:\WordExtractor\word_extractor.py:382: SyntaxWarning: ungültige Escape-Sequenz „\o“
    use_description = „““ – Beschreibung –
    E:\WordExtractor\word_extractor.py:406: SyntaxWarning: ungültige Escape-Sequenz „\i“
    parser.add_argument('–in_path', erforderlich=False, help='Pfadname der Eingabedatei (ppt, doc, txt) (z. B. .\in) ')
    E:\WordExtractor\word_extractor.py:407: SyntaxWarning: ungültige Escape-Sequenz „\o“
    parser.add_argument('–out_path', erforderlich=True, help='Pfadname der Ausgabedatei (xlsx, png) (z. B. .\out)')
    E:\WordExtractor\word_extractor.py:382: SyntaxWarning: ungültige Escape-Sequenz „\o“
    use_description = „““ – Beschreibung –
    E:\WordExtractor\word_extractor.py:406: SyntaxWarning: ungültige Escape-Sequenz „\i“
    parser.add_argument('–in_path', erforderlich=False, help='Pfadname der Eingabedatei (ppt, doc, txt) (z. B. .\in) ')
    E:\WordExtractor\word_extractor.py:407: SyntaxWarning: ungültige Escape-Sequenz „\o“
    parser.add_argument('–out_path', erforderlich=True, help='Pfadname der Ausgabedatei (xlsx, png) (z. B. .\out)')
    E:\WordExtractor\word_extractor.py:382: SyntaxWarning: ungültige Escape-Sequenz „\o“
    use_description = „““ – Beschreibung –
    E:\WordExtractor\word_extractor.py:406: SyntaxWarning: ungültige Escape-Sequenz „\i“
    parser.add_argument('–in_path', erforderlich=False, help='Pfadname der Eingabedatei (ppt, doc, txt) (z. B. .\in) ')
    E:\WordExtractor\word_extractor.py:407: SyntaxWarning: ungültige Escape-Sequenz „\o“
    parser.add_argument('–out_path', erforderlich=True, help='Pfadname der Ausgabedatei (xlsx, png) (z. B. .\out)')
    E:\WordExtractor\word_extractor.py:382: SyntaxWarning: ungültige Escape-Sequenz „\o“
    use_description = „““ – Beschreibung –
    E:\WordExtractor\word_extractor.py:406: SyntaxWarning: ungültige Escape-Sequenz „\i“
    parser.add_argument('–in_path', erforderlich=False, help='Pfadname der Eingabedatei (ppt, doc, txt) (z. B. .\in) ')
    E:\WordExtractor\word_extractor.py:407: SyntaxWarning: ungültige Escape-Sequenz „\o“
    parser.add_argument('–out_path', erforderlich=True, help='Pfadname der Ausgabedatei (xlsx, png) (z. B. .\out)')
    E:\WordExtractor\word_extractor.py:382: SyntaxWarning: ungültige Escape-Sequenz „\o“
    use_description = „““ – Beschreibung –
    E:\WordExtractor\word_extractor.py:406: SyntaxWarning: ungültige Escape-Sequenz „\i“
    parser.add_argument('–in_path', erforderlich=False, help='Pfadname der Eingabedatei (ppt, doc, txt) (z. B. .\in) ')
    E:\WordExtractor\word_extractor.py:407: SyntaxWarning: ungültige Escape-Sequenz „\o“
    parser.add_argument('–out_path', erforderlich=True, help='Pfadname der Ausgabedatei (xlsx, png) (z. B. .\out)')
    E:\WordExtractor\word_extractor.py:382: SyntaxWarning: ungültige Escape-Sequenz „\o“
    use_description = „““ – Beschreibung –
    E:\WordExtractor\word_extractor.py:406: SyntaxWarning: ungültige Escape-Sequenz „\i“
    parser.add_argument('–in_path', erforderlich=False, help='Pfadname der Eingabedatei (ppt, doc, txt) (z. B. .\in) ')
    E:\WordExtractor\word_extractor.py:407: SyntaxWarning: ungültige Escape-Sequenz „\o“
    parser.add_argument('–out_path', erforderlich=True, help='Pfadname der Ausgabedatei (xlsx, png) (z. B. .\out)')
    E:\WordExtractor\word_extractor.py:382: SyntaxWarning: ungültige Escape-Sequenz „\o“
    use_description = „““ – Beschreibung –
    E:\WordExtractor\word_extractor.py:406: SyntaxWarning: ungültige Escape-Sequenz „\i“
    parser.add_argument('–in_path', erforderlich=False, help='Pfadname der Eingabedatei (ppt, doc, txt) (z. B. .\in) ')
    E:\WordExtractor\word_extractor.py:407: SyntaxWarning: ungültige Escape-Sequenz „\o“
    parser.add_argument('–out_path', erforderlich=True, help='Pfadname der Ausgabedatei (xlsx, png) (z. B. .\out)')
    E:\WordExtractor\word_extractor.py:382: SyntaxWarning: ungültige Escape-Sequenz „\o“
    use_description = „““ – Beschreibung –
    E:\WordExtractor\word_extractor.py:406: SyntaxWarning: ungültige Escape-Sequenz „\i“
    parser.add_argument('–in_path', erforderlich=False, help='Pfadname der Eingabedatei (ppt, doc, txt) (z. B. .\in) ')
    E:\WordExtractor\word_extractor.py:407: SyntaxWarning: ungültige Escape-Sequenz „\o“
    parser.add_argument('–out_path', erforderlich=True, help='Pfadname der Ausgabedatei (xlsx, png) (z. B. .\out)')
    E:\WordExtractor\word_extractor.py:382: SyntaxWarning: ungültige Escape-Sequenz „\o“
    use_description = „““ – Beschreibung –
    E:\WordExtractor\word_extractor.py:406: SyntaxWarning: ungültige Escape-Sequenz „\i“
    parser.add_argument('–in_path', erforderlich=False, help='Pfadname der Eingabedatei (ppt, doc, txt) (z. B. .\in) ')
    E:\WordExtractor\word_extractor.py:407: SyntaxWarning: ungültige Escape-Sequenz „\o“
    parser.add_argument('–out_path', erforderlich=True, help='Pfadname der Ausgabedatei (xlsx, png) (z. B. .\out)')
    E:\WordExtractor\word_extractor.py:382: SyntaxWarning: ungültige Escape-Sequenz „\o“
    use_description = „““ – Beschreibung –
    E:\WordExtractor\word_extractor.py:406: SyntaxWarning: ungültige Escape-Sequenz „\i“
    parser.add_argument('–in_path', erforderlich=False, help='Pfadname der Eingabedatei (ppt, doc, txt) (z. B. .\in) ')
    E:\WordExtractor\word_extractor.py:407: SyntaxWarning: ungültige Escape-Sequenz „\o“
    parser.add_argument('–out_path', erforderlich=True, help='Pfadname der Ausgabedatei (xlsx, png) (z. B. .\out)')
    E:\WordExtractor\word_extractor.py:382: SyntaxWarning: ungültige Escape-Sequenz „\o“
    use_description = „““ – Beschreibung –
    E:\WordExtractor\word_extractor.py:406: SyntaxWarning: ungültige Escape-Sequenz „\i“
    parser.add_argument('–in_path', erforderlich=False, help='Pfadname der Eingabedatei (ppt, doc, txt) (z. B. .\in) ')
    E:\WordExtractor\word_extractor.py:407: SyntaxWarning: ungültige Escape-Sequenz „\o“
    parser.add_argument('–out_path', erforderlich=True, help='Pfadname der Ausgabedatei (xlsx, png) (z. B. .\out)')

    get_txt_text: E:\WordExtractor\in\test.txt
    multiprocessing.pool.RemoteTraceback:
    “””
    Traceback (letzter Anruf zuletzt):
    Datei „C:\ProgramData\miniconda3\envs\wordextr\Lib\multiprocessing\pool.py“, Zeile 125, im Worker
    result = (True, func(*args, **kwds))
    ^^^^^^^^^^^^^^^^^^^
    Datei „C:\ProgramData\miniconda3\envs\wordextr\Lib\multiprocessing\pool.py“, Zeile 48, in Mapstar
    Rückgabeliste(map(*args))
    ^^^^^^^^^^^^^^^^
    Datei „E:\WordExtractor\word_extractor.py“, Zeile 367, in get_file_text
    df_text = get_txt_text(file_name)
    ^^^^^^^^^^^^^^^^^^^^^^^
    Datei „E:\WordExtractor\word_extractor.py“, Zeile 238, in get_txt_text
    df_text = df_text.append(sr_text,ignore_index=True)
    ^^^^^^^^^^^^^^
    Datei „C:\ProgramData\miniconda3\envs\wordextr\Lib\site-packages\pandas\core\generic.py“, Zeile 6204, in __getattr__
    return object.__getattribute__(self, name)
    ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
    AttributeError: Das „DataFrame“-Objekt hat kein Attribut „append“. Meinten Sie: '_append'?
    “””

    Die obige Ausnahme war die direkte Ursache für die folgende Ausnahme:

    Traceback (letzter Anruf zuletzt):
    Datei „E:\WordExtractor\word_extractor.py“, Zeile 559, in
    hauptsächlich()
    Datei „E:\WordExtractor\word_extractor.py“, Zeile 460, im Hauptverzeichnis
    mp_text_result = pool.map(get_file_text, file_list)
    ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
    Datei „C:\ProgramData\miniconda3\envs\wordextr\Lib\multiprocessing\pool.py“, Zeile 367, in der Karte
    return self._map_async(func, iterable, mapstar, chunksize).get()
    ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
    Datei „C:\ProgramData\miniconda3\envs\wordextr\Lib\multiprocessing\pool.py“, Zeile 774, in get
    Selbstwert erhöhen
    AttributeError: „DataFrame“-Objekt hat kein Attribut „append“

    (wordextr) E:\WordExtractor>

    • Avatar-Foto Zerom sagt:

      Hallo, schön dich kennen zu lernen.
      Da es sich hierbei um einen Fehler handelt, den ich noch nicht erlebt habe, ist es schwierig, Ihnen sofort zu sagen, wie Sie ihn beheben können.
      Könnten Sie bitte die Python-Version, die Numpy- und die Pandas-Version überprüfen und mir diese mitteilen?
      Ich denke, Sie müssen dies überprüfen, da die Version unterschiedlich ist.

      Als Referenz ist die Version der Umgebung, die ich implementiert und getestet habe, wie folgt.
      – Python: 3.9.6 (So überprüfen Sie: Python-Version)
      – numpy: 1.20.3 (So überprüfen Sie: Pip-Liste) (Sie können Pandas unten auch sofort überprüfen)
      – Pandas: 1.3.1

    • Avatar-Foto 서희경 sagt:

      Ich hatte auch den gleichen Fehler. Ich habe es gemäß den Versionen der von Ihnen freigegebenen Pakete ausgeführt und es war erfolgreich.

  2. Avatar-Foto 서희경 sagt:

    Hallo. Ich habe eine Frage zur Anaconda-Installation. Ich würde innerhalb des Unternehmens gerne ein Wortextraktionstool verwenden, aber da Anaconda kostenpflichtig ist, empfiehlt das Unternehmen die Verwendung von Miniforge. Gibt es einen Unterschied in der Funktionalität, wenn ich nach der Installation von Miniforge das Wortextraktionstool verwende?

    • Avatar-Foto Zerom sagt:

      Ich habe Miniforge nicht verwendet, daher weiß ich nicht, ob es einen funktionalen Unterschied geben wird.
      Der Zweck der Installation von Miniconda bestand darin, auf einfache Weise eine virtuelle Umgebung zu erstellen und zu verwalten, und nicht darin, die Paketinstallation zu erleichtern.

      Versuche dies:
      – Verwenden Sie venv oder virtualenv anstelle von miniconda (siehe: https://richwind.co.kr/193)
      – „2.5. Ändern Sie im Inhalt „Erforderliche Pakete installieren“ „conda install“ in „pip install“.

      Ich hoffe, es geht gut.

      • Avatar-Foto 서희경 sagt:

        Zuerst habe ich Miniforge installiert und den oben genannten Vorgang an der Miniforge-Eingabeaufforderung ausgeführt, aber nichts ist passiert.
        Und das von Ihnen erwähnte „Microsoft Build Tools 2015 Update 3“ ließ sich nicht gut installieren, also habe ich Microsoft Build Tools 2022 installiert und eunjeon erhalten.

        Jetzt werde ich das Extraktionstool ausprobieren und Ihnen Feedback geben 🙂

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert

de_DEDeutsch