단어 추출 도구 v0.42 배포: Bug fix
지난 번 배포한 단어 추출 도구 v0.41에 버그가 있었다. KeyError: “Column(s) [‘DBSchema’] do not exist” 오류가 발생하는 버그를 수정한 단어 추출 도구 v0.42 를 배포한다. 관련 글: 단어 추출 도구 v0.41 배포: 단어의 DBSchema 발생 빈도 항목을 추가 김기영님이 다음과...
Meta Thinking, Meta Working
지난 번 배포한 단어 추출 도구 v0.41에 버그가 있었다. KeyError: “Column(s) [‘DBSchema’] do not exist” 오류가 발생하는 버그를 수정한 단어 추출 도구 v0.42 를 배포한다. 관련 글: 단어 추출 도구 v0.41 배포: 단어의 DBSchema 발생 빈도 항목을 추가 김기영님이 다음과...
* 버그를 수정하여 새로 배포한 v0.42도 함께 참조하기 바란다.단어 추출 도구 v0.42 배포: Bug fix – 생산성 Skill (prodskill.com) 기존에 배포한 단어 추출 도구(v0.40)에서 단어의 DBSchema 발생 빈도 항목을 추가하여 추출하도록 기능을 보완하여 배포한다. DBSchema_Freq 항목은 해당 단어의 출처가 몇...
단어 추출 도구에 대한 설명글을 6개로 나누어 작성하고 모두 블로그에 포스팅했다. 단어 추출 도구 설명글 전체 목차 를 별도의 글로 작성하여 올려 둔다. 1. 단어 추출 도구 개요 1.1. 단어 추출 도구를 개발한 이유 1.2. 단어 추출 도구 개념 1.3....
이전 글에 이어 단어 추출 도구 부가 설명 에 대해 살펴본다. 단어 추출 도구(5): 단어 추출 도구 소스코드 설명(2) 5. 단어 추출 도구 부가 설명 5.1. OLE Automation을 사용하는 이유 OLE Aumation은 위키백과에 다음과 같이 정의되어 있다. 마이크로소프트 윈도우 애플리케이션 프로그래밍에서 OLE 자동화(OLE Automation, 나중에는 간단히 자동화로 이름이 변경됨[1][2])는 마이크로소프트가 개발한 프로세스 간 통신(IPC) 매커니즘이다. 컴포넌트 오브젝트 모델(COM)의 하위 집합에 기반을 두며, 스크립트 언어(원래는 비주얼 베이직)를 통해 사용되도록 고안되었으나 지금은 윈도우에서 여러 언어를 통해 사용할 수 있다. 출처: https://ko.wikipedia.org/wiki/OLE_자동화 Python에서는...
이전 글에 이어 Python으로 구현한 단어 추출 도구 소스코드 에 대해 살펴본다. 이전 글에서 이어지는 내용이다. 단어 추출 도구(4): 단어 추출 도구 소스코드 설명(1) 4. 단어 추출 도구 소스코드 4.3. get_file_text 함수 357~365행: 파일 확장자에 따라 적합한 함수를 실행하고 그 결과를 df_text에 담아...
Python으로 구현한 단어 추출 도구 소스코드 에 대해 살펴본다. 이전 글에서 이어지는 내용이다. 단어 추출 도구(3): 단어 추출 도구 실행 방법과 결과 확인 방법 4. 단어 추출 도구 소스코드 4.1. 개요 4.1.1. 소스코드 일러두기 이 단어 추출 도구의 소스코드는 내가...
단어 추출 도구 실행 방법과 결과 확인 방법 에 대해 살펴본다. 이전 글에서 이어지는 내용이다. 단어 추출 도구(2): 단어 추출 도구 실행환경 구성 3. 단어 추출 도구 실행 3.1. 단어 추출 도구 다운로드 단어 추출 도구는 github에 업로드해 두었다. https://github.com/DAToolset/ToolsForDataStandard/tree/main/WordExtractor...
단어 추출 도구는 Python으로 개발된 도구이고, 실행에 앞서 Python과 필요한 package 설치 등의 환경 구성 과정이 필요하다. 단어 추출 도구 실행환경 구성 에 대해 살펴본다. 이전 글에서 이어지는 내용이다. 단어 추출 도구(1): 단어 추출 도구 개요 2. 단어 추출 도구...
데이터 표준화 작업, 특히 표준 단어 후보군 작성에 유용하게 활용할 수 있는 단어 추출 도구 개요 를 살펴본다. 1. 단어 추출 도구 개요 1.1. 단어 추출 도구를 개발한 이유 데이터 표준화 초기 작업 중 가장 어려운 작업은 표준 단어로 등록할...