<DAFIT> 01 자연어 데이터 전처리 연습

DAFIT/901 - 자연어데이터전처리연습

<DAFIT> 01 자연어 데이터 전처리 연습 - 02 알파벳을 한글로

양갱맨 2019. 10. 19. 02:02

import pandas as pd

soundPath = 'drive/My Drive/다핏문제/02/NLP02_Sound.xlsx'
data = pd.read_excel(soundPath)
f = open('drive/My Drive/다핏문제/01/Beta01_NLP.txt', mode='r', encoding='euc-kr')

s = f.read()
buf = ''

for s in s:
    s = s.upper()
    if s in data:
        s = s.replace(s, data[s][0])
    buf += s
f = open('drive/My Drive/다핏문제/02/DF901_02_이름.txt', mode='w', encoding='euc-kr')
f.write(buf)
f.close()

한영 대치표가 xlsx 파일이 주어졌기 때문에 Pandas 라이브러리를 사용했다.

대소문자 구분을 하지 않고 한글로 모두 변환해야했기 때문에 txt 파일을 읽으면서 upper()처리를 해줬다.

읽은 내용 중에 pandas로 읽은 xlsx 내용에 해당되면 replace한다.

www.dafit.me

불러오는 중입니다...

저작자표시 비영리 변경금지 (새창열림)

'DAFIT > 901 - 자연어데이터전처리연습' 카테고리의 다른 글

<DAFIT> 01 자연어 데이터 전처리 연습 - 03 사전순 배열시키기 (0)	2019.10.19
<DAFIT> 01 자연어 데이터 전처리 연습 - 01 특수 기호 제거 (0)	2019.10.19

현재글<DAFIT> 01 자연어 데이터 전처리 연습 - 02 알파벳을 한글로

Reinforcement Learning, 백준, 파이토치, python, TensorFlow, 머신러닝, DAFIT, 가벼운학습지, RL, 알고리즘, 딥러닝, OpenCV, 파이썬, deeplearning, 다핏, 텐서플로우, 데이터분석, CV, 강화학습, pyTorch,

Today :
Yesterday :

일	월	화	수	목	금	토
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30

양갱로그

<DAFIT> 01 자연어 데이터 전처리 연습 - 02 알파벳을 한글로

'DAFIT > 901 - 자연어데이터전처리연습' 카테고리의 다른 글

'DAFIT/901 - 자연어데이터전처리연습'의 다른글

티스토리툴바

<DAFIT> 01 자연어 데이터 전처리 연습 - 02 알파벳을 한글로

'DAFIT > 901 - 자연어데이터전처리연습' 카테고리의 다른 글

'DAFIT/901 - 자연어데이터전처리연습'의 다른글

관련글

티스토리툴바