<DAFIT> 01 자연어 데이터 전처리 연습

DAFIT/901 - 자연어데이터전처리연습

<DAFIT> 01 자연어 데이터 전처리 연습 - 01 특수 기호 제거

양갱맨 2019. 10. 19. 01:53

import re

inputFile = 'Beta01_NLP.txt'
outputFile = 'DF901_01_이름.txt'
p = re.compile('[ ㄱ-ㅣ가-힣A-Za-z]')
f = open(inputFile, mode='r', encoding='euc-kr')
s = f.read()
f.close()
s = p.findall(s)
s = ''.join(s)
print(s)
f = open(outputFile, mode='w', encoding='euc-kr')
f.write(s)
f.close()

나는 정규표현식 처리를 사용해서 특수 문자를 제거했다.

한글 처리 방법을 몰랐었는데 자,모음 'ㄱ-ㅣ' 과 음절 '가-힣' 을 알파벳 대소문자 'A-Z', 'a-z' 와 함께 []를 사용하여 문자클래스로 처리면 된다.

www.dafit.me

다핏

데이터사이언스 커뮤니티

www.dafit.me

저작자표시 비영리 변경금지

'DAFIT > 901 - 자연어데이터전처리연습' 카테고리의 다른 글

<DAFIT> 01 자연어 데이터 전처리 연습 - 03 사전순 배열시키기 (0)	2019.10.19
<DAFIT> 01 자연어 데이터 전처리 연습 - 02 알파벳을 한글로 (0)	2019.10.19

현재글<DAFIT> 01 자연어 데이터 전처리 연습 - 01 특수 기호 제거

파이토치, 다핏, CV, python, 텐서플로우, pyTorch, Reinforcement Learning, 데이터분석, 파이썬, 강화학습, 딥러닝, RL, DAFIT, deeplearning, TensorFlow, 백준, 머신러닝, 가벼운학습지, 알고리즘, OpenCV,

Today :
Yesterday :

일	월	화	수	목	금	토
			1	2	3	4
5	6	7	8	9	10	11
12	13	14	15	16	17	18
19	20	21	22	23	24	25
26	27	28	29	30	31

양갱로그

<DAFIT> 01 자연어 데이터 전처리 연습 - 01 특수 기호 제거

'DAFIT > 901 - 자연어데이터전처리연습' 카테고리의 다른 글

'DAFIT/901 - 자연어데이터전처리연습'의 다른글

티스토리툴바

<DAFIT> 01 자연어 데이터 전처리 연습 - 01 특수 기호 제거

'DAFIT > 901 - 자연어데이터전처리연습' 카테고리의 다른 글

'DAFIT/901 - 자연어데이터전처리연습'의 다른글

관련글

티스토리툴바