
find 메소드와 슬라이싱을 통해 이메일 호스트를 추출할 수 있다. data = 'From stephen.marquard@uct.ac.za Sat Jan 5:09:14:16 2020' # 문자열에서 @ 이 위치한 포지션을 구한다. atpos = data.find('@') print(atpos) # @ 이 위치한 곳 부터 처음 발견된 공백의 포지션을 구한다. sppos = data.find(' ', atpos) print(sppos) # @ 다음문자부터 공백까지의 문자열 (이메일 호스트) 을 슬라이싱한다. host = data[atpos+1 : sppos] print(host) split 메소드를 활용한 방법도 있다. 공백 문자를 기준으로 문자열을 나누고, 다시 @ 을 기준으로 문자열을 나눈다. line ..

패턴 추출하기 import re x = 'My 2 Favorite numbers are 19 and 42' # x 문자열에서 0부터 9까지의 문자 중 하나, # 즉 정수가 하나 이상 반복되는 단어를 리스트로 반환 y = re.findall('[0-9]+', x) print(y) # 'A', 'E', 'I', 'O', 'U' 로 이루어진 패턴을 찾아 출력 # x 문자열에는 해당되는 패턴이 없으므로 빈 리스트를 반환 # 정규표현식에서는 대, 소문자 구분함 y = re.findall('[AEIOU]+', x) print(y) 탐욕적 방식의 패턴 찾기 만약 아래의 문장에서 '^F.+:' 패턴을 찾게 되면, x = 'From: Using the : character' - From: - From: Using the..

개발사항 파일명은 사용자로부터 입력 받는다. 사용자 입력값이 없으면 기본 파일(clown.txt) 를 오픈한다. 딕셔너리를 이용하여 오픈한 파일에 존재하는 단어와 단어 각각의 빈도수를 저장한다. 튜플을 활용하여 딕셔너리의 빈도수가 높은 key, value 를 내림차순으로 정렬한다. # 파일명을 사용자로부터 입력받는다. # 입력값이 없다면 기본파일(clown.txt) 를 오픈한다. fname = input("Enter File : ") if len(fname) < 1 : fname = "clown.txt" hand = open(fname) di = dict() for lin in hand : lin = lin.strip() wds = lin.split() # 각 단어를 key 로 갖는 딕셔너리를 생성한다...

개발사항 파일명은 사용자로부터 입력 받는다. 사용자 입력값이 없으면 기본 파일(clown.txt) 를 오픈한다. 딕셔너리를 이용하여 오픈한 파일에 존재하는 단어와 단어 각각의 빈도수를 저장한다. 가장 빈도수가 높은 단어와 빈도수를 출력한다. # 파일명을 사용자로부터 입력받는다 # 입력값이 없다면 기본파일(clown.txt)을 오픈한다. fname = input("Enter file name : ") if len(fname) < 1 : fname = "clown.txt" hand = open(fname) di = dict() for line in hand : line = line.rstrip() wds = line.split() # 각 단어를 key 로 갖는 딕셔너리를 생성한다. # 딕셔너리에 단어(key..