티스토리 뷰
반응형
개발사항
- 사용자로부터 파일명을 입력 받는다. (입력이 없으면 default 'mbox-short.txt')
- 파일을 읽어 이메일 주소만 추출한다.
- 추출한 이메일 주소와 빈도수를 체크하여 DATABASE 에 저장한다.
- 상위 10개의 이메일과 빈도수를 출력한다.
import sqlite3
conn = sqlite3.connect('emaildb.sqlite')
cur = conn.cursor()
cur.execute('DROP TABLE IF EXISTS COUNTS')
cur.execute('CREATE TABLE COUNTS (EMAIL TEXT, COUNT INTEGER)')
fname = input('ENTER FILE NAME : ')
if (len(fname) < 1) :
fname = 'mbox-short.txt'
fh = open(fname)
for line in fh :
if not line.startswith('From: ') :
continue
pieces = line.split()
email = pieces[1]
cur.execute('SELECT COUNT FROM COUNTS WHERE EMAIL = ?', (email,))
row = cur.fetchone()
if row is None :
cur.execute('INSERT INTO COUNTS (email, count) VALUES(?, 1)', (email,))
else :
cur.execute('UPDATE COUNTS SET COUNT = COUNT + 1 WHERE email = ?', (email,))
conn.commit()
sqlstr = 'SELECT EMAIL, COUNT FROM COUNTS ORDER BY COUNT DESC LIMIT 10'
for row in cur.execute(sqlstr) :
print(str(row[0]), row[1])
cur.close()
END
반응형
'IT > Python' 카테고리의 다른 글
[Python] BeautifulSoup (0) | 2020.12.01 |
---|---|
[Python] pip를 이용한 패키지 설치 및 업그레이드 (0) | 2020.11.16 |
[Python] urllib (0) | 2020.11.14 |
[Python] 소켓 (0) | 2020.11.14 |
[Python] 정규식을 활용하는 다양한 방법 (0) | 2020.11.14 |
댓글
공지사항