티스토리 뷰

반응형

 

개발사항

  • 사용자로부터 파일명을 입력 받는다. (입력이 없으면 default 'mbox-short.txt')
  • 파일을 읽어 이메일 주소만 추출한다.
  • 추출한 이메일 주소와 빈도수를 체크하여 DATABASE 에 저장한다.
  • 상위 10개의 이메일과 빈도수를 출력한다.

 

import sqlite3

conn = sqlite3.connect('emaildb.sqlite')
cur = conn.cursor()

cur.execute('DROP TABLE IF EXISTS COUNTS')

cur.execute('CREATE TABLE COUNTS (EMAIL TEXT, COUNT INTEGER)')

fname = input('ENTER FILE NAME : ')
if (len(fname) < 1) :
    fname = 'mbox-short.txt'

fh = open(fname)

for line in fh :
    if not line.startswith('From: ') :
        continue
    pieces = line.split()
    email = pieces[1]
    cur.execute('SELECT COUNT FROM COUNTS WHERE EMAIL = ?', (email,))
    row = cur.fetchone()
    if row is None :
        cur.execute('INSERT INTO COUNTS (email, count) VALUES(?, 1)', (email,))
    else :
        cur.execute('UPDATE COUNTS SET COUNT = COUNT + 1 WHERE email = ?', (email,))
    conn.commit()

sqlstr = 'SELECT EMAIL, COUNT FROM COUNTS ORDER BY COUNT DESC LIMIT 10'

for row in cur.execute(sqlstr) :
    print(str(row[0]), row[1])

cur.close()

 

프로그램 수행결과

 

 

END

반응형

'IT > Python' 카테고리의 다른 글

[Python] BeautifulSoup  (0) 2020.12.01
[Python] pip를 이용한 패키지 설치 및 업그레이드  (0) 2020.11.16
[Python] urllib  (0) 2020.11.14
[Python] 소켓  (0) 2020.11.14
[Python] 정규식을 활용하는 다양한 방법  (0) 2020.11.14
댓글
공지사항