개발사항 사용자로부터 파일명을 입력 받는다. (입력이 없으면 default 'mbox-short.txt') 파일을 읽어 이메일 주소만 추출한다. 추출한 이메일 주소와 빈도수를 체크하여 DATABASE 에 저장한다. 상위 10개의 이메일과 빈도수를 출력한다. import sqlite3 conn = sqlite3.connect('emaildb.sqlite') cur = conn.cursor() cur.execute('DROP TABLE IF EXISTS COUNTS') cur.execute('CREATE TABLE COUNTS (EMAIL TEXT, COUNT INTEGER)') fname = input('ENTER FILE NAME : ') if (len(fname) < 1) : fname = 'mbox-..
개발사항 사용자로부터 URL 을 입력 받는다. 입력받은 URL 의 a 태그 속성을 모두 출력한다. import urllib.request, urllib.parse, urllib.error from bs4 import BeautifulSoup import ssl ctx = ssl.create_default_context() ctx.check_hostname = False ctx.verify_mode = ssl.CERT_NONE url = input('Enter - ') html = urllib.request.urlopen(url, context=ctx).read() soup = BeautifulSoup(html, 'html.parser') tags = soup('a') for tag in tags : pr..
pip 패키지 설치 pip install [package_name] pip 패키지 업그레이드 pip install --upgrade [package_name] pip 패키지 설치 - 특정버전으로 업그레이드 pip install --upgrade [package_name]==[package_version] ex) pip install --upgrade pandas==1.1.2 pip 패키지 전체 업데이트 설치된 패키지 전체 목록을 리다이렉트하여 파일로 만든다. pip freeze > pip_upgrade_temp.txt 파일을 오픈하여 == 를 >= 로 수정한다. numpy==1.19.1 pandas==1.1.2 Pillow==7.2.0 를 아래와 같이 수정하고 저장한다. numpy>=1.19.1 pand..
개발사항 http://data.pr4e.org/romeo.txt 파일울 오픈한다. 파일을 읽어 단어와 해당 단어가 몇 번이나 있는지 카운트하여 화면에 출력한다. import urllib.request, urllib.parse, urllib.error fhead = urllib.request.urlopen('http://data.pr4e.org/romeo.txt') counts = dict() for line in fhead : words = line.decode().split() for word in words : counts[word] = counts.get(word, 0) + 1 print(counts) END