Python - Jupyter & Selenium
이 페이지는 다음에 대한 공부 기록입니다
JAVA(자바), Python(파이썬) 기반의
AI 활용 응용 소프트웨어 개발자 양성 과정
2021.11.10. ~ 2022.05.18.
찾으시는 정보가 있으시다면
주제별reference를 이용하시거나
우측 상단에 있는 검색기능을 이용해주세요
87일차 수업
retina
# retina 해상도 올려주는 옵션
from matplotlib_inline.backend_inline import set_matplotlib_formats
set_matplotlib_formats('retina')
참고 사이트
seaborn : https://seaborn.pydata.org/index.html
matplot : https://matplotlib.org/stable/index.html
color_palette
sns.palplot(sns.color_palette('deep',10))
sns.palplot(sns.color_palette('colorblind',10))
sns.palplot(sns.color_palette('coolwarm',10))
sns.palplot(sns.color_palette('BuGn_r',10))
신뢰구간
barplot : 데이터들의 중앙값을 찾아서 신뢰구간을 만드는 표, 인자 ci를 통해 지정가능
ci : 신뢰구간, 믿을 수 있는 범위, 이 범위에는 내가 원하는 값이 다 들어있다
ci 신뢰값을 통해서 막대가 길어질수록 데이터가 불규칙하다라는 의미
-
ci = 80 : 내가 가진 값 중에 80프로가 들어가는 범위
-
ci = ‘sd’ : 표준편차 > 내가 가진 값의 범위
기본 설정 복습
%matplotlib inline
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
# 출력컬럼 50개
pd.options.display.max_columns = 50 # pd 열을 50개 보겠다
# 한글폰트
from matplotlib import rc
rc('font', family='Malgun Gothic')
rc('axes', unicode_minus=False)
# 해상도
%config InlineBackend.figure_format = 'retina'
fmri = sns.load_dataset('fmri')
fig, (ax1, ax2) = plt.subplots(ncols=2, nrows=1)
fig.set_size_inches([14,3])
# 신뢰구간을 표시하는 방법: band 속성
# err_style 옵션을 통해서 신뢰구간을 표시하는 방법을 변경
sns.lineplot(data=fmri, x='timepoint', y='signal', hue='event', ax=ax1, err_style='band')
sns.lineplot(data=fmri, x='timepoint', y='signal', hue='event', ax=ax2, err_style='bars')
# hue : 색상을 통해, size : 크기를 통해 데이터 구분
plt.figure(figsize=[18, 18])
sns.scatterplot(x="식전혈당(공복혈당)", y="수축기혈압",
hue="허리둘레", size="총콜레스테롤", sizes=(30, 550),
data=data[data['식전혈당(공복혈당)'] < 150]);
Selenium
# ipynb형식의 파일을 인식해서 import하기 위한 모듈
import import_ipynb
# import_ipynb를 import하고 나면 모듈 인식 가능, 확장자 명은 생략
import Ex05_func as danawa
import pandas as pd
from selenium import webdriver
from selenium.webdriver.chrome.service import Service
from webdriver_manager.chrome import ChromeDriverManager
import time
from bs4 import BeautifulSoup
# 반복문을 실행할 때 진행상황을 보여주는 모듈
from tqdm.notebook import tqdm
def set_chrome_driver():
chrome_options = webdriver.ChromeOptions()
driver = webdriver.Chrome(service=Service(ChromeDriverManager().install()), options=chrome_options)
return driver
driver = set_chrome_driver()
for page in tqdm(range(1,total_page+1)):
~~~
import_ipynb
pip로 설치
- pip install import_ipynb
import_ipynb 설치 후에도 모듈 인식이 안될경우
jupyter이 사용하는 python 경로와 컴퓨터가 사용하는 python 경로가 일치하는지 확인
-
sys.executable로 확인 가능함, 각각 jupyter notebook과 cmd에서 실행 후 비교
-
다른 경우 cmd에 ‘python3 -m ipykernel install –user’ 을 입력해 jupyter에서 사용하는 python을 변경해준다