Streamlit

Kim Won

1/25/23

목차

  • 왜 이 업무를 하게 됐는지
  • 시각화와 대시보드?
  • 스트림릿 샤이니의 차이
  • 스트림릿 개발 과정

왜 이 업무를 하게 됐는가

데이터 직군 로드맵

dashboard

KPI를 검토할 수 있는 직관적인

  • 반응형 -> 그룹, 직업별 , 성별, 연령별
  • 시각화 모음

Visualization..?

= 단순히 자료를 보여주면 끝?

Visualization



정답은 없지만

의사결정에 도움이 돼야!!

무분별한 파이차트 이제 그만

스트림릿 vs shiny

공통점

장점

  1. 프론트엔드 개발자가 필요없다.
  2. 백엔드 개발자가 필요없다. 데이터를 올려놓고 작업할 수 있다.
  3. 빠르게 개발할 수 있다.

단점

  • 웹사이트를 이대로 퍼블리싱하기엔 디테일한 부분을 손볼 수 없고, 결국 HTML CSS 를 뜯어서 원하는 디자인을 구현해야하기 때문에 바로 제품으로 사용하기엔 좀 어렵다!


  • 반례 : 본담

개발 난이도

https://shiny.rstudio.com/gallery/

천하제일 샤이니 대회


샤이니로 할 수 있는것이 참 많다!

통계학의 근본 프로그래밍은 R

  • R 기반으로 작동하는 웹앱을 만들어주는 패키지


회귀분석, 가설검정의 근본 -> R패키지

  • (주관적인 저의 생각) 샤이니도 배우긴 쉬운데.. 근소한 차이로 스트림릿이 더 쉽다!

비슷비슷한데..

결국 샤이니와 스트림릿 모두 데이터를 보여주는 껍데기다!

따라서 파이썬에서 데이터를 다루는 것이 익숙하면 스트림릿으로, R에서 주로 데이터를 다루면 샤이니로

파이썬이라는 언어 자체가 개발 난이도가 더 낮다고 생각합니다!

streamlit skeleton code

import streamlit as st
import pandas as pd 

st.write("""# My First app 
             Hello *world!*""')

df= pd.read_csv("My_data.csv")
st.line_chart(df)

왜 스트림릿을 썼는가?

개발 난이도

생태계

심미성

왜 스트림릿을 썼는가?

생태계

파이썬의 생태계

  • DL/ML library
  • Plotly

개발 과정

설문 데이터


전공의 2000여명의 80가지 설문에 대한 응답내용이 담긴 csv


남자인데 생리휴가 사용

폭력을 당하지 않았다고 응답했는데, 당한사람을 기록 등

-> 논리적 오류를 가진 데이터 전처리

(예,아니오), (Yes,No) 등 일원화

전처리 과정

찐막

찐찐막

찐 최종0118.csv

final 0118-2.csv


교 훈!

버전관리의 중요성

Github를 무조건 사용하자!

큰 틀 짜기

창우님이 작성한 큰 틀의 코드 안에서 세부적으로 모듈을 구현하거나,

케이스를 나눠서 나와야 할 게 잘 나오게 하는 업무를 진행했습니다

선택 : 없음

선택: 연차

문항에 맞게 시각화 하기

만족도-> horizontal bar graph로 표현하였습니다

유지보수 (~ing)

mean 글씨가 거슬리네요 ..

넵!!

언론에 보도된 대시보드

전공의들, 하루 평균 4시간 자면서 주 78시간 일해 <청년의사>

http://www.docdocdoc.co.kr/news/articleView.html?idxno=3001999

감사합니다