2023.02.25 – (1.Python) – (Python 학습) Python 데이터 분석 도구 Anaconda Jupyter Notebook 설치 및 사용

안녕하세요, 벌써 수요일입니다.
아니 벌써 날이 밝으니 벌써 목요일!
오늘은 파이썬 데이터 시각화 패키지 seaborn에 대해 알아볼까요?
1. 씨본패키지가 무엇인가요?
통계를 시각화하고 멋진 그래프를 그릴 수 있도록 지원하는 패키지입니다.
데이터 시각화는 전체적인 데이터를 볼 때 분석을 어디에 집중해야 하는지에 대한 아이디어를 주기 때문에 중요하다고 생각합니다!
왜 씨본이라고 하는지 너무 궁금하네요 앞으로 좋은 기능 있으면 바비패키지로 만들어보겠습니다.
2. 씨본 패키지 이용방법
1) 패키지 로드
Seaborn 패키지는 Anaconda를 설치할 때 이미 설치되어 있으므로 로드하기만 하면 됩니다!
Anaconda 설치 방법에 대한 지침은 아래 링크를 참조하십시오!
2023.02.25 – (1.Python) – (Python 학습) Python 데이터 분석 도구 Anaconda Jupyter Notebook 설치 및 사용
(Python 학습) Python 데이터 분석 도구인 Anaconda Jupyter Notebook 설치 및 사용
안녕하세요 오늘은 금요일입니다.
금요일이지만 신입생 생활을 위해 오늘은 파이썬을 배우려고 합니다.
Python은 프로그래밍, 작업 자동화 및 데이터 분석에 사용됩니다.
bobby1001.
수입 해성 ~처럼 소셜 네트워크
씨본패키지는 보통 sns로 줄임말로 표현하는데 개그가 들어가있는듯
3. 패키지 내장 함수
1) 내부 데이터셋 목록 보기
소셜 네트워크.get_dataset_names()
sns 패키지에는 데이터 분석 연습이나 예제에 사용할 수 있는 데이터 세트가 있습니다.
데이터 분석에 필요한 seaborn 패키지와 pandas/numpy 패키지를 import한 후 아래와 같은 코드를 출력하면 다양한 데이터셋이 나오게 되는데 오늘은 조금은 익숙한 타이타닉 데이터셋과 패키지 기능을 사용해 보도록 하겠습니다!
2) 내장 데이터 불러오기
소셜 네트워크.load_dataset(‘거대한’)
Titanic 데이터를 로드하고 df(DataFrame의 약자)라는 변수에 저장하여 데이터 구조를 살펴보겠습니다.
데이터 출력에는 15개의 열과 891개의 행이 포함됩니다.
891명에 대한 15개의 정보가 있음을 알 수 있다.
+ 이렇게도 좋지만 한눈에 알아보기 쉬운 head(), tail() 함수도 사용할 수 있습니다.
참조 소재. 머리() # 처음 5줄 출력 / 소재. 꼬리() # 뒤에 5줄 출력
다음으로 seaborn 패키지의 데이터 시각화 기능을 살펴보겠습니다!
3) 바 차트
소셜 네트워크.카운트 차트( x= ‘열 이름(카테고리)’ , 데이터 = df )
이 플롯은 범주형 데이터의 수량을 단순 비교하는 데 사용됩니다.
class라는 컬럼에 범주형 데이터를 비교하는 코드를 작성하여 확인했습니다.

단순 분석 결과 3등석이 가장 많고 1등석과 2등석이 그 뒤를 잇고 있습니다.
4) 산점도
소셜 네트워크.산포도 ( x = ‘열명(번호)’ , y = ‘열명(번호)’ , data = df )
산점도는 숫자 데이터 간의 상관 관계를 시각화하는 차트입니다.

들어가서 나이 란과 운임 란을 확인했는데 모두 타이타닉 데이터의 수치 데이터입니다!
연령별 요금차이가 없음을 알 수 있다.
(물론, 물론,)
5) 박스플롯
소셜 네트워크.박스 플롯 ( x = ‘컬럼 이름(카테고리)’ , y = ‘컬럼 이름(숫자)’, data = df )
상자 그림은 여러 그룹(범주)의 데이터 분포를 조사하는 데 도움이 되는 일종의 차트입니다.

x축에 성별, y축에 나이가 있는 상자 그림을 그리면 위의 이미지가 나타납니다.
그래프를 분석해보면 데이터 분포가 비슷하다는 것을 설명할 수 있습니다!
박스플롯의 구성요소는 위의 그림을 참고해주세요
6) 히스토그램
소셜 네트워크.히스토그램 ( x = ‘열명(숫자)’ , data = df ) # 수평 표시를 위해 x 대신 y 사용
히스토그램은 한국어로 된 빈도 분포표로, 단순히 (i) 데이터를 특정 섹션으로 나누고 (ii) 각 섹션의 데이터 양을 막대 그래프로 표시하는 것을 의미합니다.
나이 변수에 대한 빈도 분포표를 찾기 위해 다음 코드를 작성했습니다.
그래프를 세로로 보고 싶으면 컬럼 이름을 x(위 코드)에, 그래프를 가로로 보고 싶으면 컬럼 이름을 y(아래 코드)에 넣으세요


4. 끝
오늘은 데이터 시각화 도구인 seaborn 패키지의 몇 가지 기능에 대해 살펴보았습니다.
그림으로 표현되어 있어서 데이터가 어떻게 구성되어 있는지 이해하기 쉽고 귀여워서 즐거운 시간입니다.
seaborn 패키지에는 다양한 다른 그래프가 있으며 “seaborn 치트 시트”를 Google에 검색하면 모두 나타납니다.
이 글을 쓰고 있는 지금은 벌써 새벽 두시, 잠자리에 들 시간이다.
오늘도 제 긴 글 읽어주셔서 감사합니다!
