반응형

dataanalysis 3

[데이터 시각화] matplotlib, 그래프 범례 밖으로 넣기, 산점도 색깔 넣기, 그림크기 변경figsize

Pandas에서 내장되어 있는 데이터 시각화 도구 툴을 간단하게 보겠습니다~! 우선 라이브러리 불러오기 import numpy as np import pandas as pd %matplotlib inline %matplotlib 이 부분은 jupyter notebook에서 그래프가 바로 나타나게 하는 코드이다. 주피터 노트북에서만 주로 쓰이니 다른 도구를 쓰고 있다면 해당 코드는 굳이 쓸 필요가 없음. 데이터 시각화 툴인데. 이 중 가장 많이 썼던 건 선 그래프와 산점도, 이상치를 보기 위해서 박스 플럿을 많이 봤었다. 그 외에 히스토그램 또는 막대 그래프도 자주 쓸 것같다. 둘의 차이점은 히스토그램은 연속된 값들을 표현할 때 쓰고, 막대 그래프는 분리된 값들을 표현하는데 쓴다. 이 중에서 잘 쓰고 중요..

Python 2022.04.19

Pandas) 특정 값, 이름이 있는 행 갯수 찾기, 함수 적용하기, lambda 값

이 부분도 정말 정말 많이 쓰는 기능이다. Apply Function 기능인데, 여러 가지 행 중에 만약 시계라는 단어가 들어가 있는 행만 추출한다던가. 등등 다음과 같이 함수를 짜서 true / false 로 리턴을 받아보자. 이런 식으로 표가 있다면 여기에 저 함수를 적용하면 false와 true값을 적용 받을 수 있다. 따라서 시계가 있는 행이 총 몇 개인지 확인하고 싶다면 sum(df['col4'].apply(findClock)) 이런 식으로 해당하는 행 갯수를 찾아낼 수 있다. true는 1, false 0인 3개, 결과값으로는 1이 이 조건에 해당 한다. 또한 해당 조건에 해당하는 행만 추출하고 싶다면 다음과 같이 .loc[조건]을 넣으면 해당 값이 반환된다. 해당 조건을 제외한 나머지 행을 ..

Python 2022.04.17
반응형