02. 판다스(Pandas) - 개수, 빈도 등 계산하기

Notice

Recent Posts

Recent Comments

Link

« 2025/01 »
일	월	화	수	목	금	토
			1	2	3	4
5	6	7	8	9	10	11
12	13	14	15	16	17	18
19	20	21	22	23	24	25
26	27	28	29	30	31

Tags more

Archives

관리 메뉴

RL Researcher

02. 판다스(Pandas) - 개수, 빈도 등 계산하기 본문

AI Basic/Pandas

02. 판다스(Pandas) - 개수, 빈도 등 계산하기

Lass_os 2021. 1. 3. 23:16

1. Series size, shape, unique, count, value_counts 함수

size : 개수 반환
shape : 튜플형태로 shape반환
unique: 유일한 값만 ndarray로 반환
count : NaN을 제외한 개수를 반환
mean: NaN을 제외한 평균
value_counts: NaN을 제외하고 각 값들의 빈도를 반환

s = pd.Series([1, 1, 2, 1, 2, 2, 2, 1, 1, 3, 3, 4, 5, 5, 7, np.NaN])
s

========================================================================

<output>
0     1.0
1     1.0
2     2.0
3     1.0
4     2.0
5     2.0
6     2.0
7     1.0
8     1.0
9     3.0
10    3.0
11    4.0
12    5.0
13    5.0
14    7.0
15    NaN
dtype: float64

len(s)	# 길이 출력

========================================================================

<output>
16

s.size	# size를 계산하여 반환

========================================================================

<output>
16


s.shape	# 모양을 출력

========================================================================

<output>
(16,)


s.unique()	# 총 값들을 1개씩 뽑아옴
========================================================================

<output>
array([ 1.,  2.,  3.,  4.,  5.,  7., nan])


s.count()	# NaN값을 제외한 개수를 반환

========================================================================

<output>
15

a = np.array([2, 2, 2, 2, np.NaN])
a.mean()	# Series가 아닌 그냥 계산한다면 nan값이 나옴

b = pd.Series(a)
b.mean()	# NaN값을 제외한 평균 계산

s.mean()	# NaN값을 제외한 평균 계산

========================================================================

<output>
nan
2.0
2.6666666666666665

s.value_counts()	# NaN을 제외하고 각 값들의 빈도를 반환

========================================================================

<output>
1.0    5
2.0    4
5.0    2
3.0    2
7.0    1
4.0    1
dtype: int64

index를 활용하여 multiple한 값에 접근

s[[5, 7, 8, 10]].value_counts()

========================================================================

<output>
1.0    2
3.0    1
2.0    1
dtype: int64

2. head, tail 함수

head : 상위 n개 출력 기본 5개
tail : 하위 n개 출력 기본 5개

s.head(n=7)

========================================================================

<output>
0    1.0
1    1.0
2    2.0
3    1.0
4    2.0
5    2.0
6    2.0
dtype: float64

s.tail()

========================================================================

<output>
11    4.0
12    5.0
13    5.0
14    7.0
15    NaN
dtype: float64

저작자표시 비영리 변경금지

'AI Basic > Pandas' 카테고리의 다른 글

06. 판다스(Pandas) - DataFrame (0)	2021.01.04
05. 판다스(Pandas) - Series 값 변경, Slicing (0)	2021.01.04
04. 판다스(Pandas) - Series boolean selection 활용 (0)	2021.01.03
03.판다스(Pandas) - Series 데이터 연산 (0)	2021.01.03
01. 판다스(Pandas) - Index, value 활용 (0)	2021.01.03

'AI Basic/Pandas' Related Articles

Comments

RL Researcher

02. 판다스(Pandas) - 개수, 빈도 등 계산하기 본문

02. 판다스(Pandas) - 개수, 빈도 등 계산하기

1. Series size, shape, unique, count, value_counts 함수

2. head, tail 함수

'AI Basic > Pandas' 카테고리의 다른 글

티스토리툴바