Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
Tags
- Series
- statistics
- 사이킷런
- 논문
- reinforcement learning
- 유니티
- Deep Learning
- pandas
- Jacobian Matrix
- unity
- Laplacian
- Hessian Matrix
- neural network
- rl
- convex optimization
- ML-Agent
- David Silver
- optimization
- 강화학습
- 리스트
- machine learning
- 데이터 분석
- 판다스
- Python Programming
- 모두를 위한 RL
- 김성훈 교수님
- Linear algebra
- paper
- 딥러닝
- list
Archives
RL Researcher
02. 판다스(Pandas) - 개수, 빈도 등 계산하기 본문
1. Series size, shape, unique, count, value_counts 함수
-
size : 개수 반환
-
shape : 튜플형태로 shape반환
-
unique: 유일한 값만 ndarray로 반환
-
count : NaN을 제외한 개수를 반환
-
mean: NaN을 제외한 평균
-
value_counts: NaN을 제외하고 각 값들의 빈도를 반환
s = pd.Series([1, 1, 2, 1, 2, 2, 2, 1, 1, 3, 3, 4, 5, 5, 7, np.NaN])
s
========================================================================
<output>
0 1.0
1 1.0
2 2.0
3 1.0
4 2.0
5 2.0
6 2.0
7 1.0
8 1.0
9 3.0
10 3.0
11 4.0
12 5.0
13 5.0
14 7.0
15 NaN
dtype: float64
len(s) # 길이 출력
========================================================================
<output>
16
s.size # size를 계산하여 반환
========================================================================
<output>
16
s.shape # 모양을 출력
========================================================================
<output>
(16,)
s.unique() # 총 값들을 1개씩 뽑아옴
========================================================================
<output>
array([ 1., 2., 3., 4., 5., 7., nan])
s.count() # NaN값을 제외한 개수를 반환
========================================================================
<output>
15
a = np.array([2, 2, 2, 2, np.NaN])
a.mean() # Series가 아닌 그냥 계산한다면 nan값이 나옴
b = pd.Series(a)
b.mean() # NaN값을 제외한 평균 계산
s.mean() # NaN값을 제외한 평균 계산
========================================================================
<output>
nan
2.0
2.6666666666666665
s.value_counts() # NaN을 제외하고 각 값들의 빈도를 반환
========================================================================
<output>
1.0 5
2.0 4
5.0 2
3.0 2
7.0 1
4.0 1
dtype: int64
-
index를 활용하여 multiple한 값에 접근
s[[5, 7, 8, 10]].value_counts()
========================================================================
<output>
1.0 2
3.0 1
2.0 1
dtype: int64
2. head, tail 함수
-
head : 상위 n개 출력 기본 5개
-
tail : 하위 n개 출력 기본 5개
s.head(n=7)
========================================================================
<output>
0 1.0
1 1.0
2 2.0
3 1.0
4 2.0
5 2.0
6 2.0
dtype: float64
s.tail()
========================================================================
<output>
11 4.0
12 5.0
13 5.0
14 7.0
15 NaN
dtype: float64
'AI Basic > Pandas' 카테고리의 다른 글
06. 판다스(Pandas) - DataFrame (0) | 2021.01.04 |
---|---|
05. 판다스(Pandas) - Series 값 변경, Slicing (0) | 2021.01.04 |
04. 판다스(Pandas) - Series boolean selection 활용 (0) | 2021.01.03 |
03.판다스(Pandas) - Series 데이터 연산 (0) | 2021.01.03 |
01. 판다스(Pandas) - Index, value 활용 (0) | 2021.01.03 |
Comments