학습목표

  1. pandas Series 데이터 생성하기
In [2]:
import numpy as np
import pandas as pd
In [2]:
!conda list pandas# conda 위에서만 실행 됨
# packages in environment at C:\Users\june3\anaconda3:
#
# Name                    Version                   Build  Channel
pandas                    1.0.5            py38h47e9c7a_0  

Series

  • pandas의 기본 객체 중 하나
  • numpy의 ndarray를 기반으로 인덱싱을 기능을 추가하여 1차원 배열을 나타냄
  • index를 지정하지 않을 시, 기본적으로 ndarray와 같이 0-based 인덱스 생성, 지정할 경우 명시적으로 지정된 index를 사용
  • 같은 타입의 0개 이상의 데이터를 가질 수 있음
  • data로만 생성하기
    • index는 기본적으로 0부터 자동적으로 생성
In [3]:
s1 =pd.Series([1, 2, 3])
s1
Out[3]:
0    1
1    2
2    3
dtype: int64
In [6]:
s2 = pd.Series(['a', 'b', 'c'])
s2
Out[6]:
0    a
1    b
2    c
dtype: object
In [13]:
s3 = pd.Series(np.arange(200))
s3
Out[13]:
0        0
1        1
2        2
3        3
4        4
      ... 
195    195
196    196
197    197
198    198
199    199
Length: 200, dtype: int32
  • data, index함께 명시하기
In [10]:
s4 = pd.Series([1, 2, 3], [100, 200, 300])
s4
Out[10]:
100    1
200    2
300    3
dtype: int64
In [14]:
s5 = pd.Series([1, 2, 3], ['a', 'm', 'k'])
s5
Out[14]:
a    1
m    2
k    3
dtype: int64
  • data, index, data type 함께 명시하기
In [19]:
s6 = pd.Series(np.arange(5), np.arange(100, 105), dtype=np.int8)
s6
Out[19]:
100    0
101    1
102    2
103    3
104    4
dtype: int8

인덱스 활용하기

In [21]:
s6.index
Out[21]:
Int64Index([100, 101, 102, 103, 104], dtype='int64')
In [22]:
s6.values
Out[22]:
array([0, 1, 2, 3, 4], dtype=int8)
  1. 인덱스를 통한 데이터 접근
In [25]:
s6[101]
Out[25]:
1
In [27]:
s6[103]
Out[27]:
3
  1. 인덱스를 통한 데이터 업데이트
In [28]:
s6[103] = 90
In [29]:
s6
Out[29]:
100     0
101     1
102     2
103    90
104     4
dtype: int8
  1. 인덱스 재사용하기
In [32]:
s7 = pd.Series(np.arange(5), s6.index)
s7
Out[32]:
100    0
101    1
102    2
103    3
104    4
dtype: int32
In [ ]: