https://pandas.pydata.org/docs/reference/api/pandas.Series.str.upper.html
이곳에서 판다스의 함수정보를 알 수 있다.
df.str.replace('a','b') 데이터의 문자열 a를 b로 바꿔준다
- > df.str.replace('$','').astype(float)
#astype(float) 는 df의 type을 모두 float로 바꿔준다. str, int 등으로 바꿀 수도 있다
df.str.upper() 문자열 데이터를 모두 대문자로 바꿔준다
df['Employee Name'].str.upper()
df.str.contains('찾고싶은 문자열') 문자열을 포함하는 데이터를 찾아준다
item_name이라는 column의 데이터가
'Chips and Fresh Tomato Salsa', ' Nantucket Nectar' ...이라고 할 때,
'Chips'를 포함하는 데이터를 찾고싶다면
df3['item_name'].str.contains('Chips',case=False) #case=False는 대소문자 구분없이 찾아준다.
대문자 'N'이 들어간 데이터를 찾고싶다면
df3['item_name'].str.contains('N',na=False) #na=False는 null값인 데이터를 제외하고 찾아준다
df.str.len() 문자열의 길이를 데이터화 한다
df의 Employee Name이라는 열의 데이터가 아래와 같다면
Employee Name
0 CHANEL
1 STEVE
2 MITCH
3 BIRD
df['Employee Name'].str.len()
0 6
1 5
2 5
3 4
Name: Employee Name, dtype: int64
이외에도 사이트를 활용하여 문자열 함수를 사용할 수 있다.
'Python > Python Language' 카테고리의 다른 글
데이터프레임(DataFrame)의 배열 조인(join)과 배열분할(split) (0) | 2024.04.09 |
---|---|
데이터프레임(DataFrame)의 column, index 설정 방법 (0) | 2024.04.09 |
Pandas(판다스) 1차원 2차원 생성과 데이터 정리 (0) | 2024.04.05 |
Python(파이썬) 함수 def 사용하기 (0) | 2024.04.04 |
조건문 (if, elif, else) 작성하기 (0) | 2024.04.04 |