Python/Python Language

Pandas에서 제공하는 문자열(Str) 함수

567Rabbit 2024. 4. 9. 10:17

https://pandas.pydata.org/docs/reference/api/pandas.Series.str.upper.html

 

pandas.Series.str.upper — pandas 2.2.1 documentation

Converts first character of each word to uppercase and remaining to lowercase.

pandas.pydata.org

 

이곳에서 판다스의 함수정보를 알 수 있다.

 

 

 

 

df.str.replace('a','b')  데이터의 문자열 a를 b로 바꿔준다 

 

 

- > df.str.replace('$','').astype(float)           

 

#astype(float) 는 df의 type을 모두 float로 바꿔준다. str, int 등으로 바꿀 수도 있다

 

 

 

 

df.str.upper()  문자열 데이터를 모두 대문자로 바꿔준다

 

df['Employee Name'].str.upper()

 

 

 

 

df.str.contains('찾고싶은 문자열')      문자열을 포함하는 데이터를 찾아준다

 

item_name이라는 column의 데이터가

'Chips and Fresh Tomato Salsa', ' Nantucket Nectar' ...이라고 할 때,

 

 

'Chips'를 포함하는 데이터를 찾고싶다면

df3['item_name'].str.contains('Chips',case=False)        #case=False는 대소문자 구분없이 찾아준다.

 

 

대문자 'N'이 들어간 데이터를 찾고싶다면

df3['item_name'].str.contains('N',na=False)         #na=False는 null값인 데이터를 제외하고 찾아준다

 

 

 

 

df.str.len()  문자열의 길이를 데이터화 한다

 

df의 Employee Name이라는 열의 데이터가 아래와 같다면

 

         Employee Name

0          CHANEL

1          STEVE

2          MITCH

3          BIRD

 

 

df['Employee Name'].str.len()

0    6
1    5
2    5
3    4
Name: Employee Name, dtype: int64
 

 

 

이외에도 사이트를 활용하여 문자열 함수를 사용할 수 있다.