Python/Python Language

Pandas์—์„œ ์ œ๊ณตํ•˜๋Š” ๋ฌธ์ž์—ด(Str) ํ•จ์ˆ˜

567Rabbit 2024. 4. 9. 10:17

https://pandas.pydata.org/docs/reference/api/pandas.Series.str.upper.html

 

pandas.Series.str.upper โ€” pandas 2.2.1 documentation

Converts first character of each word to uppercase and remaining to lowercase.

pandas.pydata.org

 

์ด๊ณณ์—์„œ ํŒ๋‹ค์Šค์˜ ํ•จ์ˆ˜์ •๋ณด๋ฅผ ์•Œ ์ˆ˜ ์žˆ๋‹ค.

 

 

 

 

df.str.replace('a','b')  ๋ฐ์ดํ„ฐ์˜ ๋ฌธ์ž์—ด a๋ฅผ b๋กœ ๋ฐ”๊ฟ”์ค€๋‹ค 

 

 

- > df.str.replace('$','').astype(float)           

 

#astype(float) ๋Š” df์˜ type์„ ๋ชจ๋‘ float๋กœ ๋ฐ”๊ฟ”์ค€๋‹ค. str, int ๋“ฑ์œผ๋กœ ๋ฐ”๊ฟ€ ์ˆ˜๋„ ์žˆ๋‹ค

 

 

 

 

df.str.upper()  ๋ฌธ์ž์—ด ๋ฐ์ดํ„ฐ๋ฅผ ๋ชจ๋‘ ๋Œ€๋ฌธ์ž๋กœ ๋ฐ”๊ฟ”์ค€๋‹ค

 

df['Employee Name'].str.upper()

 

 

 

 

df.str.contains('์ฐพ๊ณ ์‹ถ์€ ๋ฌธ์ž์—ด')      ๋ฌธ์ž์—ด์„ ํฌํ•จํ•˜๋Š” ๋ฐ์ดํ„ฐ๋ฅผ ์ฐพ์•„์ค€๋‹ค

 

item_name์ด๋ผ๋Š” column์˜ ๋ฐ์ดํ„ฐ๊ฐ€

'Chips and Fresh Tomato Salsa', ' Nantucket Nectar' ...์ด๋ผ๊ณ  ํ•  ๋•Œ,

 

 

'Chips'๋ฅผ ํฌํ•จํ•˜๋Š” ๋ฐ์ดํ„ฐ๋ฅผ ์ฐพ๊ณ ์‹ถ๋‹ค๋ฉด

df3['item_name'].str.contains('Chips',case=False)        #case=False๋Š” ๋Œ€์†Œ๋ฌธ์ž ๊ตฌ๋ถ„์—†์ด ์ฐพ์•„์ค€๋‹ค.

 

 

๋Œ€๋ฌธ์ž 'N'์ด ๋“ค์–ด๊ฐ„ ๋ฐ์ดํ„ฐ๋ฅผ ์ฐพ๊ณ ์‹ถ๋‹ค๋ฉด

df3['item_name'].str.contains('N',na=False)         #na=False๋Š” null๊ฐ’์ธ ๋ฐ์ดํ„ฐ๋ฅผ ์ œ์™ธํ•˜๊ณ  ์ฐพ์•„์ค€๋‹ค

 

 

 

 

df.str.len()  ๋ฌธ์ž์—ด์˜ ๊ธธ์ด๋ฅผ ๋ฐ์ดํ„ฐํ™” ํ•œ๋‹ค

 

df์˜ Employee Name์ด๋ผ๋Š” ์—ด์˜ ๋ฐ์ดํ„ฐ๊ฐ€ ์•„๋ž˜์™€ ๊ฐ™๋‹ค๋ฉด

 

         Employee Name

0          CHANEL

1          STEVE

2          MITCH

3          BIRD

 

 

df['Employee Name'].str.len()

python
๋‹ซ๊ธฐ
0 6 1 5 2 5 3 4 Name: Employee Name, dtype: int64
 

 

 

์ด์™ธ์—๋„ ์‚ฌ์ดํŠธ๋ฅผ ํ™œ์šฉํ•˜์—ฌ ๋ฌธ์ž์—ด ํ•จ์ˆ˜๋ฅผ ์‚ฌ์šฉํ•  ์ˆ˜ ์žˆ๋‹ค.