Python/Python Language 18

Numpy(넘파이) 난수(Random)와 분포도

from numpy import randomimport numpy as npimport matplotlib.pyplot as pltimport seaborn as sns   Random Numbers in NumPy (넘파이 난수) - 무작위란 물리적으로 논리적으로 예측할 수 없는 수 - 난수를 생성하는 알고리즘 - 생성 알고리즘을 통해 생성된 난수  randint()- 정수로 난수 생성- 간편하게 로또번호 생성lt = random.randint(46, size=(5))print(lt)    rand() 무작위 플롯 생성(Random Float) 0과 1사이의 부동소수점 생성 Float = random.rand() print(Float)      Data Distribution [데이터 배포] - 가능한..

NumPy 대규모 데이터 배열에 효율적인 UFUNC 함수 개념

import numpy as np  NumPy ufunc는 브로드캐스팅을 지원하여 서로 다른 크기의 배열 간에도 연산을 수행할 수 있다. ufunc를 사용하면 대규모 데이터 배열을 효율적으로 처리할 수 있다.  소수점 반올림하기Truncation 잘림 소수점을 제거하고 0에 가장 가까운 부동소수점 숫자를 리턴 trunc와 fix사용 Rounding : 반올림 앞의 숫자 또는 소수점을 1씩 증가Floor : 가장 가까운 낮은 정수로 내림 예를들어서 3.16666 -> 3.0Ceil : 가장 가까운 상위 정수로 올림 예를들어서 3.16666 -> 4.0 Logs 2진수 10진수에서 로그를 수행하는 기능을 제공합니다 로그를 계산할 수 없는 경우 요소에 -inf(무한대) 또는 inf(무한대)를 배치합니다 log..

Numpy 배열(Array)에 대한 개념 설명

NumPy [Numerical Python]- 배열 작업에 사용되는 Python라이브러리 이다 - 선형 대수학, 푸리에 변환 및 행렬 영역에서 작업하기 위한 기능도 있다 - 숫자 파이썬을 의미한다 - List는 처리 속도가 느려서 최대 50배 빠른 배열 객채를 제공하는 것을 목표로 한다 설치 pip install numpyimport numpy as np     #별칭 np   슬라이싱 인덱스요소를 가져오는것을 의미한다. 라스트인덱스 미포함 Arr = np.array([1,2,3,4,5,6,7]) print(Arr[1:5])  Numpy의 데이터 유형i - 정수 b - 부울 u - 부호 없는 정수 c - float m - timedelta M - datetime O - object S - string U..

람다(Lambda) : 익명 함수 개념 설명

Lambda 인수를 여러개 사용할 수 있지만 표현식을 하나만 가질 수 있는 익명 함수 람다함수를 사용하는 이유다른 함수 내에서 익명함수를 사용할때 더 잘 드러난다 #1) q = lambda a: a + 10 print(q(5)) #=> 15  #2) 인수 a,b를 요약하고 결과를 리턴 x = lambda m, n, b : m + n + b print(x(5,6,3))  #3) 동일한 함수를 정의하여 동일한 프로그래밍에서 두기능을 만듭니다 함수를 만들고 변수 두개를 설정하여 값을 리턴def cuc(n):     return lambda z : z * n mydoubler = cuc(2) mytripler = cuc(3)  print(mydoubler(11)) print(mytripler(11))

정규식 함수 (Python RegEx)

Python RegEx [정규식] - 검색 패턴을 형성하는 일련의 문자 - 문자열에 지정된 검색 패턴이 포함되어 있는지를 확인할 수 있습니다 - 내장패키지이며 아래와 같이 사용한다  import re #문자열을 검색하여 The로 시작하고 Spain으로 끝나는지 확인합니다  txt = "The rain in Spain" x = re.search("^The.*Spain$",txt) if x:     print("Yes! match!") else:     print("No match")   정규식 함수1) findall : 모든 일치 항목이 포함된 목록을 리턴 2) search : 문자열에서 일치하는 항목을 검색하고 일치하는 항목이 있으면 Match객체를 리턴 3) split : 일치할때 마다 문자열이 분할된..

파이썬 Datetime 포맷 가이드: strftime 코드 예시와 설명

from datetime import datetime %a : 평일 짧은 버전 ex)mon %A : 평일 full 번전 ex)monday %w : 주 넘버 0-6 0 is sunday %d : day of month 01-31 %b : 달 이름 숏 버전 %B : 달 이름 풀 버전 %m : 1년 12달 01-12 %y : 년도 숏버전 (세기를 뺸) ex)23 %Y : 년도 풀버전 %H : Hour 시간 00-23 %I : Hour 시간 00-12 %p : 오전이냐 오후냐 AM/PM %M : Minute 00-59 분 %s : Second 00-59 초 %f : 마이크로초 000000-999999 %z : utc offset => 세계협정시 간격 %Z : Timezone %j : 년 365 %U : 일요일이..

SciPy(Scientific Python) Numpy를 기반으로 하는 과학 계산 라이브러리

SciPy[Scientific Python] : Numpy를 기반으로 하는 과학계산 라이브러리이다.: 주로 파이썬으로 작성되었지만 일부 세그먼트는 c로 작성되었다   SciPy설치하기     ! pip install scipy    Unit Categories print(dir(constants))  #dir을 사용하면 모든 단위 목록을 볼 수 있다  - scipy를 이용하여 단위에 대한 변환을 수행할 수 있다미터법 [Metric]: Scipy 및 Numpy에서는 거리 및 길이를 측정하는 데 사용되는 SI 단위인 미터(m)를 사용한다바이너리 [Binary]: 바이너리 데이터 처리에 대한 기능은 Numpy에서 제공됩니다. 이는 컴퓨터 메모리의 이진 데이터를 처리하는 데 사용된다각도 [Angle]: Nump..

데이터프레임(DataFrame)의 배열 조인(join)과 배열분할(split)

배열 조인- 두 개 이상의 배열내용을 단일 배열에 넣는 것을 의미 Numpy에서는 축을 기준으로 배열을 조인한다stack() : 연결과 동일하고 차이점은 스태킹이 새축을 따라 수행된다는 것이다 명시적으로 전달되지 않으면 0으로 간주된다2) hstack() : 행을 따라 쌓는 도우미 3) vstack() : 열을 따라 쌓는 도우미 기능을 제공4) dstack() : 깊이와 동일한 높이를 따라 쌓는 도우미 기능을 제공 stack : 새로운 버티컬 축으로 수행된다ver1 = np.array([1,2,3])ver2 = np.array([4,5,6])verti = np.stack((ver1, ver2), axis=1)print(verti) hstack() : 행을 따라 쌓기vstack() : 함수는 주어진 배열을..

데이터프레임(DataFrame)의 column, index 설정 방법

컬럼(column)을 인덱스(index)로 만들기 df.set_index('name', inplace = True) bikepantsshirtssuitsname    A203015.045.0B1552.07.0C2030NaNNaN    다시 index를 컬럼으로 만들기 df.reset_index(inplace = True)   name bike pantsshirts suits 0A203015.045.01B1552.07.02C2030NaNNaN  새로운 컬럼(column) 만들기 # 새로운 컬럼 name을 만들되, 데이터는 A,B,C라고 넣자.  hatpantsshirts suits 0203015.045.011552.07.022030NaNNaN  df['name'] = ['A' , 'B' , 'C'] df ..

Pandas에서 제공하는 문자열(Str) 함수

https://pandas.pydata.org/docs/reference/api/pandas.Series.str.upper.html pandas.Series.str.upper — pandas 2.2.1 documentationConverts first character of each word to uppercase and remaining to lowercase.pandas.pydata.org 이곳에서 판다스의 함수정보를 알 수 있다.    df.str.replace('a','b')  데이터의 문자열 a를 b로 바꿔준다   - > df.str.replace('$','').astype(float)            #astype(float) 는 df의 type을 모두 float로 바꿔준다. str, in..