Python 34

Streamlit) 가상환경 만들고, 라이브러리 다운 받고, 실행시키기

먼저, 아나콘다를 다운받는다.  그러면 윈도우에 아나콘다 프롬프트도 다운받아져 있을것이다. 아나콘다 프롬프트로 들어가서  conda create -n (가상환경이름 마음대로 지정하여 여기에 넣는다!) python=3.10 openssl numpy scipy matplotlib ipython scikit-learn pandas pillow jupyter seaborn  가상환경이름을 집어넣어서 가상환경을 만들고 라이브러리를 다운받는다.다 다운받으면  conda activate 가상환경 이름 으로 가상환경 실행이 가능하다     주피터노트북을 사용하고 싶다면, 아나콘다 프롬프트에 아래를 복사하여 붙여넣으면 된다.  jupyter notebook .    (st_310), (str_310)은 내가 지정한 가상..

Python/Streamlit 2024.04.26

Numpy(넘파이) 난수(Random)와 분포도

from numpy import randomimport numpy as npimport matplotlib.pyplot as pltimport seaborn as sns   Random Numbers in NumPy (넘파이 난수) - 무작위란 물리적으로 논리적으로 예측할 수 없는 수 - 난수를 생성하는 알고리즘 - 생성 알고리즘을 통해 생성된 난수  randint()- 정수로 난수 생성- 간편하게 로또번호 생성lt = random.randint(46, size=(5))print(lt)    rand() 무작위 플롯 생성(Random Float) 0과 1사이의 부동소수점 생성 Float = random.rand() print(Float)      Data Distribution [데이터 배포] - 가능한..

NumPy 대규모 데이터 배열에 효율적인 UFUNC 함수 개념

import numpy as np  NumPy ufunc는 브로드캐스팅을 지원하여 서로 다른 크기의 배열 간에도 연산을 수행할 수 있다. ufunc를 사용하면 대규모 데이터 배열을 효율적으로 처리할 수 있다.  소수점 반올림하기Truncation 잘림 소수점을 제거하고 0에 가장 가까운 부동소수점 숫자를 리턴 trunc와 fix사용 Rounding : 반올림 앞의 숫자 또는 소수점을 1씩 증가Floor : 가장 가까운 낮은 정수로 내림 예를들어서 3.16666 -> 3.0Ceil : 가장 가까운 상위 정수로 올림 예를들어서 3.16666 -> 4.0 Logs 2진수 10진수에서 로그를 수행하는 기능을 제공합니다 로그를 계산할 수 없는 경우 요소에 -inf(무한대) 또는 inf(무한대)를 배치합니다 log..

Numpy 배열(Array)에 대한 개념 설명

NumPy [Numerical Python]- 배열 작업에 사용되는 Python라이브러리 이다 - 선형 대수학, 푸리에 변환 및 행렬 영역에서 작업하기 위한 기능도 있다 - 숫자 파이썬을 의미한다 - List는 처리 속도가 느려서 최대 50배 빠른 배열 객채를 제공하는 것을 목표로 한다 설치 pip install numpyimport numpy as np     #별칭 np   슬라이싱 인덱스요소를 가져오는것을 의미한다. 라스트인덱스 미포함 Arr = np.array([1,2,3,4,5,6,7]) print(Arr[1:5])  Numpy의 데이터 유형i - 정수 b - 부울 u - 부호 없는 정수 c - float m - timedelta M - datetime O - object S - string U..

람다(Lambda) : 익명 함수 개념 설명

Lambda 인수를 여러개 사용할 수 있지만 표현식을 하나만 가질 수 있는 익명 함수 람다함수를 사용하는 이유다른 함수 내에서 익명함수를 사용할때 더 잘 드러난다 #1) q = lambda a: a + 10 print(q(5)) #=> 15  #2) 인수 a,b를 요약하고 결과를 리턴 x = lambda m, n, b : m + n + b print(x(5,6,3))  #3) 동일한 함수를 정의하여 동일한 프로그래밍에서 두기능을 만듭니다 함수를 만들고 변수 두개를 설정하여 값을 리턴def cuc(n):     return lambda z : z * n mydoubler = cuc(2) mytripler = cuc(3)  print(mydoubler(11)) print(mytripler(11))

정규식 함수 (Python RegEx)

Python RegEx [정규식] - 검색 패턴을 형성하는 일련의 문자 - 문자열에 지정된 검색 패턴이 포함되어 있는지를 확인할 수 있습니다 - 내장패키지이며 아래와 같이 사용한다  import re #문자열을 검색하여 The로 시작하고 Spain으로 끝나는지 확인합니다  txt = "The rain in Spain" x = re.search("^The.*Spain$",txt) if x:     print("Yes! match!") else:     print("No match")   정규식 함수1) findall : 모든 일치 항목이 포함된 목록을 리턴 2) search : 문자열에서 일치하는 항목을 검색하고 일치하는 항목이 있으면 Match객체를 리턴 3) split : 일치할때 마다 문자열이 분할된..

파이썬 Datetime 포맷 가이드: strftime 코드 예시와 설명

from datetime import datetime %a : 평일 짧은 버전 ex)mon %A : 평일 full 번전 ex)monday %w : 주 넘버 0-6 0 is sunday %d : day of month 01-31 %b : 달 이름 숏 버전 %B : 달 이름 풀 버전 %m : 1년 12달 01-12 %y : 년도 숏버전 (세기를 뺸) ex)23 %Y : 년도 풀버전 %H : Hour 시간 00-23 %I : Hour 시간 00-12 %p : 오전이냐 오후냐 AM/PM %M : Minute 00-59 분 %s : Second 00-59 초 %f : 마이크로초 000000-999999 %z : utc offset => 세계협정시 간격 %Z : Timezone %j : 년 365 %U : 일요일이..

Matplotlib) Scatter(스캐터) 차트와 HeatMap(히트맵) 그리기

Scatter(스캐터) 스캐터 플롯은 데이터의 분포를 시각적으로 파악할 수 있게 해주며, 두 변수 간의 관계를 이해하는 데 도움이 된다 예를 들어, 두 변수 간의 양의 상관 관계가 있을 때, 데이터 포인트들은 대체로 오른쪽 위로 향하는 경향이 있다. 반대로 음의 상관 관계가 있을 때는 대체로 왼쪽 위로 향하는 경향이 있다.또한 상관관계가 강할경우 데이터들이 모여있고, 상관관계가 약할 경우 데이터들이 퍼져있다    import numpy as npimport pandas as pdimport matplotlib.pyplot as pltimport seaborn as sb   # 배기량(displ)과 연비(comb)의 관계를 눈으로 확인해보고싶다 df  displ pv2 pv4 city UCity ..

Python/Matplotlib 2024.04.16

SciPy(Scientific Python) Numpy를 기반으로 하는 과학 계산 라이브러리

SciPy[Scientific Python] : Numpy를 기반으로 하는 과학계산 라이브러리이다.: 주로 파이썬으로 작성되었지만 일부 세그먼트는 c로 작성되었다   SciPy설치하기     ! pip install scipy    Unit Categories print(dir(constants))  #dir을 사용하면 모든 단위 목록을 볼 수 있다  - scipy를 이용하여 단위에 대한 변환을 수행할 수 있다미터법 [Metric]: Scipy 및 Numpy에서는 거리 및 길이를 측정하는 데 사용되는 SI 단위인 미터(m)를 사용한다바이너리 [Binary]: 바이너리 데이터 처리에 대한 기능은 Numpy에서 제공됩니다. 이는 컴퓨터 메모리의 이진 데이터를 처리하는 데 사용된다각도 [Angle]: Nump..

Matplotlib) Histograms(히스토그램) 차트 그리기

- 주어진 각 구간 내에 위치하는 관측치 수를 보여주는 그래프이다 - 빈도 분포를 보여주는 그래프이다- 일정한 해당 구간에 포함되는 데이터의 분포를 알 수 있다- 일정 구간을 bin이라고 하며 구간이 여러개면 복수형으로 bins라고 한다- 히스토그램은 똑같은 데이터를 가지고 bin을 어떻게 설정하느냐에 따라서 차트모양이 달라지며 해석이 달라진다   df  id species hp attack defense speed01bulbasaur4549494512ivysaur6062636023venusaur8082838034charmander3952436545charmeleon58645880.....................802803poipole67736773803804naganadel737373121..

Python/Matplotlib 2024.04.15