[Coursera/IBM] IBM AI Engineering PC 및 Machine Learning with Python 코스 소개
·
🥇 certification logbook
IBM AI Engineering PC 🔗 https://www.coursera.org/professional-certificates/ai-engineer Machine Learning with Python 🔗 https://www.coursera.org/learn/machine-learning-with-python/ IBM Professional Certificate(PC) 란?IBM AI Engineering PCIBM Data Science PC IBM AI Engineering PC여기서 IBM AI Engineering PC란?데이터 과학자, 머신러닝 엔지니어, 소프트웨어 엔지니어를 위한 AI 기술 교육Python, SciPy, Keras, PyTorch, TensorFlow를 활용해 모델..
빅데이터분석기사 (빅분기) 실기 총 정리 / 시험 시작 전 확인
·
🥇 certification logbook
빅데이터 분석 기사 실기 준비하면서 정리한 내용 공부한 내용 정리하는데 참고용, 시험 전날, 시험 보러 가는 길, 시험 시작 전 확인하면 좋을 것 같다. 공부할 때에는 눈으로 하지 말고, 머리로 외운다 생각하지 말고, 실제로 문제를 풀어보며 키보드를 치는 손가락으로 외운다고 생각하며 공부하는 게 좋다. ( help, dir 사용 방법 익히는 것은 필수 ) 패키지############ # 데이터 프레임 import pandas as pd ############ # 수학 계산 import numpy as np ############ # 전처리 (x_train, x_test 다 해야 함) from sklearn.preprocessing import LabelEncoder from sklearn.preproce..
[ADsP] 군집분석
·
🥇 certification logbook
유사성을 측정하여 유사성이 높은 대상 집단을 분류하고, 군집에 속한 객체들의 유사성과 서로 다른 군집에 속한 객체간의 상이성을 규명하는 분석 방법군집의 개수나 구조에 대한 가정 없이 데이터들 사이의 거리를 기준으로 군집화를 유도 군집 분석요인 분석판별 분석(유형분석)유사 그룹 구분하여 특성 파악 (군집 끼리 비교)유사 변수를 묶어 단순화이미 그룹은 존재하고 새 데이터를 할당 거리 계산연속형 변수인 경우유클리디안 거리 (통계적 개념 X, 산포 고려 X, 유사성 측정, 제곱의 루트)데이터간의 유사성을 측정할 때 많이 사용하는 거리통계적 개념이 내포되어 있지 않아 변수들의 산포 정도가 전혀 감안되어 있지 않음공통으로 점수를 매긴 항목의 크기를 통해 판단하는 측도$$d(x,y) = \sqrt{(x_1-y_1)^..
[python 통계분석] 교차분석(카이제곱 검정)
·
🥇 certification logbook
Reference - , 데싸라면▪빨간색 물고기▪자투리코드, 시대고시기획 시대교육 SciPy 패키지를 이용한 통계분석 https://docs.scipy.org/doc/scipy/reference/stats.html Statistical functions (scipy.stats) — SciPy v1.10.1 Manual Statistical functions (scipy.stats) This module contains a large number of probability distributions, summary and frequency statistics, correlation functions and statistical tests, masked statistics, kernel density esti..
[python 통계분석] t-test 검정
·
🥇 certification logbook
Reference - , 데싸라면▪빨간색 물고기▪자투리코드, 시대고시기획 시대교육 SciPy 패키지를 이용한 통계분석 https://docs.scipy.org/doc/scipy/reference/stats.html Statistical functions (scipy.stats) — SciPy v1.10.1 Manual Statistical functions (scipy.stats) This module contains a large number of probability distributions, summary and frequency statistics, correlation functions and statistical tests, masked statistics, kernel density esti..
[python 데이터 전처리] 데이터 스케일링 (data scaling)
·
🥇 certification logbook
Reference - , 데싸라면▪빨간색 물고기▪자투리코드, 시대고시기획 시대교육 Scaling 메서드 scikit-learn의 perprocessing https://scikit-learn.org/stable/modules/preprocessing.html 6.3. Preprocessing data The sklearn.preprocessing package provides several common utility functions and transformer classes to change raw feature vectors into a representation that is more suitable for the downstream esti... scikit-learn.org 데이터 스케일링 방법..
[python 데이터 핸들링] 판다스 연습 튜토리얼 - 07_Merge , Concat
·
🥇 certification logbook
Reference - DataManim (https://www.datamanim.com/dataset/99_pandas/pandasMain.html#) DataSet 국가별 5세이하 사망비율 통계 : https://www.kaggle.com/utkarshxy/who-worldhealth-statistics-2020-complete 데이터 변형 Dataurl = ‘https://raw.githubusercontent.com/Datamanim/pandas/main/mergeTEst.csv%E2%80%99 Question In [ ]: import pandas as pd df = pd.read_csv('https://raw.githubusercontent.com/Datamanim/pandas/main/merg..
[python 데이터 핸들링] 판다스 연습 튜토리얼 - 06_Pivot
·
🥇 certification logbook
Reference - DataManim (https://www.datamanim.com/dataset/99_pandas/pandasMain.html#) DataSet 국가별 5세이하 사망비율 통계 : https://www.kaggle.com/utkarshxy/who-worldhealth-statistics-2020-complete Dataurl = ‘https://raw.githubusercontent.com/Datamanim/pandas/main/under5MortalityRate.csv%E2%80%99 Question In [ ]: import pandas as pd df = pd.read_csv('https://raw.githubusercontent.com/Datamanim/pandas/main/u..
[python 데이터 핸들링] 판다스 연습 튜토리얼 - 05_Time_Series
·
🥇 certification logbook
Reference - DataManim (https://www.datamanim.com/dataset/99_pandas/pandasMain.html#) - , 데싸라면▪빨간색 물고기▪자투리코드, 시대고시기획 시대교육 DataSet 주가 데이터 : https://raw.githubusercontent.com/guipsamora/pandas_exercises/master/06_Stats/Wind_Stats/wind.data DataUrl = ‘https://raw.githubusercontent.com/Datamanim/pandas/main/timeTest.csv%E2%80%99 Question ✔ 데이터를 로드하고 각 열의 데이터 타입을 파악하라 In [ ]: import pandas as pd df = ..
[python 데이터 핸들링] 판다스 연습 튜토리얼 - 04_Apply , Map
·
🥇 certification logbook
Reference - DataManim (https://www.datamanim.com/dataset/99_pandas/pandasMain.html#) - , 데싸라면▪빨간색 물고기▪자투리코드, 시대고시기획 시대교육 DataSet 카드이용데이터 : https://www.kaggle.com/sakshigoyal7/credit-card-customers DataUrl = ‘https://raw.githubusercontent.com/Datamanim/pandas/main/BankChurnersUp.csv%E2%80%99 Question ✔ 데이터를 로드하고 데이터 행과 열의 갯수를 출력하라 In [ ]: import pandas as pd df = pd.read_csv('https://raw.githubus..