목록전체 글 (188)
alpyrithm_알파이리즘
1004 어린 왕자 https://www.acmicpc.net/problem/1004 1004번: 어린 왕자 입력의 첫 줄에는 테스트 케이스의 개수 T가 주어진다. 그 다음 줄부터 각각의 테스트케이스에 대해 첫째 줄에 출발점 (x1, y1)과 도착점 (x2, y2)이 주어진다. 두 번째 줄에는 행성계의 개수 n이 주�� www.acmicpc.net 문제 풀기 전 공부할 것 : 원과 점의 관계(수학) 풀이 1 출발점과 도착점이 원 안에 속하면 진입이나 이탈이 필요하다. 따라서 출발점과 도착점 각각 원 안에 속하는지 확인을 해야 하며 둘 다 속하면 진입이나 이탈을 할 필요가 없다는 점을 이해해야 한다. flag를 통해 출발점과 도착점이 동시에 속하는 경우를 구별했다. import sys input = sys..
데이터 선택 Slice : 이름 또는 인덱스를 이용한 선택 슬라이스(Slice) 기능을 이용해 DataFrame의 특정 열(column) 또는 행(row)을 가져올 수 있음 DataFrame에 대괄호([])를 이용 df['A'] → df의 A 열 가리킴 복수의 열을 슬라이스 할 경우, 열의 이름을 또 하나의 대괄호([])로 묶어서 표현 df[['A', 'B']] → df의 A, B 열 가리킴 콜론(:)을 이용해 행의 범위로 가져오기 가능 df[0:5] → df의 0~4번 index를 가리킴 df[0:1] → df의 첫 번째 행(index 0) loc : 이름을 이용한 선택 열과 행의 조건을 모두 제공해야 할 경우 loc 함수 이용 loc : label의 이름을 이용해 선택 df.loc[2013-01-31..
Summarry SVM(Support Vector Machine) in Supervised Learning Soft Margin Classification in Supervised Learning Decision Tree Main SVM(Support Vector Machine) Support Vector Machine의 개념 SVM(Support Vector Machine)의 목표는 클래스 간 경계를 찾아서 misclassification 오류를 줄이는 것 입력 데이터를 공간에서 선형으로 분리할 수 있는 초평면 또는 최적의 선형 결정 경계를 찾는 알고리즘 문제는 대부분 몇 가지 결정 결계가 생긴다는 것 어느 경계가 더 나은지를 더 잘 정의하는 방법에 대한 질문의 해결책이며, 이 해결책은 마진 최적화를 ..
Summary Supervised Learning(지도 학습) 응용 Classification(분류) 예시 Regression(회귀분석) 응용 Linear Regreassion의 이해 및 응용 Logistic Regression의 이해 및 응용 K-Nearest Neighbor(KNN)의 이해 및 응용 Main Supervised Learning 응용 Classification Model(분류 모델) 로지스틱 회귀분석(Logistic Regression) 의사결정나무(Decision Tree) 앙상블(Ensemble) Random Forest Gradient Boosting SVM(Support Vector Machine) K-Nearest Neighbors Naive Bayesian Classifica..
Summary Supervised Learning(지도 학습) 기초 Supervised Learning 개념 Supervised Learning의 종류 Feature Engineering 이해와 실습 Main Supervised Learning 기초 Supervised Learning의 개념 답을 주고 학습시키는 방법 특정 입력(Input)에 대하여 올바른 정답(Right Answer)이 있는 데이터 집합이 주어지는 경우의 학습 문제를 내고 그 다음 바로 정답까지 같이 알려주는 방식의 Learning 방법 여러 문제와 답을 함께 학습하여 미지의 문제에 대한 올바른 답 예측이 가능 문제와 함께 문제의 정답까지 함께 알고 있는 데이터를 선택 Input과 Output에 대한 관계를 유추하여 Right Answ..
Summary Dimension Reduction(차원 축소) Dimension Reduction 기초 Dimension Reduction 적용 분야 Dimension Reduction의 목표 PCA(주성분 분석) 기초 PCA 개념 PCA 플로우 Main Dimension Reduction Dimension Reduction 기초 Dimension(차원)의 이해 차원은 데이터 샘플과 관련된 차원, 기능 또는 변수의 수 스프레스 시트를 예로 들 때, 시트의 여러 열을 생각할 수 있는데, 각 샘플은 새로운 행에 있고 각 열은 샘플의 속성들을 설명함 Dimension Reduction(차원 축소)의 필요 변수를 축약하여 정보를 쉽게 표현(고차원 변수 -> 저차원 주성분 선택) 에코 심전도 데이터의 예 에코 심..
Summary Pandas 데이터 프레임 훈련(Macro) 파일, SQL 쿼리에서 데이터 프레임 만들기 DataFrame 검사 및 요약 통계 Pandas 데이터 프레임 훈련(Micro) Selection(선택) Slicing(슬라이싱) Indexing(인덱싱) Filtering(필터링) Main Pandas 데이터 프레임 훈련 Series의 활용 pandas.Series class는 NumPy 배열과 같이 단일 유형의 데이터 배열에 대한 데이터 구조를 제공 1차원 표현은 스프레드 시트에서 row로 생각할 수 있으며, 각 row의 이름을 가지고 있고 여기서 데이터는 (같은 변수를 측정하기 때문에) 같은 유형 pandas.Series One-dimensional ndarray with axis labels ..
Summary Data Analysis의 이해 Data Analysis 기본 구조 Pandas 주요 데이터 구조 Main 1. Data Analysis의 이해 반복적인 프로세스 기업/사회에서 발생하는 실제 문제를 분석하고 최적화된 솔루션을 도출하여 새로운 가치를 창출하는 것 Data Collection(데이터 수집), Data Wrangling(데이터 준비), EDA(탐색적 데이터 분석) 및 Drawing Conclusion(결론 도출)의 과정으로 이루어짐 유용한 정보를 발굴하고 결론 내용을 알리며 의사결정을 지원하는 것을 목표로 데이터를 정리, 변환, 모델링하는 과정 참고 자료 : Hands-On Data Analysis with Pandas 2. Data Analysis 기본 구조 Data Colle..