목록SM공부 (18)
alpyrithm_알파이리즘
Summary Supervised Learning(지도 학습) 기초 Supervised Learning 개념 Supervised Learning의 종류 Feature Engineering 이해와 실습 Main Supervised Learning 기초 Supervised Learning의 개념 답을 주고 학습시키는 방법 특정 입력(Input)에 대하여 올바른 정답(Right Answer)이 있는 데이터 집합이 주어지는 경우의 학습 문제를 내고 그 다음 바로 정답까지 같이 알려주는 방식의 Learning 방법 여러 문제와 답을 함께 학습하여 미지의 문제에 대한 올바른 답 예측이 가능 문제와 함께 문제의 정답까지 함께 알고 있는 데이터를 선택 Input과 Output에 대한 관계를 유추하여 Right Answ..
Summary Dimension Reduction(차원 축소) Dimension Reduction 기초 Dimension Reduction 적용 분야 Dimension Reduction의 목표 PCA(주성분 분석) 기초 PCA 개념 PCA 플로우 Main Dimension Reduction Dimension Reduction 기초 Dimension(차원)의 이해 차원은 데이터 샘플과 관련된 차원, 기능 또는 변수의 수 스프레스 시트를 예로 들 때, 시트의 여러 열을 생각할 수 있는데, 각 샘플은 새로운 행에 있고 각 열은 샘플의 속성들을 설명함 Dimension Reduction(차원 축소)의 필요 변수를 축약하여 정보를 쉽게 표현(고차원 변수 -> 저차원 주성분 선택) 에코 심전도 데이터의 예 에코 심..
Summary Pandas 데이터 프레임 훈련(Macro) 파일, SQL 쿼리에서 데이터 프레임 만들기 DataFrame 검사 및 요약 통계 Pandas 데이터 프레임 훈련(Micro) Selection(선택) Slicing(슬라이싱) Indexing(인덱싱) Filtering(필터링) Main Pandas 데이터 프레임 훈련 Series의 활용 pandas.Series class는 NumPy 배열과 같이 단일 유형의 데이터 배열에 대한 데이터 구조를 제공 1차원 표현은 스프레드 시트에서 row로 생각할 수 있으며, 각 row의 이름을 가지고 있고 여기서 데이터는 (같은 변수를 측정하기 때문에) 같은 유형 pandas.Series One-dimensional ndarray with axis labels ..
Summary Data Analysis의 이해 Data Analysis 기본 구조 Pandas 주요 데이터 구조 Main 1. Data Analysis의 이해 반복적인 프로세스 기업/사회에서 발생하는 실제 문제를 분석하고 최적화된 솔루션을 도출하여 새로운 가치를 창출하는 것 Data Collection(데이터 수집), Data Wrangling(데이터 준비), EDA(탐색적 데이터 분석) 및 Drawing Conclusion(결론 도출)의 과정으로 이루어짐 유용한 정보를 발굴하고 결론 내용을 알리며 의사결정을 지원하는 것을 목표로 데이터를 정리, 변환, 모델링하는 과정 참고 자료 : Hands-On Data Analysis with Pandas 2. Data Analysis 기본 구조 Data Colle..
조합 키 : command, shift, option, control, caps lock, fn OS X 와 윈도우 조합 키 OS X command option shift 윈도우 ctrl alt shift 자주 사용하는 단축키 복사 : command + c 잘라내기 : command + x 붙여넣기 : command + v 작업 취소 : command + z 줄 처음으로 커서 이동 : command + ← 줄 끝으로 커서 이동 : command + → 최소화 : command + m 열기 : command + o 저장 : command + s 환경설정 열기 : command + , 창 숨기기 : command + h 파일 삭제 : command + delete 전체 화면 캡처(파일) : command +..
VPN(Virtual Private Network) - 가상 사설망 - 공중망을 통한 연결을 전용선처럼 사용하는 것 - 외부의 컴퓨터도 내부 네트워크에 접속해 있는 것처럼 이용할 수 있는 것 온라인 익명성 보호 스파이와 사이버 공격 방지 자유로운 인터넷 브라우징 VPN 장점 - Network 관리 및 운영 비용의 절감 - 기업 Network의 유동성 확보 - 기업의 통신 비용 절감 VPN 단점 - 보안성의 부족 - VPN 장비간의 호환성이 떨어짐 - 관리 편의성이 떨어짐 - QoS(Quality of Service)가 보장되지 않음 - 표준화가 되지 않았음 - 인터넷의 성능이 불안정함 사설망(Private Network) VS 공중망(Public Network) - 사설망(Private Network) ..
GO 언어란? - 실용적인 언어로 빠른 성능, 안정성, 편의성, 쉬운 프로그래밍을 목표로 "생산성"과 "성능"을 위한 언어이다. - 특징 간결하고 유연한 문법 상대적으로 작은 키워드 수로 이해하고 배우는데 시간이 오래 걸리지 않는다. 객체 지향 언어, '타입//속성'과 '메서드'를 분리하여 정의한다. 병행 프로그래밍 / 병행성(Concurrency) 통신 순차 프로세스(Communcating Sequential Processes, CSP) 방식, 메시지 전달하는 방식 고루틴(Go Routinie) : 동시에 처리해야 하는 작업, 동시에 독립적으로 실행되는 흐름의 단위 정적 타입 언어 컴파일할 때 타입(Type) 결정이 이루어진다. 코드 내에서 암시적 형변환이 없다. 덕 타이핑(duck typing) 쉬운..
RudderStack - The most secure customer data infrastructure solution - Open-source for collecting, storing, and routing customer event data to your data warehouse - 고객 이벤트 데이터를 수집, 저장, 데이터 웨어하우스로 라우팅 하는 오픈 소스 RudderStack Architecture - database에만 의존하는 독립적인 시스템 - 주요 구성 요소 : Control Plane, Data Plane Control Plane : 이벤트 데이터의 소스 및 목적지를 구성하는 UI(Tracking Event의 정보를 보여준다.) Web App : 데이터 라우팅을 설정할 수 있는 프..