전체보기
-
(데이터베이스) 인덱스 구조자격증/(정처기) 필기 요약 2019. 2. 26. 23:11
트라이(Trie) 색인(index)키 값을 직접 표현하지 않고 키 값이 문자열 또는 숫자일 경우 일련의 키 값들에 대해 일부분이 같은 문자나 숫자로 구성하는 구조이다. 즉 전체 키 값의 길이보다 키 값들 사이에 별개의 전위(Prefix) 수가 작을 때 적합하다. 1. 가변 길이의 키 값을 효과적으로 나타낼 수 있다.2. 삽입 및 삭제 시 노드의 분열과 병합이 없다.3. 트라이의 차수는 키 값을 표현하기 위해 사용하는 문자의 수 (Radix)에 의해 결정된다.4. 키 값의 분포를 미리 예측할 수 있다면 기억장소를 절약할 수 있다.5. 트라이의 크기는 나타내려고 하는 키 값의 기수와 키 필드 길이에 의해 결정된다. 출처 - https://coding-factory.tistory.com/234 B - 트리 색..
-
(Kaggle) Titanic Machine Learning 입문IT 지식 창고 2019. 1. 31. 21:17
Kaggle Titanic Machine Learning을 처음 입문 하면서 이론도 많이 부족하여 정말 많은 커널과 구글링을 통하여 어느 정도 공부를 하고 이해를 한 상태에서 전체적으로 머신러닝을 시행하였습니다.블로그에 제가 한 것을 올리고 싶었지만, 앞으로 이론 공부를 하고 예제에 적용할 때 타이타닉 예제를 활용할 예정이라 계속적으로 업데이트가 될 것 같아서 제 Kaggle Kernel 링크를 올려 드리겠습니다. 보고 다들 많은 도움 되셨으면 합니다. 저는 ticket을 제외하고 모든 열을 사용하도록 하였습니다.https://www.kaggle.com/casim0/titanic-machine-learning-ticket-casim0 -참고-Kaggle Titanic Kernel에서 소개된 가장 간단하고..
-
간단하게 원하는 열만 따로 뽑아 프린트할 때IT 지식 창고 2019. 1. 29. 23:34
print('제일 나이 많은 탑승객 : {:.1f} Years'.format(train_df['Age'].max())) print('제일 어린 탑승객 : {:.1f} Years'.format(train_df['Age'].min())) print('탑승객 평균 나이 : {:.1f} Years'.format(train_df['Age'].mean()))print('제일 나이 많은 탑승객 : {:.1f} Years'.format(train_df['Age'].max()))print('제일 어린 탑승객 : {:.1f} Years'.format(train_df['Age'].min()))print('탑승객 평균 나이 : {:.1f} Years'.format(train_df['Age'].mean()))제일 나이 많은 탑..
-
(Python) 각종 라이브러리에 대한 요약IT 지식 창고 2019. 1. 28. 16:54
import Seaborn as snsSeaborn은 Matplotlib을 기반으로 다양하고 유익한 통계 그래프를 그리기 위한 고급 인터페이스를 제공합니다.Seaborn이 제공하는 기능 중 일부는 다음과 같습니다.여러 변수 간의 관계를 검사 하기 위한 데이터 집합 지향 API범주 형 변수를 사용하여 관찰 또는 집계 통계를 보여주는 특수한 지원단 변량 또는 이 변량 분포를 시각화하고 데이터의 하위 집한 간에 이들을 비교하는 옵션여러 종류의 종속 변수에 대한 선형 회귀 모델의 자동 추정 및 플로팅복잡한 데이터 세트의 전반적이 구조에 대한 편리한 견해복잡한 시각화를 쉽게 만들 수 있는 다중 플롯 그리드 구조화를 위한 높은 수준의 추상화여러 가지 내장 테마로 matplotlib그림 스타일을 간결하게 제어데이터의..
-
(Python) module 'pandas' has no attribute 'ols' 일 때 같은 형식으로 데이터 추출법IT 지식 창고 2019. 1. 23. 21:21
Chapter 11. 금융, 경제 데이터 애플리케이션 Python for Data Analysis (2018 웨스 맥키니) 책 중 일부 11.2.1 그룹 요인 밝히기¶ In [1]: from sklearn.linear_model import LinearRegression In [2]: from numpy.random import rand fac1, fac2, fac3 = np.random.rand(3, 1000) ticker_subset = tickers.take(np.random.permutation(N)[:1000]) # 임의의 값을 추가한 요인들의 가중합 port = Series(0.7 * fac1 - 1.2 * fac2 + 0.3 * fac3 + rand(1000), index=ticker_sub..
-
(Python) 리스트(list), 배열(array)에서 반올림 하는 법IT 지식 창고 2019. 1. 23. 20:44
이 글을 검색해서 오셨다면, python 내장함수인 round()를 사용하다가 안되어서 검색하게 되었을 겁니다.list, array 내에 원소들은 numpy의 round()함수를 사용하면 가능합니다.import numpy as npa = [1.1, 1.2, 1.7]np.round(a)# [1.0, 1.0, 2.0] for문이나 list comprehension으로 구현할 수 있지만, numpy에서 최적화하여 잘 만들어 놨을 것 같아요.국룰인 numpy 라이브러리는 최대한 활용하는 게 좋을 것 같습니다.자릿수 반올림 방법import numpy as npa = 17.7234np.round(a) # np.round(a, 0)# 18.0# 숫자가 커질수록 소수점 자리np.round(a, 1)# 17.7# 숫자가..