Kaggle - Titanic(3)
·
Kaggle
이번에는 Titanic에서 Feature Engineering을 해보도록 하겠습니다~ 4.Feature Engineering Feature engineering is the process of using domain knowledge of the data to create features (feature vectors) that make machine learning algorithms work. feature vector is an n-dimensional vector of numerical features that represent some object. Many algorithms in machine learning require a numerical representation of objects,..
Kaggle - Titanic(2)
·
Kaggle
두번째는 Visualization을 통해서 자료를 해석해보도록 하겠습니다. ~ 자료는 Kaggle의 Titanic Data Machine Learning 과정을 토대로 작성하고 있습니다.!! 다음의 카테고리를 토대로 Data Feature를 분석하기 위해 bar_chart 함수를 만들어 사용합니다~ Python으로 처음 Data Featuring을 하는 과정을 상세히 설명해보도록 하겠습니다. 먼저 Titanic Disaster에서는 'Survived', 'Dead'로 나뉘기 때문에 특징 분류를 ['Survived','Dead']로 설정하여 진행합니다. Survivied = train[train['Survived']==1][feature].value_counts() >> Survived==1 중에서 fea..
Kaggle - Titanic(1)
·
Kaggle
python에서 데이터를 분석을 하기 위해서 가장 먼저 Data set을 CSV파일 등으로 가지고 와야 한다. 여기서 첫 번째 문법을 알려드리겠습니다.~ Pandas를 이용한 CSV File Read 이렇게 불러온 train, test 파일을 토대로 데이터가 어떠한 정보를 담고 있는지 확인해야겠죠? 그럼 확인해보도록 할게요. 여기서는 head 등의 파일의 구성에 대해 엿볼겁니다. pd_name(Pandas_name).head(number) >>head(self, n=5) DataFrame 내의 처음 n줄의 데이터를 출력합니다. 이 메서드(method)는 객체 안에 제대로된 데이터 타입이 입력되어있는지 빠르게 확인할 경우 사용하면 매우 유용하다. n의 값의 기본값은 5이며 아무 입력이 없을 경우 5줄을 기..
Jupyter notebook - %matplotlib inline
·
Data Analysis & ML
'%matplotlib inline'이라는 commend는 jupyter notebook에서 matplotlib을 시각화한 결과를 바로 볼 수 있도록 하는 것이다. 다른 함수도 lnline을 활용하면 바로 결과를 볼 수 있을 것이다. 결론 %matplotlib inline 의 역할은 notebook을 실행한 브라우저에서 바로 그림을 볼 수 있게 해주는 것 입니다. 출처: https://korbillgates.tistory.com/85
Python 데이터 시각화 - 참고 사이트
·
Data Analysis & ML
출처 : ttps://zzsza.github.io/development/2018/08/24/data-visualization-in-python/ Python에서 데이터 시각화하는 다양한 방법 Python에서 데이터 시각화할 때 사용하는 다양한 라이브러리를 정리한 글입니다 데이터 분석가들은 주로 Python(또는 R, SQL)을 가지고 데이터 분석을 합니다 R에는 ggplot이란 시각화에 좋은 라이브러리가 있는 반면 Python에는 어느 춘추전국시대처럼 다양한 라이브러리들이 있습니다 각 라이브러리들마다 특징이 있기 때문에, 자유롭게 사용하면 좋을 것 같습니다 Zeppelin도 시각화할 때 사용할 수 있지만, 라이브러리는 아니기... zzsza.github.io
금융권은 빅데이터를 어떻게 활용할까?
·
금융 & 디지털
지금은 초연결 사회입니다. 그물망처럼 촘촘히 연결된 사회에서 모든 정보는 알게 모르게 연결선을 타고 퍼져 있습니다. 이러한 정보가 연결망에서 축적되면 사람들의 행동과 패턴을 파악할 수 있는 빅데이터가 되는데요. 이러한 빅데이터는 어떻게 사용하느냐에 따라 진가가 달라집니다. 이런 이유로 여러 분야에서 빅데이터를 분석하고 가공하는 시스템을 개발해 활용하고 있죠. 최근에는 금융권에서 빅데이터를 활발하게 활용하기 시작했는데요. 어떤 방식으로 활용하는지 살펴보겠습니다.~ 금융권은 빅테이터가 왜 필요할까? 신용카드를 사용하는 사람들이 많아졌습니다. 한국은행이 발표한 에 따르면 신용카드 이용률(중복 응답)은 79.1%로 나타났습니다. 현금 이용률은 99.3%로, 신용카드 이용률이 현금보다 낮게 나왔지만, 한 달간 평..
주문매체별 신전략
·
금융 & 디지털
HTS대상이라는 상이 있나 봅니다. 심사위원중 한 분이 HTS 불변의 4원칙을 말합니다. ‘안전’,’신속’,’편리’,’혁신’이라고 합니다. HTS를 정확히 평가하기 위해서 4원칙이 필요하다고 합니다. 그런데 같은 기사 앞을 보면 현 상황을 다음과 같이 분석하고 있습니다. "증권사간 서비스의 뚜렷한 차이가 없어 수수료 위주의 경쟁이 지속되고 있고, 증권사간 모방 전략에 따른 서비스 차별화 부재, 이용확대와 함께 불만도 증가 등이 문제점으로 대두되고 있습니다." 정확도를 통하여 차이부재, 전략 모방이라는 문제를 해결할 수 있다고 생각하는 듯 합니다. 솔직히 연결고리를 찾기 힘듭니다. 10년이 넘는 세월동안 숙성할 만큼 숙성한 기술인 HTS를 놓고 새로운 잣대가 있어 평가할 수 있다고 하는 것이 이해하기 힘듭..
Network - TCP, UDP의 특징과 차이
·
CS/Network
1. TCP(Transmission Control Protocol) TCP를 해석하면 전송을 제어하는 프로토콜(규약)이라는 뜻인데, 이는 아래의 정의와 별 다를바 없습니다. 인터넷상에서 데이터를 메세지의 형태로 보내기 위해 IP와 함께 사용하는 프로토콜 일반적으로 TCP와 IP를 함께 사용하는데, IP가 데이터의 배달을 처리한다면 TCP는 *패킷을 추적 및 관리하게 됩니다. TCP는 연결형 서비스를 지원하는 프로토콜로 인터넷 환경에서 기본으로 사용합니다. 이 말을 들으면 다음과 같은 생각이 떠오를 수 있습니다. 비연결형인 서비스가 존재하는건가? 그리고 TCP와 달리 UDP는 왜 기본으로 사용되지 않지?? 이러한 질문에 대한 대답은 TCP와 UDP가 각각 다른 특성을 가지고 있기 때문인데요, TCP는 아래..