Python·R 데이터 분석, 통계 분석, 머신러닝, 딥러닝 강의 노트를 정리하는 공간입니다.

생성형 AI를 활용한 Python 코딩하기 중심으로 업데이트하고 있습니다.

예전에 작성했던 R 강의 노트 중 여전히 유효한 내용을 함께 정리합니다.

Recent Posts

텍스트 마이닝을 활용한 기업리뷰 분석

33 minute read

기업리뷰 분석 마지막 포스팅입니다. 이번 포스팅에서는 기업리뷰 중 장점, 단점 및 경영진에 바라는 점 등 텍스트 데이터를 이용하여 기업리뷰에 담긴 공통된 생각을 …

탐색적 데이터 분석(EDA)과 추천모형 적합

18 minute read

지난 포스팅에서 우리는 관심 있는 회사에 대한 기업리뷰를 수집하는 방법에 대해 알아봤습니다. 이번 포스팅에서는 수집한 데이터를 이용하여 몇 가지 간단한 분석을 수…

기업리뷰 수집

13 minute read

여러분은 취업에 대한 관심이 상당히 많을 것이라 생각합니다. 저는 여러 대기업 금융회사에서만 16년 넘게 근무했습니다. 여러분 입장에서는 대기업 금융회사가 겉으로…

로지스틱 회귀분석 (Logistic Regression)

23 minute read

이번 포스팅은 분류모형 네 번째 소개로 로지스틱 회귀분석입니다. 로지스틱 회귀분석은 범주형인 목표변수를 입력변수들의 선형결합으로 표현한 것입니다. 로지스틱 회귀모…

의사결정나무 (Decision Tree)

30 minute read

이번 포스팅에서는 분류모형 세 번째 소개로 의사결정나무 Decision Tree에 대해서 알아보겠습니다. 의사결정나무는 목표변수가 범주형이면 분류모형, 연속형이면…

나이브 베이즈 (Naive Bayes)

25 minute read

이번 포스팅에서는 분류모형 두 번째 소개로 나이브 베이즈 Naive Bayes에 대해서 알아보겠습니다. 나이브 베이즈는 베이즈 정리를 이용한 알고리즘입니다. 베이…

K-근접이웃 (K-nearest neighbors)

22 minute read

이전 포스팅에서 기계학습 알고리즘에 대해 간략하게 소개했습니다. 이번 포스팅에서는 목표변수가 있는 지도학습 중 분류Classification 모형에 대해 알아보도…

유사도의 척도, 거리의 종류

3 minute read

일부 기계학습 알고리즘은 데이터 간 유사도 혹은 비유사도를 측정하는 경우가 있습니다. 유사도의 기준으로는 주로 거리Distance를 이용하는데요. 예를 들어 군집…

분류모형의 성능 평가 기준

4 minute read

분류모형의 성능을 평가하는 기준은 여러 가지가 있겠으나 일반적으로 많이 사용되는 두 가지 방법에 대해서 소개해드리겠습니다.