머신러닝(Machine Learning)26 머신러닝 실습: 분류분석 연습2 안녕하세요 블레이즈 테크노트의 블레이즈입니다. 이전 포스팅에서는 분류분석에 대한 데이터 전처리 작업을 살펴보았습니다. 2024.03.02 - [머신러닝(Machine Learning)] - 머신러닝 실습: 분류분석 연습1 오늘은 그 데이터를 활용해 본격적으로 모델 학습과 평가 과정을 진행해보겠습니다. 분류 모델에 대한 이론적 배경이 필요하신 분들은 이전 이론 포스팅을 참고해주세요. 로지스틱 회귀, 선형 판별 분석, K-최근접 이웃 분석 등 다양한 분류 모델에 대해 자세히 다루었습니다. 2024.03.01 - [분류 전체보기] - 머신러닝 이론 분류모델: 로지스틱 회귀, 선형 판별 분석, k-최근접 이웃 분석 이번 포스팅에서는 본격적으로 모델 학습과 평가를 진행해보도록 하겠습니다. 첫 번째 모델은 로지스틱.. 2024. 3. 3. 머신러닝 실습: 분류분석 연습1 안녕하세요 블레이즈 테크노트의 블레이즈입니다. 지난 포스팅에서 머신러닝 지도학습 중 분류 분석 모델을 다뤘습니다. 2024.03.01 - [분류 전체보기] - 머신러닝 이론 분류모델: 로지스틱 회귀, 선형 판별 분석, k-최근접 이웃 분석 이번 포스팅에서는 해당 분석법들을 실제 데이터로 분석해보고자 합니다. 이번 분석에서 사용한 데이터는 포스팅 최하단에 업로드하겠습니다. 먼저, 필요한 라이브러리를 불러오고 데이터를 준비해보죠. 데이터는 포스팅 말미에 첨부해두었으니, 함께 확인해주세요. import pandas as pd import numpy as np from time import time import matplotlib.pyplot as plt import seaborn as sns from skle.. 2024. 3. 2. 머신러닝 실습: 회귀분석 연습2 안녕하세요 블레이즈 테크노트 블레이즈 입니다. 지난 번에는 데이터 전처리에 관한 이야기를 나눴는데, 오늘은 그 전처리된 데이터로 실제 모델 학습과 평가를 해볼 예정입니다. 2024.02.28 - [머신러닝(Machine Learning)] - 머신러닝 기초: 회귀분석 연습 1 지난 번에 데이터 전처리 과정을 보여드렸지만 혹시나 해당 전처리 과정이 제대로 안되셨을까봐 전처리 완료 데이터를 포스트 맨 아래에 첨부하도록 하겠습니다. 이번 포스팅에서 다룰 회귀 모델은 선형 회귀, Ridge 회귀, Lasso 회귀, Elastic Net 회귀 모델입니다. 이러한 모델에 대한 이론적 배경은 아래의 포스팅에 설명했으니, 참고해주세요! 2024.02.26 - [머신러닝(Machine Learning)] - 머신러닝 이.. 2024. 2. 29. 머신러닝 실습: 회귀분석 연습 1 안녕하세요 블레이즈 테크노트 블레이즈 입니다. 오늘은 회귀 분석, 즉 데이터 사이의 관계를 예측하는 실습을 진행해보려고 해요. 회귀 분석이란, 주로 데이터 간의 선형 관계를 찾아내는 방법을 말합니다. 먼저 시작하기 전에, 데이터 분석에 필수적인 몇 가지 도구들을 준비해볼게요. numpy, pandas, matplotlib.pyplot, 그리고 seaborn 같은 라이브러리를 사용할 건데요, 이들에 대한 기초 사용법은 제가 이전에 작성한 포스팅에서 확인하실 수 있습니다. 2024.02.23 - [머신러닝(Machine Learning)] - 머신러닝 기초_numpy 활용하기 2024.02.25 - [머신러닝(Machine Learning)] - 머신러닝 기초_pandas, matplotlib.pyplot .. 2024. 2. 28. 머신러닝 이론 선형회귀모델: Ridge, Lasso, Elastic Net 안녕하세요 블레이즈 테크노트 블레이즈 입니다. 선형 회귀 모델의 기본 선형 회귀(Linear Regression) 모델은 데이터 사이의 선형적인 관계를 모델링하는 통계적 방법입니다. 이 모델은 독립 변수(X)와 종속 변수(Y) 사이의 관계를 선형 방정식으로 표현합니다. 가장 기본적인 형태인 단순 선형 회귀는 하나의 독립 변수를 사용하여 종속 변수의 값을 예측하는데, 이는 다음과 같은 수식으로 표현됩니다: Y=β0+β1X+ϵY=β0+β1X+ϵ 여기서, Y는 예측하고자 하는 변수, X는 예측에 사용되는 변수, β0은 절편, β1은 기울기(독립 변수가 종속 변수에 미치는 영향의 크기), 그리고 ϵ은 오차 항을 나타냅니다. 보통 단순 선형 회귀 모형의 수식은 다음과 같습니다. 운전 거리와 타이어 마모 정도 .. 2024. 2. 26. 머신러닝 기초_pandas, matplotlib.pyplot 활용하기 안녕하세요 블레이즈 테크노트 블레이즈 입니다. 오늘은 pandas 라이브러리를 사용하여 데이터를 다루는 몇 가지 기본적인 방법들을 소개하려고 합니다. 먼저, Colab에서 제공하는 캘리포니아 주택 데이터셋을 pandas로 불러와 보겠습니다 import pandas as pd df = pd.read_csv('./sample_data/california_housing_train.csv') # Data provided by Colab type(df) 이 DataFrame을 numpy 배열로 변환하려면 to_numpy() 메서드를 사용하면 됩니다 numpy_data = df.to_numpy() df.head() 를 활용하면 첫 5줄을 확인할 수 있습니다. 이를 통해 데이터의 생김새를 알 수 있죠. 아래와 같이 .. 2024. 2. 25. 머신러닝 기초_numpy 활용하기 안녕하세요 블레이즈 테크노트 블레이즈 입니다. 오늘은 NumPy를 활용해 다양한 방식으로 숫자 배열을 생성하는 방법에 대해 공유하고자 합니다. 먼저, np.linspace 함수를 사용하는 예시를 살펴보겠습니다. 이 함수는 시작점과 종료점 사이에서 균등한 간격으로 숫자를 생성합니다. 기본적으로, 이 함수는 시작점 1부터 종료점 11까지, 총 50개의 숫자를 선형 간격으로 생성합니다. import numpy as np z = np.linspace(1,11) print(z) 기본 값이 50이라 1부터 11까지 선형간격으로 50개의 숫자를 생성해줍니다. 이어서, np.linspace 함수를 사용해 1부터 11까지 총 11개의 숫자를 생성하고, 이를 활용해 여러 수학 함수의 결과를 탐색해 보겠습니다. x = np.. 2024. 2. 23. NLP BERT 모델 코드 스터디 리뷰 안녕하세요 블레이즈 테크노트 블레이즈 입니다. 지난 포스트에서 BERT 모델에 대해서 살펴봤습니다. BERT는 구글에서 발표한 모델로 자연어 처리에서 높은 성능을 보여 주목받았습니다. https://blazetechnote.tistory.com/35 NLP BERT 모델 이해하기 (1) 트랜스포머로부터 안녕하세요 블레이즈 테크노트 블레이즈 입니다. 자연어 처리 (Natural Language Processing, NLP)는 컴퓨터 과학과 인공 지능의 교차점에 위치한 분야입니다. 컴퓨터가 어떻게 인간의 언어를 이해하고 blazetechnote.tistory.com 오늘은 깃허브에서 BERT 모델의 코드를 공부해보도록 하겠습니다. https://github.com/google-research/bert 가장 .. 2023. 9. 16. NLP BERT 모델 이해하기 (1) 트랜스포머로부터 안녕하세요 블레이즈 테크노트 블레이즈 입니다. 자연어 처리 (Natural Language Processing, NLP)는 컴퓨터 과학과 인공 지능의 교차점에 위치한 분야입니다. 컴퓨터가 어떻게 인간의 언어를 이해하고 처리할 수 있을지에 대한 연구를 한다고 생각하시면 좋을 것 같습니다! BERT의 등장 배경과 필요성 자연어 처리 분야에서는 오랫동안 여러 가지 모델이 개발되어 왔습니다. RNN, LSTM, 그리고 GRU 등 순환 신경망 모델은 문장을 순차적으로 처리하여 문맥을 어느 정도 파악할 수 있었습니다. 하지만 이러한 모델들은 여전히 단어 간의 복잡한 관계나 문맥, 의미 등을 완전히 이해하는 데에는 한계가 있었습니다. 이러한 문제를 해결하기 위해 등장한 것이 Transformer 모델입니다. 트랜스포.. 2023. 9. 10. 2023 서울대학교 컴퓨팅 프론티어 여름학교 안녕하세요 블레이즈 테크노트의 블레이즈 입니다. 2023 서울대학교 컴퓨팅 프론티어 여름학교에 참석했습니다. 관련 홈페이지는 다음과 같습니다. https://summer-school-2023.snu.ac.kr 아래 사진은 행사 타임테이블입니다. POSTECH 박상돈 님의 Uncertainty Learning for Trustworthy and Secure AI 강의를 들었습니다. 인공지능 예측의 불확실성에 대해서 다루는 강의였다고 할 수 있는데요. 구체적으로는 '예측 세트(Prediction Set)'라는 개념을 사용하여 여러 가능한 '라벨(결과)'을 예측하고, 이러한 라벨들의 집합 크기를 통해 예측의 불확실성을 나타내는 방법을 소개합니다. 일정한 오차 범위 내에서 예측을 할 수 있도록 한 모델이라고 설.. 2023. 9. 3. 이전 1 2 3 다음