본문 바로가기

머신러닝10

머신러닝 기초_pandas, matplotlib.pyplot 활용하기 안녕하세요 블레이즈 테크노트 블레이즈 입니다. 오늘은 pandas 라이브러리를 사용하여 데이터를 다루는 몇 가지 기본적인 방법들을 소개하려고 합니다. 먼저, Colab에서 제공하는 캘리포니아 주택 데이터셋을 pandas로 불러와 보겠습니다 import pandas as pd df = pd.read_csv('./sample_data/california_housing_train.csv') # Data provided by Colab type(df) 이 DataFrame을 numpy 배열로 변환하려면 to_numpy() 메서드를 사용하면 됩니다 numpy_data = df.to_numpy() df.head() 를 활용하면 첫 5줄을 확인할 수 있습니다. 이를 통해 데이터의 생김새를 알 수 있죠. 아래와 같이 .. 2024. 2. 25.
머신러닝 기초_numpy 활용하기 안녕하세요 블레이즈 테크노트 블레이즈 입니다. 오늘은 NumPy를 활용해 다양한 방식으로 숫자 배열을 생성하는 방법에 대해 공유하고자 합니다. 먼저, np.linspace 함수를 사용하는 예시를 살펴보겠습니다. 이 함수는 시작점과 종료점 사이에서 균등한 간격으로 숫자를 생성합니다. 기본적으로, 이 함수는 시작점 1부터 종료점 11까지, 총 50개의 숫자를 선형 간격으로 생성합니다. import numpy as np z = np.linspace(1,11) print(z) 기본 값이 50이라 1부터 11까지 선형간격으로 50개의 숫자를 생성해줍니다. 이어서, np.linspace 함수를 사용해 1부터 11까지 총 11개의 숫자를 생성하고, 이를 활용해 여러 수학 함수의 결과를 탐색해 보겠습니다. x = np.. 2024. 2. 23.
서울대학교 이정혜 교수님 연구실 손호원 연구원 연구 소개 안녕하세요 블레이즈 테크노트의 블레이즈 입니다. 오늘은 머신러닝 및 딥러닝 강의를 듣고 그 내용을 소개해보겠습니다. 제가 수업을 듣고 있는 이정혜 교수님의 연구실에서 진행한 프로젝트를 손호원 연구원님이 소개해주셨습니다. 아래는 이정혜교수님과 연구실 홈페이지입니다. https://temep.snu.ac.kr/?cid=about/faculty/professors&mode=view&profidx=19 이정혜 - 전임교수 - 교수진 - 전공소개 - 서울대학교 대학원 협동과정 기술경영경제정책전공 Machine Learning & Deep LearningPrivacy-preserving Federated LearningSmart HealthcareSmart ManufacturingData Analytics for .. 2023. 12. 7.
NLP 트랜스포머 다섯 번째, 여러 종류의 멀티헤드 어텐션과 피드 포워드 네트워크 FFN 안녕하세요 블레이즈 테크노트 블레이즈 입니다. 지난 포스팅 트랜스포머 네 번째, 멀티헤드 어텐션 알아보기에서 멀티 헤드 어텐션의 개념에 대해서 살펴보았습니다. https://blazetechnote.tistory.com/24 NLP 트랜스포머 네 번째, 멀티 헤드 어텐션 Multi-Head Attention 알아보기 안녕하세요 블레이즈 테크노트 블레이즈 입니다. 지난 포스팅 트랜스포머 세 번째, 셀프 어텐션 알아보기에서 셀프 어텐션에 대한 기본적인 구조를 알아봤습니다. NLP 트랜스포머 세 번째, 셀프 blazetechnote.tistory.com 이번 포스팅은 트랜스포머 모델에서 사용되는 3종류의 멀티 헤드 어텐션을 살펴보고 어텐션 층 다음에 이어지는 피드 포워드 네트워크 (Feed Forward Ne.. 2023. 8. 26.
NLP 트랜스포머 코드 스터디 리뷰 transformer_layers.py 안녕하세요 블레이즈 테크노트 블레이즈 입니다. 블레이즈 테크노트의 트랜스포머 시리즈는 계속되고 있습니다. 트랜스포머 논문을 리뷰하면서 개념을 먼저 살펴봤습니다. Attention is all you need 가 구글에서 발표한 논문인만큼 이 논문에서 사용된 코드가 tensorflow 공식으로 등록되어 있습니다. 그래서 저는 이 코드 중에서 가장 핵심 내용을 담고 있는 transformer.py를 리뷰했습니다. 하지만 이를 보다 보니 임포트하고 있는 모듈에 대한 이해가 필요할 것 같았습니다. 그래서 오늘 살펴볼 코드는 transformer_layers.py 입니다. 오늘은 그 중에서도 transformer_layers.py 를 함께 살펴보겠습니다. https://github.com/tensorflow/te.. 2023. 8. 23.
NLP 트랜스포머 코드 스터디 리뷰 (3) transformer.py 안녕하세요 블레이즈 테크노트 블레이즈 입니다. 지난 2개의 포스팅에서 Attention is all you need 논문의 코드 중 transformer.py 의 앞부분을 살펴봤습니다. https://blazetechnote.tistory.com/27 NLP 트랜스포머 코드 스터디 리뷰 (1) transformer.py 안녕하세요 블레이즈 테크노트 블레이즈 입니다. 트랜스포머 논문에 대해서는, 제가 지난 여러 포스팅에서 설명했습니다. 어텐션메커니즘1 어텐션메커니즘2 트랜스포머_포지셔널인코딩 트랜스 blazetechnote.tistory.com https://blazetechnote.tistory.com/28 NLP 트랜스포머 코드 스터디 리뷰 (2) transformer.py 안녕하세요 블레이즈 테크노트.. 2023. 8. 21.
NLP 트랜스포머 코드 스터디 리뷰 (2) transformer.py 안녕하세요 블레이즈 테크노트 블레이즈 입니다. 지난 포스팅에서 Attention is all you need 논문의 코드 중 transformer.py 의 앞부분을 살펴봤습니다. 이번 포스팅에서는 transformer.py의 뒷부분을 살펴보도록 하겠습니다. 원 코드는 아래의 링크를 통해 확인해보세요. https://github.com/tensorflow/tensor2tensor/blob/master/tensor2tensor/models/transformer.py @registry.register_model class TransformerScorer(Transformer): """Transformer model, but only scores in PREDICT mode. Checkpoints between.. 2023. 8. 19.
NLP 트랜스포머 코드 스터디 리뷰 (1) transformer.py 안녕하세요 블레이즈 테크노트 블레이즈 입니다. 트랜스포머 논문에 대해서는, 제가 지난 여러 포스팅에서 설명했습니다. 어텐션메커니즘1 어텐션메커니즘2 트랜스포머_포지셔널인코딩 트랜스포머_셀프어텐션 트랜스포머_멀티헤드어텐션 다시 짚고 넘어가자면 NLP 자연어 처리에서 아주 혁신적인 개념이었죠. Attention is all you need 가 구글에서 발표한 논문인만큼 이 논문에서 사용된 코드가 tensorflow 공식으로 등록되어 있습니다. 아래는 그 코드의 내용입니다. https://github.com/tensorflow/tensor2tensor GitHub - tensorflow/tensor2tensor: Library of deep learning models and datasets designed .. 2023. 8. 18.
NLP 시퀀스 투 시퀀스 신경망 기계 번역 모델(Seq2Seq Neural Machine Translation) 기초 안녕하세요 블레이즈 테크 노트의 블레이즈 입니다. 지난 포스트에서 RNN 순환 신경망을 공부했습니다. 이번에는 RNN을 활용한 시퀀스 투 시퀀스 신경망 기계 번역 모델에 대해서 알아보고자 합니다. https://blazetechnote.tistory.com/entry/%EB%A8%B8%EC%8B%A0%EB%9F%AC%EB%8B%9DML-Recurrent-Neural-Network-%EA%B8%B0%EC%B4%88 머신러닝(ML) Recurrent Neural Network 기초 https://youtu.be/UNmqTiOnRfg 순환 신경망에 대해서 아주 쉽게 설명한 영상입니다. 특히 내가 원하는 정보를 벡터로 변환하는 걸 잘 보여준다고 생각합니다. 영상에서 요리사는 애플파이, 햄버거, 치킨 blazet.. 2023. 7. 11.
머신러닝(ML) 순환신경망(Recurrent Neural Network) 기초 안녕하세요 블레이즈 테크노트의 블레이즈입니다. 오늘은 순환신경망(Recurrent Neural Network)에 대해 간단히 알아보도록 하겠습니다. 앞으로는 순환신경망이라는 단어와 RNN을 혼용할 예정이니 참고해주세요:) 순환 신경망에 대해서 아주 쉽게 설명한 영상입니다. 특히 내가 원하는 정보를 벡터로 변환하는 걸 잘 보여준다고 생각합니다. 영상에서 요리사는 애플파이, 햄버거, 치킨을 만드는데요 이 각각의 요리를 [100] [010] [001] 벡터로 표현하고 결국 행렬곱으로 문제를 풀 수 있다는 걸 보여줍니다. 순환 신경망에서 핵심적인 부분은 output이 다시 input으로 들어간다는 점입니다. 이게 바로 순환의 핵심인데요. 예를 들어, 영상에서는 요리사가 애플파이와 햄버거, 치킨을 순서대로 만들죠.. 2023. 7. 10.