본문 바로가기

ML DL

(4)
9.4 ML History / 과대적합 완화 / 모델저장 뒤 복원 / 콜백 / RELU 1. ML Historyhistory 객체는 딥러닝 모델을 훈련할 때 생성되는 데이터 구조로, 모델 훈련 과정에서의 손실 값(loss)과 정확도(accuracy) 등의 지표를 기록합니다. 이 객체를 통해 훈련이 진행되는 동안 성능이 어떻게 변화하는지 시각화하거나 분석할 수 있습니다. history = model.fit(train_data, train_labels, epochs=10, validation_data=(val_data, val_labels)) print(history.history.keys()) # 훈련 중 기록된 지표들history.history['accuracy']로 에포크별 정확도 값을 확인할 수 있습니다.2. 과대적합 완화과대적합(Overfitting)은 모델이 훈련 데이터에 너무 맞추..
9.3 합성곱 신경망 # 합성곱 신경망 주요 과정 요약1. 데이터셋 로드 및 전처리MNIST, CIFAR-10, 그리고 notMNIST라는 이미지 데이터셋을 사용MNIST: 28x28 픽셀의 손글씨 숫자 이미지로 구성된 데이터셋CIFAR-10: 32x32 픽셀의 컬러 이미지로 구성된 데이터셋으로, 10개의 다양한 물체를 포함notMNIST: A부터 J까지 알파벳의 이미지를 포함한 데이터셋데이터셋을 불러온 후, 이미지를 신경망에 넣기 위해 4차원 배열로 변환(예: (60000, 28, 28, 1)). 또한, 숫자 레이블(예: 0~9)을 원-핫 인코딩으로 변환하여 신경망이 예측할 수 있도록 함2. CNN (Convolutional Neural Network) 모델 구성코드는 Convolutional Neural Network(C..
9.2 Tensorflow # 데이터 타입 조정- 변수(칼럼) 타입 확인: 데이터.dtypes- 변수를 범주형으로 변경:  - 데이터['칼럼명'].astype('category')- 변수를 수치형으로 변경:  - 데이터['칼럼명'].astype('int')  - 데이터['칼럼명'].astype('float')- NA 값의 처리  - NA 갯수 체크: 데이터.isna().sum()  - NA 값 채우기: 데이터['칼럼명'].fillna(특정숫자) # 라이브러리 사용import pandas as pd #파일 읽어오기파일경로 = 'https://raw.githubusercontent.com/blackdew/tensorflow1/master/csv/iris2.csv'아이리스 = pd.read_csv(파일경로)아이리스.head()  # 원..
한국어 자연어 처리(NLP) 한국어 자연어 처리(NLP)에서 조사(은, 는, 이, 가 등)가 중요한 역할을 한다는 점이 핵심이다.조사의 중요성한국어는 어순보다 조사를 활용해 문장 의미를 결정한다.예:"나는 밥을 먹는다.""밥을 나는 먹는다." → 어순이 바뀌어도 의미가 유지됨.반면, "나는"을 "내가"로 바꾸면 의미가 달라질 수 있음.따라서 한국어 NLP에서는 조사 분석이 필수적이다.로그인 시 문맥 분석 (네이버의 예)로그인 과정에서 앞뒤 문맥을 고려한 맞춤형 추천을 제공.사용자의 검색 이력, 이전 활동을 분석해 관련 정보를 제공하는 방식.예:사용자가 "로그인 오류"를 검색하면 관련 해결 방법 추천."아이디 찾기" 검색 후 로그인 시 아이디 자동 추천.4*20 VOCVOC(Voice of Customer) 분석을 위해 4×20 매트..

728x90