본문 바로가기

전체 글

(78)

딥러닝 개념 딥러닝 개념1. 손실 함수 (Loss Function)손실 함수(Loss) 는 모델의 예측값과 실제 정답의 차이를 수치로 나타냄예: L = f(p) (L은 손실 값, p는 예측 결과)L은 스칼라값 (즉, 하나의 수)p는 스칼라/벡터/행렬 등 다양할 수 있음손실 함수는 작을수록 좋다!손실을 줄이는 것이 모델 학습의 목표분류 문제에서는 크로스 엔트로피(Cross Entropy) 를 주로 사용2. 경사 하강법 (Gradient Descent)손실 값을 가장 작게 만드는 가중치(weight) 를 찾기 위한 알고리즘손실 함수의 기울기(경사) 를 따라 가중치를 조금씩 바꿔감러닝레이트 (learning rate 또는 alpha)한 번에 이동하는 거리 (step size)너무 작으면: 학습이 느림너무 크면: 최소점을 ..

인공신경망 MLP,CNN 1. 신경망(Neural Network) 학습 과정신경망은 입력 → 출력을 매핑해주는 모델로, 학습은 예측값과 실제값의 차이(=오차)를 줄이는 과정이때 중요한 역할을 하는 게 손실 함수 (Loss Function)!2. 손실 함수 (Loss Function)예측값과 실제 정답 사이의 차이를 수치로 나타냄손실 함수 값이 작을수록 모델이 잘 맞췄다는 뜻분류 문제에서는 크로스 엔트로피 (Cross Entropy) 가 대표적:예측 확률 분포와 실제 정답(원-핫 벡터) 분포의 차이를 측정정답 클래스에 높은 확률을 줄수록 손실이 작아짐3. 최적화 함수 (Optimizer)손실 값을 줄이기 위해 가중치(weight) 를 업데이트하는 도구대표적인 알고리즘:SGD (Stochastic Gradient Descent)..

CIFAR-10로 CNN 이미지 분류 # 필요한 라이브러리 불러오기import torch # 딥러닝 기본 라이브러리from torch import nn # 신경망을 쉽게 만들 수 있는 도구from torch.utils.data import DataLoader # 데이터를 배치(batch) 단위로 불러오는 도구import torchvision # 이미지 데이터셋 관련 도구 모음from torchvision import datasets, transformsimport matplotlib.pyplot as plt # 그래프 그릴 때 사용import numpy as np # 수학 계산을 쉽게 해주는 도구# GPU가 가능하..

CNN(Convolutional Neural Network) CNN(Convolutional Neural Network)1. CNN 개요CNN(Convolutional Neural Network)은 이미지 데이터 처리에 특화된 딥러닝 모델로, 특징 추출(Feature Extraction)과 분류(Classification)를 자동으로 수행할 수 있다.(1) CNN의 주요 구성 요소Convolution Layer (컨볼루션 레이어) → 이미지 특징 추출Activation Function (비선형 활성화 함수, 주로 ReLU) → 비선형성 부여Pooling Layer (풀링 레이어) → 차원 축소, 중요한 정보 유지Fully Connected Layer (완전 연결층) → 최종 분류2. 컨볼루션 연산 (Convolution Operation)(1) 컨볼루션 필터(3×..

지표 설계 및 데이터 분석 프로세스 지표 설계 및 데이터 분석 프로세스 정리1. 지표 설계 (Metric Design)지표는 비즈니스 목표를 정량적으로 측정하는 도구로, 팀별로 서로 다른 관점을 가짐.(1) 지표 설계 프로세스비즈니스 목표 정의주요 KPI(Key Performance Indicator) 설정예: MAU(월간 활성 사용자), 전환율, 이탈률SQL 테이블 구축데이터 마트(Data Mart) 설계 및 구축테이블 구조 정의: 트랜잭션 데이터, 유저 로그, 광고 효과 등데이터 시각화대시보드 설계 및 개발 (Tableau, Power BI)다양한 부서에서 해석할 수 있도록 가독성 높이기분석 및 보고PM/마케터와 협업: 회의 참석하여 데이터 기반 의사결정 지원분석 보고서 작성: 대시보드 변화에 대한 해석 및 원인 분석2. SQL 기반 ..

비선형 함수(Nonlinear Function)의 필요성 비선형 함수(Nonlinear Function)의 필요성 정리1. 선형 함수 vs 비선형 함수선형 함수(Linear Function): 직선의 형태로 데이터를 분리 가능비선형 함수(Nonlinear Function): 곡선을 활용하여 복잡한 패턴을 표현 가능(1) 선형 함수만 사용하면 발생하는 문제뉴럴 네트워크에서 선형 변환(행렬 곱셈)만 계속하면 결국 하나의 선형 변환으로 축소됨예: 3개 레이어 중 중간 레이어가 사라지는 효과 발생즉, 딥러닝(Deep Learning)이 아닌 단순한 선형 모델(Linear Model)이 되어버림(2) 딥러닝에서 비선형 함수의 필요성뉴런(Neuron) 수가 많아질수록 모델 성능이 향상됨비선형 활성화 함수(Activation Function)를 추가하면 레이어의 역할이 유..

빅데이터 산업 이해 빅데이터 산업 이해 1. 빅데이터 개요빅데이터(Big Data)는 대량의 데이터를 효율적으로 저장, 처리, 분석하여 가치 있는 정보를 도출하는 기술이다.빅데이터 산업에서는 데이터를 다루는 플랫폼, 에코시스템, 서비스 프레임워크가 중요한 요소로 작용한다.2. 빅데이터 플랫폼과 에코시스템(1) 빅데이터 플랫폼하둡(Hadoop)대용량 데이터를 병렬 처리할 수 있는 대표적인 오픈소스 플랫폼데이터 저장(HDFS) + 분산처리(MapReduce) 기반확장성 및 시각화 기능 지원(2) 빅데이터 에코시스템빅데이터 기술과 서비스를 구성하는 다양한 소프트웨어 및 인프라데이터 저장, 처리, 분석을 위한 다양한 오픈소스 및 상용 솔루션 포함(3) 빅데이터 서비스 프레임워크빅데이터 서비스를 효율적으로 이해하고, 서비스 공급자를..

Pandas: 데이터 분석 라이브러리 정리 Pandas: 데이터 분석 라이브러리 정리1. Pandas 개요Pandas는 데이터 분석을 위한 Python 라이브러리로, NumPy 기반에서 동작하며, Series 객체와 DataFrame 객체를 활용하여 데이터를 효율적으로 다룰 수 있다.NumPy와의 관계NumPy: 배열 연산을 위한 라이브러리 (고속 연산 가능)Pandas: 데이터 분석을 위한 라이브러리 (테이블 형태의 데이터 처리)2. Pandas의 주요 객체(1) Series 객체각 열(column)을 다루는 객체 (세로 방향)NumPy 배열의 하위 클래스이며, 데이터 인덱스를 포함함Feature Vector(피처 벡터)와 유사한 개념인덱스(index) 값은 중복 가능하며, 정렬될 필요 없음Series 객체 생성 예제import pandas a..

이전 1 2 3 4 5 6 ··· 10 다음

728x90

티스토리툴바