본문 바로가기

인공지능 대학원

(21)
인공신경망 MLP,CNN 1.  신경망(Neural Network) 학습 과정신경망은 입력 → 출력을 매핑해주는 모델로, 학습은 예측값과 실제값의 차이(=오차)를 줄이는 과정이때 중요한 역할을 하는 게 손실 함수 (Loss Function)!2.  손실 함수 (Loss Function)예측값과 실제 정답 사이의 차이를 수치로 나타냄손실 함수 값이 작을수록 모델이 잘 맞췄다는 뜻분류 문제에서는 크로스 엔트로피 (Cross Entropy) 가 대표적:예측 확률 분포와 실제 정답(원-핫 벡터) 분포의 차이를 측정정답 클래스에 높은 확률을 줄수록 손실이 작아짐3. 최적화 함수 (Optimizer)손실 값을 줄이기 위해 가중치(weight) 를 업데이트하는 도구대표적인 알고리즘:SGD (Stochastic Gradient Descent)..
CIFAR-10로 CNN 이미지 분류 # 필요한 라이브러리 불러오기import torch # 딥러닝 기본 라이브러리from torch import nn # 신경망을 쉽게 만들 수 있는 도구from torch.utils.data import DataLoader # 데이터를 배치(batch) 단위로 불러오는 도구import torchvision # 이미지 데이터셋 관련 도구 모음from torchvision import datasets, transformsimport matplotlib.pyplot as plt # 그래프 그릴 때 사용import numpy as np # 수학 계산을 쉽게 해주는 도구# GPU가 가능하..
CNN(Convolutional Neural Network) CNN(Convolutional Neural Network)1. CNN 개요CNN(Convolutional Neural Network)은 이미지 데이터 처리에 특화된 딥러닝 모델로, 특징 추출(Feature Extraction)과 분류(Classification)를 자동으로 수행할 수 있다.(1) CNN의 주요 구성 요소Convolution Layer (컨볼루션 레이어) → 이미지 특징 추출Activation Function (비선형 활성화 함수, 주로 ReLU) → 비선형성 부여Pooling Layer (풀링 레이어) → 차원 축소, 중요한 정보 유지Fully Connected Layer (완전 연결층) → 최종 분류2. 컨볼루션 연산 (Convolution Operation)(1) 컨볼루션 필터(3×..
비선형 함수(Nonlinear Function)의 필요성 비선형 함수(Nonlinear Function)의 필요성 정리1. 선형 함수 vs 비선형 함수선형 함수(Linear Function): 직선의 형태로 데이터를 분리 가능비선형 함수(Nonlinear Function): 곡선을 활용하여 복잡한 패턴을 표현 가능(1) 선형 함수만 사용하면 발생하는 문제뉴럴 네트워크에서 선형 변환(행렬 곱셈)만 계속하면 결국 하나의 선형 변환으로 축소됨예: 3개 레이어 중 중간 레이어가 사라지는 효과 발생즉, 딥러닝(Deep Learning)이 아닌 단순한 선형 모델(Linear Model)이 되어버림(2) 딥러닝에서 비선형 함수의 필요성뉴런(Neuron) 수가 많아질수록 모델 성능이 향상됨비선형 활성화 함수(Activation Function)를 추가하면 레이어의 역할이 유..
빅데이터 산업 이해 빅데이터 산업 이해 1. 빅데이터 개요빅데이터(Big Data)는 대량의 데이터를 효율적으로 저장, 처리, 분석하여 가치 있는 정보를 도출하는 기술이다.빅데이터 산업에서는 데이터를 다루는 플랫폼, 에코시스템, 서비스 프레임워크가 중요한 요소로 작용한다.2. 빅데이터 플랫폼과 에코시스템(1) 빅데이터 플랫폼하둡(Hadoop)대용량 데이터를 병렬 처리할 수 있는 대표적인 오픈소스 플랫폼데이터 저장(HDFS) + 분산처리(MapReduce) 기반확장성 및 시각화 기능 지원(2) 빅데이터 에코시스템빅데이터 기술과 서비스를 구성하는 다양한 소프트웨어 및 인프라데이터 저장, 처리, 분석을 위한 다양한 오픈소스 및 상용 솔루션 포함(3) 빅데이터 서비스 프레임워크빅데이터 서비스를 효율적으로 이해하고, 서비스 공급자를..
Pandas: 데이터 분석 라이브러리 정리 Pandas: 데이터 분석 라이브러리 정리1. Pandas 개요Pandas는 데이터 분석을 위한 Python 라이브러리로, NumPy 기반에서 동작하며, Series 객체와 DataFrame 객체를 활용하여 데이터를 효율적으로 다룰 수 있다.NumPy와의 관계NumPy: 배열 연산을 위한 라이브러리 (고속 연산 가능)Pandas: 데이터 분석을 위한 라이브러리 (테이블 형태의 데이터 처리)2. Pandas의 주요 객체(1) Series 객체각 열(column)을 다루는 객체 (세로 방향)NumPy 배열의 하위 클래스이며, 데이터 인덱스를 포함함Feature Vector(피처 벡터)와 유사한 개념인덱스(index) 값은 중복 가능하며, 정렬될 필요 없음Series 객체 생성 예제import pandas a..
python 연산자 및 제어문 1. 변수와 예약어변수: 값을 저장하는 참조자 또는 포인터 역할예약어(키워드): 변수로 활용할 수 없는 단어2. 리터럴과 자료형리터럴: 코드에서 직접 값을 표현하는 것주요 자료형: int, float, str, bool, list, tuple, set, dict3. 연산자//: 나눈 값의 몫 반환%: 나눈 값의 나머지 반환관계 연산자: , >, , >=, !=논리 연산자: or (||), and (&&), not (!)in, not in: 특정 값이 존재하는지 확인 (if문에서 사용 가능)4. 함수 호출과 입출력 함수내장 함수 예시: sum()함수 호출 방법: 함수명(인수)키보드 입력 함수: input()int()/float(): 입력값을 숫자로 변환5. 조건문if, else, elif 사용하여 분기 처..
빅데이터 개념 및 정보통신기술 패러다임 변화 1. 빅데이터 개념과 특징(1) 데이터의 양적 팽창 → 데이터 가공 및 분석 → 새로운 가치 창출정보통신기술(ICT)의 발전으로 인해 데이터가 폭발적으로 증가단순한 데이터 축적이 아닌 가공 및 분석을 통해 인사이트를 도출하고, 이를 활용해 비즈니스 및 사회적 가치를 창출(2) 정형화 정도에 따른 데이터 분류데이터 유형 특징정형 데이터 (Structured Data)- 행(row)과 열(column)로 구성된 고정된 구조의 데이터- 기존의 관계형 데이터베이스(RDBMS)에서 쉽게 저장 및 관리 가능- 예: 엑셀 파일, SQL 데이터베이스, ERP 시스템의 데이터반정형 데이터 (Semi-structured Data)- 고정된 스키마는 없지만, 일부 구조화된 형식이 존재- 태그 또는 메타데이터를 포함하여 데이..

728x90