본문 바로가기

논문스터디

(3)
자연어처리(NLP) 1주차 - 자연어처리(NLP) 개요NLP란?사람이 쓰는 말을 컴퓨터가 이해하고 처리하게 하는 기술예: 챗봇, 번역기, 감정 분석기 등자연어 vs 인공어구분 자연어 (한국어, 영어 등) 인공어 (Python, C 등)생성자연적으로사람이 만듦규칙불규칙 많음규칙적해석모호함명확함처리 난이도어려움 (NLP 도전)쉬움NLP 과정코퍼스(Corpus): 텍스트 데이터 모음전처리: 의미 없는 부분 제거 (예: 특수기호)임베딩: 숫자로 변환모델 적용: 번역, 분류, 생성 등NLP 모델 흐름NLU (이해): 문장 의미 파악 (예: 감정 분석, 질문 응답)NLG (생성): 자연스러운 문장 생성 (예: 챗봇 답변)NLP 발전사1950~: 규칙 기반 → 통계 기반 → 딥러닝 → LLM (GPT, BERT 등)2주차 - 텍스트 전..
[논문리뷰] wav2vec 2.0: A Framework for Self-SupervisedLearning of Speech Representations 해당 논문의 목표는 라벨이 없는 음성 데이터만으로 좋은 음성 인식 모델을 만들고자 함에 있다. 자기지도학습 + 마스킹 + 대조를통한 학습을 통해 적은 라벨로도 높은 성능을 낼 수 있음을 입증하고자 한다. - 배경기존 음성인식 모델은 수천 시간의 라벨링 된 양의 음성데이터가 필요했다.하지만 해당 데이터는 7000개의 언어 중 대부분이 구하기 어려운 상황이다 - 모델 흐름 1.  input 원시음성 (waveform) 이 입력되면 CNN(Convolutional Neural Network) 으로 음성을 백터로 바꾼다  Input: “Hello, how are you?”  -> raw_audio = [0.01, 0.03, -0.02, ..., 0.00]  2. 그중 일부를 마스킹한다  [벡터1] [벡터2] [..
KICS 한국통신학회 동계종합학술발표회 참관후기 2025.2.7 용평리조트에서 진행된 "KICS 한국통신학회 동계종합학술발표회" 를 참관하게 되었습니다 AISE LAB 선배님들이 동계 발표 준비를 위해 CES 참가중에도 숙소에서 밤새도록 논문 작성하시는걸 봤는데,그 결과물을 직접 볼수 있게 되어 영광이었습니다. (저도 하계 때는 꼭 잘 할 수 있도록 열심히 살아야 겠다는 다짐도 했습니다) 선배님들 발표내용을 제 나름대로 메모해 정리해보았습니다. 주제는 다양하게 - 공공기관 문서 자동 번역부터 곤충 분류, 야생동물 탐지, 반도체 불량 예측, 내부자 위협 탐지, 졸음운전 방지 시스템, 이진화 기반 이미지 분류, CLIP·RAG 융합, 그리고 LLM 기반 독거노인 감정 챗봇 등이 있었습니다.종합 AI 연구 발표1. 서론배경최근 인공지능(AI) 기술이 급격히..

728x90