전체 글 (77) 썸네일형 리스트형 빅데이터 개념 및 정보통신기술 패러다임 변화 1. 빅데이터 개념과 특징(1) 데이터의 양적 팽창 → 데이터 가공 및 분석 → 새로운 가치 창출정보통신기술(ICT)의 발전으로 인해 데이터가 폭발적으로 증가단순한 데이터 축적이 아닌 가공 및 분석을 통해 인사이트를 도출하고, 이를 활용해 비즈니스 및 사회적 가치를 창출(2) 정형화 정도에 따른 데이터 분류데이터 유형 특징정형 데이터 (Structured Data)- 행(row)과 열(column)로 구성된 고정된 구조의 데이터- 기존의 관계형 데이터베이스(RDBMS)에서 쉽게 저장 및 관리 가능- 예: 엑셀 파일, SQL 데이터베이스, ERP 시스템의 데이터반정형 데이터 (Semi-structured Data)- 고정된 스키마는 없지만, 일부 구조화된 형식이 존재- 태그 또는 메타데이터를 포함하여 데이.. LEETCODE SQL : Group by 1. Queries Quality and Percentage 문제 정리문제 설명Queries 테이블에서 query_name별로 데이터를 그룹화하고, 다음 값을 구해야 함.quality: (rating / position) 값의 평균poor_query_percentage: rating 결과는 소수점 두 자리까지 반올림SQL 코드SELECT query_name, ROUND(AVG(rating / position), 2) AS quality, ROUND(SUM(CASE WHEN rating 예제 설명 quality 계산: ((5/1) + (5/2) + (1/200)) / 3 = 2.50poor_query_percentage 계산: (1/3) * 100 = 33.332. Daily Leads and Par.. LEETCODE : SQL - JOIN 1. Product Sales Analysis I🔗 문제 링크: Product Sales Analysis I문제 개요Sales 테이블에는 제품 판매 정보가 저장되어 있음.Product 테이블에는 product_id와 해당 제품명이 저장되어 있음.각 sale_id에 대해 제품명(product_name), 연도(year), 가격(price)을 출력해야 함.결과 순서는 중요하지 않음.해결 방법product_id를 기준으로 INNER JOIN을 사용하여 Sales와 Product를 연결.필요한 컬럼만 선택하여 출력.SELECT p.product_name, s.year, s.priceFROM Sales AS sINNER JOIN Product AS pON s.product_id = p.product_id;.. 시간 복잡도 표기법과 알고리즘, 하노이탑 1. 시간 복잡도 표기법시간 복잡도는 알고리즘의 실행 시간이 입력 크기에 따라 어떻게 변화하는지를 나타내는 개념이다. 대표적으로 빅오(Big-O), 빅세타(Big-Theta), 빅오메가(Big-Omega) 표기법이 사용된다.1.1 빅오(Big-O) 표기법최악의 경우 시간 복잡도를 나타냄.알고리즘의 실행 시간이 가장 오래 걸리는 경우를 기준으로 평가.입력 크기 n이 커질수록 성능이 어떻게 변하는지를 분석.상한선(Upper Bound)을 나타냄.예제선형 탐색(순차 탐색) → O(N)선택 정렬 → O(N²)이진 탐색 → O(log N)퀵 정렬(평균) → O(N log N), 최악 → O(N²)1.2 빅세타(Big-Theta, Θ) 표기법평균적인 경우 시간 복잡도를 나타냄.최선과 최악의 경우를 포함하여 입력 크.. 딥러닝 이전의 영상 인식 및 딥러닝 기반 기술 1. 딥러닝 이전의 영상 인식 기술1.1 비올라-존스 얼굴 검출 (Viola-Jones Face Detection, 2001)단순한 필터를 여러 개 사용하여 얼굴을 검출하는 기법Haar-like Feature를 활용해 얼굴 특징을 빠르게 찾고, AdaBoost 알고리즘으로 중요한 특징을 선별하여 검출 속도를 높임Cascade 구조를 사용하여 단계적으로 검출 정확도를 높임실시간 얼굴 검출이 가능해졌으며, 컴퓨터 비전 분야에서 중요한 논문으로 평가됨1.2 Building Rome in a Day (2009)2D 이미지(사진)를 활용하여 3D 모델을 생성하는 연구관광객들이 찍은 다양한 각도의 사진을 활용해 3D 재구성 가능성을 제시이미지 calibration을 통해 동일한 객체의 공통 포인트를 이어서 3D 모.. 자료구조와 알고리즘 1. 추상자료형(Abstract Data Type, ADT)데이터와 해당 데이터에 수행할 수 있는 연산을 정의하지만, 구현 방법은 명시하지 않음.예시: 가방(Bag)의 추상자료형데이터: 중복 허용, 순서 없음, 비교 가능연산:def contains(bag, e): # 특정 요소가 존재하는지 확인 return e in bagdef insert(bag, e): # 요소 추가 bag.append(e)def remove(bag, e): # 요소 삭제 bag.remove(e)2. 알고리즘 성능 분석(1) 실행 시간 측정실제 실행 시간 측정→ time 모듈을 이용하여 실행 시간을 측정할 수 있음.import timedef example(): start = time.time() # 시작 .. STACK과 FLOW의 차이 STACK과 FLOW의 차이1. STACK과 FLOW 개념STACK (누적 지표)시간에 따라 데이터가 쌓이는 방식총합을 기반으로 분석 (예: 누적 가입자 수, 총 매출)장기적인 트렌드 파악에 유용하지만, 변화 감지가 어려울 수 있음FLOW (흐름 지표)특정 기간 동안의 변화를 측정하는 방식예: 일일/주간/월간 신규 가입자 수, 매출 증가율변화 감지와 빠른 피드백 루프 형성에 유리함2. 지표 기준의 중요성동일한 기준을 유지해야 함분석 시 기준이 다르면 잘못된 인사이트 도출 가능예: 런던 항공권을 산 사용자가 파리 호텔을 예약한 경우 → 크로스셀로 볼 것인가?크로스셀 측정 기준 정의 필요특정 상품을 구매한 후 다른 상품을 구매한 비율업계/도메인별로 최적의 방법론을 적용해야 함팀 간 합의를 통해 전사적 기준을.. 그로스 조직 만들기 그로스 조직 만들기1. 그로스 조직의 필요성단순한 개인의 역할이 아니라 조직적으로 운영되어야 효과적임그로스 팀은 있지만, 해커(개인의 역량만으로 해결하는 사람)는 없음조직적으로 목표를 설정하고, 팀을 구성하여 지속적으로 성장 주도2. 조직 구성 및 운영(1) 목표 설정핵심 지표의 개선을 목표로 설정핵심 지표 정의 및 측정 (예: MAU, Retention, CAC, LTV 등)가설 - 실행 - 검증을 통한 반복적 개선 (Iteration)핵심 지표의 가시적 개선을 통한 성장 DNA 전파(2) 팀 구성각 분야의 전문가(Pro)로 구성된 팀 필요리포팅 라인 명확화: 조직 내에서 그로스 팀이 누구에게 보고하고 의사결정을 받을지 결정전담 인력 배치: 그로스 업무만을 전담할 팀원이 필요협업 구조 정의: 다른 조직.. 이전 1 2 3 4 5 6 7 ··· 10 다음