일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | ||||||
2 | 3 | 4 | 5 | 6 | 7 | 8 |
9 | 10 | 11 | 12 | 13 | 14 | 15 |
16 | 17 | 18 | 19 | 20 | 21 | 22 |
23 | 24 | 25 | 26 | 27 | 28 |
- Cross Entropy Error
- deep learning
- rag-fusion
- 오차역전파
- 딥러닝
- pdf parsing
- 활성화 함수
- Mean squared error
- leetcode
- 손실함수
- E
- 컴퓨터비전
- 합성곱 신경망
- 데이터 파싱
- nlp
- rag parsing
- visual instruction tuning
- Non-Maximum Suppression
- rrf
- 퍼셉트론
- 이상탐지
- multi-query
- LLM
- 시계열
- LLaVA
- segmentation
- 활성화함수
- Time Series
- computer vision
- anomaly detection
- Today
- Total
목록전체 글 (46)
굴러가는 분석가의 일상
※ 본 게시물에서는 합성곱 연산을 효율적으로 수행하기 위한 im2col에 대해 알아보도록 하겠습니다. 💡 im2col 이해하기CNN은 3차원의 데이터 (주로 이미지)를 학습시켜 특징을 추출하는데 특화되어 있는 신경망입니다. 이에 Spatial 영역의 정보를 잃지 않기 위해 합성곱 연산을 여러 개의 for문과 같이 사용하게 됩니다. 이에 수만 건의 데이터를 처리해야하는 CNN에 적합하지도 않고 효율적이지도 않습니다. 또한 Numpy를 통해서 원소에 접근할 때 for 문을 사용하면, 성능이 떨어지는 단점도 있습니다. 그렇다면, 이러한 문제점을 가진 합성곱 연산은 어떻게 해결해야 할까요? 이에 대한 해결책이 바로 본 게시물의 주제인 im2col입니다. im2col은 다차원의 데이터를 행렬로 변환하여 ..
※ 본 게시물은 MNIST 데이터를 기반으로 합성곱 신경망(CNN)을 구현하도록 해보겠습니다. 앞서 CNN은 크게 아래와 같은 구성 요소로 이루어져있습니다. Convolution Layer(합성곱 층) : 이미지 특성 추출 Pooling Layer(풀링 층) : 이미지의 특성 축약 → 주로 Max-Pooling 사용 Fully Conntected Network Layer(완전연결 신경망) : 추출 및 축약된 특징(=n차원)의 데이터를 1차원의 데이터로 변환하며, Softmax 활성화 함수를 통해 Multi-class 아웃풋 도출 📌 Import Library import torch import torch.nn as nn import torchvision import torchvision.transform..
※ 앞선 포스팅에서는 신경망을 학습할 때, 정확도와 효율을 높일수 있는 다양한 기법에 대해 알아보았습니다. 본 게시물에서는 이미지 인식분야에서 통상적으로 사용되는 Convolutional Nerual Network(CNN)에 대해 알아보도록 하겠습니다. 💡 합성곱 신경망 소개 합성곱 신경망은 이미지 처리 성능이 좋은 인공 신경망 알고리즘 입니다. 합성곱 신경망은 이미지를 분석할 때, 3차원의 Tensor (Weight, Height, RGB)을 통해 표현이 되고, 각각의 픽셀을 하나의 변수로 간주하여 모델링을 하게 됩니다. 이를 기존의 인공 신경망(Neural Network)를 통해 학습한다면, Input Layer와 Hidden Layer의 너무 많은 가중치가 존재하므로, 학습하는데 어려움이 있습니..
문제: Given two strings s and t, return true if t is an anagram of s, and false otherwise. An Anagram is a word or phrase formed by rearranging the letters of a different word or phrase, typically using all the original letters exactly once. Example 1: Input: s = "anagram", t = "nagaram" Output: true Example 2 : Input: s = "rat", t = "car" Output: false Constraints: 1
※ 앞선 포스팅에서는 각 층의 활성화값을 강제적으로 적당히 퍼뜨리도록 하는 방법인 배치정규화에 대해 알아보겠습니다. 본 게시물에서는 오버피팅을 억제하는 방법에 대해 알아보도록 하겠습니다. 더보기 2024.02.06 - [Data Science/DL] - 딥러닝의 학습 #2.3 (배치 정규화) 💡 Over-fitting (과적합) 딥러닝의 핵심은 여러 은닉층과 활성화 함수를 결합하여 비선형 영역을 표현하는 것 입니다. 이에 따라 은닉층 수가 많을수록 데이터 분류가 원활하게 되는 것을 아래 그림과 같이 볼 수 있습니다. 하지만, 은닉층이 많을수록 과적합 문제가 발생하곤 합니다. 오버피팅이란, 신경망이 훈련 데이터에만 지나치게 적응되어 그 외의 데이터에는 제대로 대응하지 못하는 상태를 뜻합니다. 일반적으로 훈..
![](http://i1.daumcdn.net/thumb/C150x150/?fname=https://blog.kakaocdn.net/dn/cEvUuW/btsEtlqQkbS/OkZp3D3Rfxh2pAzrj5YhkK/img.png)
※ 앞선 포스팅에서는 가중치의 초깃값을 적절히 설정하여 분포가 적절히 퍼지는 기법 (Xavier & He 초기화)에 대해서 알아보았습니다. 본 게시물에서는 각 층의 활성화값을 강제적으로 적당히 퍼뜨리도록 하는 방법인 배치정규화에 대해 알아보겠습니다. 더보기 2024.01.16 - [Data Science/DL] - 딥러닝의 학습 #2.2 (가중치 초깃값-Xavier&He) 💡 Gradient Vanishing & Exploding 심층 신경망을 훈련할 때 대표적으로 어려운은 네트워크의 가중치를 일정한 범위에서 유지해야한다는 점 입니다. 역전파 과정에서 초기 부분의 입력층으로 갈수록 기울기가 점차적으로 작이지는 현상을 Gradient Vanishing 커지는 현상을 Gradient Exploding 이라고..
문제 당신은 인사팀 직원으로, 각 직원의 근태를 확인하고자 한다. 당신의 회사는 자율출퇴근제를 실시하기 때문에 각 직원이 정확히 몇 시에 출근하는 것은 중요하지 않고, 총 근로 시간이 몇 분인지가 중요하다. 총 근로 시간이 법정근로시간을 초과하지 않아야 하면서, 회사와 직원 사이에 계약한 시간 이상이어야 하기 때문이다.직원이 하루 동안 근무한 시간은 출근 시각과 퇴근 시각 사이의 시간으로 정의한다. 이 문제에서는 식사 시간 등 근무 외 시간을 근무 시간에서 제외하지 않음에 유의하라. 월요일부터 금요일까지 휴가를 쓰지 않은 직원이 매 요일 언제 출근하고 언제 퇴근했는지가 주어질 때, 이 직원이 5일 동안 총 몇 분을 근무했는지를 구하는 프로그램을 작성하라. 제약조건 직원은 밤을 새서 일하지 않았다. 즉, ..
※ 본 포스팅에서는 알고리즘의 입력을 받는 것에 대해 소개하고자 합니다. 주로 파이썬을 통해 알고리즘 입력을 받을 때, Input()을 사용하지만, 시간초과 에러가 발생하곤 합니다. 이러한 문제점을 방지하고자, sys.stdin.readline()에 대해 알아보겠습니다. 💡 sys.stdin.readline() 특징 ✔️ 문자열로 입력을 받는다. sys.stdin.readline()은 문자열로 입력을 받게 됩니다. 따라서, 읽어온 문자열은 필요에 따라 적절한 처리 및 형 변환을 해주어야합니다. 예를 들어, 숫자를 입력으로 받아야 할 때는 'int()' 혹은 'float()' 함수를 사용하여 적절하게 함수를 사용하여 처리해야합니다. ✔️ 개행 문자 "\n"를 같이 입력받는다. 예를 들어 "Hello Wol..
문제 두 정수 A와 B를 입력받은 다음, A+B를 출력하는 프로그램을 작성하시오. 제약조건 두 정수 A와 B는 1이상 9이하의 정수이다. 입력형식 첫째 줄에 테스트 케이스의 개수 T가 주어진다. 각 테스트 케이스는 한 줄로 이루어져 있으며, 각 줄에 A와 B가 주어진다. 출력형식 각 테스트 케이스마다 "Case #(테스트 케이스 번호): "를 출력한 다음, A+B를 출력한다. 테스트 케이스 번호는 1부터 시작한다. 풀이 import sys t = int(sys.stdin.readline()) for i in range(t): a,b = map(int, sys.stdin.readline().split()) print(f"Case #{i+1}: {a+b}")
https://softeer.ai/practice/6253 Softeer - 현대자동차그룹 SW인재확보플랫폼 softeer.ai 문제 두 차량 A와 B의 주행거리가 자연수로 주어졌을 때, 주행거리를 비교해서 어느 차량의 주행거리가 더 큰지 알아보자. 제약조건 0 ≤ A,B ≤ 100,000 입력형식 첫째줄에 두차량 A,B의 주행거리가 한칸의 공백을 두고 주어진다. 출력형식 주행거리를 비교해서 첫째줄에 아래의 글자를 출력한다. - A가 B 보다 큰 경우 A를 출력한다. - A가 B 보다 작은 경우 B를 출력한다. - A와 B의 주행거리가 같은 경우 same을 출력한다. 풀이 import sys input = sys.stdin.readline A,B = map(int, input().split()) if ..