분류 전체보기
[모델 계산량] FLOPs 계산하는 방법 (How to calculate model FLOPs?)
임베디드 환경에 딥러닝 모델을 올리는 것을 " 포팅(Porting) " 이라고 한다. 포팅할 때 가장 중요한 것은, 해당 모델 FLOPs를 고려해야한다는 것이다. 예를 들어 Ambarella사의 CV22에 딥러닝 모델을 포팅하기 위해서는 최대 3~4 GFLOPs가 허용치이다. FLOPs가 포팅에 절대적인 기준은 아니지만, 엄청 중요한 기준이 된다는 것은 확실하다. 그러므로 우리는 FLOPs를 자체적으로 계산할 줄 알아야한다. 그래서!!! 아래 내용을 한 문장으로 먼저 요약하자면... pthflops를 사용 하면 된다! " pthflops " install 하기 https://github.com/1adrianb/pytorch-estimate-flops GitHub - 1adrianb/pytorch-esti..
[Ubuntu] 'started user Manager for UID 121' 메시지 + 부팅 안될 때 해결 방법
출근해서 여느때와 같이 사내 Ubuntu 18.04 서버컴퓨터를 키고 신문 읽고 있었는데,,, 화면이 여기서 안넘어가는 것이 아닌가... 그래서 해결방법을 찾았다..... 아래 내용을 한 문장으로 요약하자면, 복구모드로 들어가서 용량 큰 파일을 지우고 다시 시작 하면 된다! 나는 본래에 내가 쓰던 컴퓨터가 아니라 휴직계 선배 컴퓨터를 인계 받은 거라서 .. 섯불리 용량 큰걸 지우기가 부담스러웠음... 그래서, 용량 확인 후에 얼만큼 부족한지 확인하고 먼저 휴지통부터 비우고자 했다. 복구모드 진입하기 저 화면에서 art + F3 를 누르면 복구모드로 들어간다. 안들어가진다면 컴퓨터 전원버튼 꾹 눌러 재시작 하면서 art + F3를 계속 누르고 있으면 들어가질 것임. 전체 남은 용량 확인하기 # GB 단위로..
[모델 계산량] FLOPS, FLOPs 개념 및 차이점
딥러닝에서 모델 계산량(FLOPS, FLOPs) 은 모델이 얼마나 연산량이 많은지, 얼마나 효율적인지를 나타내는 지표임. 아래 내용을 한 문장으로 요약하자면, FLOPS is a unit of speed. FLOPs is a unit of amount. FLOPs (FLoating point OPerations) 기억하기 위한 키워드 : " 연 산 량 " 실제 계산량을 나타내는 단위 ex) 모델 A vs 모델 B 비교 중이라면, FLOPs가 큰 모델일수록 많은 연산량 요구 = 모델의 결과(output) 생성이 느릴 가능성 ▲ ex) 클라우드 환경에서 큰 FLOPs의 모델을 계속 학습한다면, 비용 증가 가능성 ▲ 모델 전체가 얼마나 많은 floating point(부동 소수점)을 연산하는지를 나타내는 지표..
[Pytorch] 제공된 데이터 불러오는 방법 (feat. CIFAR10)
Pytorch에는 여러 데이터를 제공합니다. (mnist, cirfar... 등등) 그래서 파이토치에서 제공하는 데이터들을 불러와서 전처리하는 시퀀스가 어떻게 되는지에 대한 숲과 나무를 보는 포스팅을 하고자합니다. 여러 데이터들 중에서 CIFAR10을 불러오는 코드를 하나하나 분석하면서 실습 하겠습니다. 현업에서는 이렇게 정제되어있는 데이터셋을 사용하지 않고 커스텀 데이터 셋을 사용하지만, 일련의 시퀀스를 경험한 뒤에 커스텀 데이터 셋을 load하고 변환시키는 것이 효율적인 학습 방법이라고 생각합니다. 전체코드 import torch import torchvision import torchvision.transforms as tr from torch.utils.data import DataLoader, ..
[이코테] 3. 그리디 알고리즘 - 모험가 길드
그리디 알고리즘 - 모험가 길드 문제 설명 한 마을에 모험가가 N명 있습니다. 모험가 길드에서는 N명의 모험가를 대상으로 '공포도'를 측정했는데, '공포도'가 높은 모험가는 쉽게 공포를 느껴 위험 상황에서 제대로 대처할 능력이 떨어집니다. 모험가 길드장인 조랭이는 모험가 그룹을 안전하게 구성하고자 공포도가 X인 모험가는 반드시 X명 이상으로 구성한 모험가 그룹에 참여해야 여행을 떠날 수 있도록 규정했습니다. 조랭이는 최대 몇 개의 모험가 그룹을 만들 수 있는지 궁금합니다.N명의 모험가에 대한 정보가 주어졌을 때, 여행을 떠날 수 있는 그룹 수의 최댓값을 구하는 프로그램을 작성하세요. 예를 들어 N = 5이고, 각 모험가의 공포도가 다음과 같다고 가정합시다. 2 3 1 2 2 이 경우 그룹 1에 공포도가 ..
[이코테] 3. 그리디 알고리즘 - 곱하기 혹은 더하기
그리디 알고리즘 - 곱하기 혹은 더하기 문제 설명 각 자리가 숫자(0부터 9)로만 이루어진 문자열 S가 주어졌을 때, 왼쪽부터 오른쪽으로 하나씩 모든 숫자를 확인하며 숫자 사이에 'x' 혹은 '+' 연산자를 넣어 결과적으로 만들어질 수 있는 가장 큰 수를 구하는 프로그램을 작성하세요. 단, +보다 x를 먼저 계산하는 일반적인 방식과는 달리, 모든 연산은 왼쪽에서부터 순서대로 이루어진다고 가정합니다. 예를 들어, 02984라는 문자열로 만들 수 있는 가장 큰 수는 ((((0 + 2) x 9) x 8) x 4) = 576입니다. 또한 만들어질 수 있는 가장 큰 수는 항상 20억 이하의 정수가 되도록 입력이 주어집니다. 문제 해결 아이디어 두 수 중에서 하나라도 1 이하인 경우에는 더하며, 두 수가 모두 2 ..
[이코테] 3. 그리디 알고리즘 - 1이 될 때까지
그리디 알고리즘 - 1이 될 때까지 문제 설명 어떠한 수 N이 1이 될 때까지 다음의 두 과정 중 하나를 반복적으로 선택하여 수행하려고 합니다. 단, 두 번째 연산은 N이 K로 나누어 떨어질 때만 선택할 수 있습니다. N에서 1을 뺍니다. N을 K로 나눕니다. 예를 들어 N이 17, K가 4라고 가정합시다. 이때 1번의 과정을 한 번 수행하면 N은 16이 됩니다. 이후에 2번의 과정을 두 번 수행하면 N은 1이 됩니다. 결과적으로 이 경우 전체 과정을 실행한 횟수는 3이 됩니다. 이는 N을 1로 만드는 최소 횟수입니다. N과 K가 주어질 때 N이 1이 될 때까지 1번 혹은 2번의 과정을 수행해야 하는 최소 횟수를 구하는 프로그램을 작성하시오. 문제 해결 아이디어 주어진 N에 대하여 "최대한 많이 나누기"..
[이코테] 3. 그리디 알고리즘 - 거스름 돈
그리디 알고리즘 - 거스름 돈 문제 설명 당신은 음식점의 계산을 도와주는 점원입니다. 카운터에는 거스름돈으로 사용할 500원, 100원, 50원, 10원짜리 동전이 무한히 존재한다고 가정합니다. 손님이게 거슬러 주어야 할 돈이 N원일 때 거슬러 주어야 할 동전의 최소 개수를 구하세요. 단, 거슬러 줘야 할 돈 N은 항상 10의 배수입니다. 문제 해결 아이디어 " 가장 큰 화폐 단위 부터 " 돈을 거슬러 주면 됨. (최적의 해) N원 거슬러 줘야 할 때 가장 먼저 500원으로 거슬러 줄 수 있을 만큼 거슬러 줌. 이후에 100원, 50원, 10원짜리 동전을 차례대로 거슬러 줌. 정당성 분석 가장 큰 화폐 단위부터 거슬러 주는 것이 최적의 해가 되는 이유는? : 가지고 있는 동전 중에서 큰 단위가 항상 작은..
[이코테] 3. 그리디 알고리즘이란?
그리디(Greedy) 알고리즘 그리디 알고리즘(탐욕법)은 현재 상황에서 지금 당장 좋은 것만 고르는 방법을 의미. 일반적인 그리디 알고리즘은, 문제를 풀기 위한 최소한의 아이디어를 떠올릴 수 있는 능력을 요구함. 나중에 배우게될 크루스칼 알고리즘이나 다익스트라 알고리즘과 같이 잘 알려진 알고리즘을 제외하고, 일반적으로 그리디 알고리즘이 출제가 되면 해당 문제를 풀기위한 최소한의 아이디어를 적절히 떠올려야 풀 수 있게 출제됨 그리디 해법은 정당성 분석이 매우 중요. 주어진 상황에서 단순히 가장 좋아 보이는 것을 반복적으로 선택해도 최적의 해를 구할 수 있는지 검토하는 과정이 필요. 예시 [문제 상황] 맨 위 노드부터 시작해서 거쳐가는 노드의 합을 최대로 만들고자 함. 최적의 해는 무엇인가? 위 그림 처럼,..
[Linux] nvcc -V와 nvidia-smi의 차이점
수 많은 블로그 포스팅에서 잘못 포스팅하는 부분이다. nvidia-smi 명령어를 사용해서 설치한 CUDA, 그래픽 드라이버 버전을 확인하겠다고 자랑스레 사진까지 올려놓는다. 하지만 틀렸다. 설치한 버전을 확인하려면 nvcc -V 명령어를 사용해야한다. nvcc -V 실제로 설치된 CUDA 버전 nvidia-smi 드라이버가 지원하는 최대 CUDA 버전