분류 전체보기 13

fail2ban 설치 및 설정(서버 관리)

Fail2ban은 반복적인 로그인 실패를 감지해서 해당 IP를 자동으로 차단하는 침입 방지 도구다. SSH 무차별 대입 공격으로부터 서버를 보호하는 데 필수적이다. ​설치Ubuntu/Debian 기반 설치 방법으로 설치는 간단하다.​sudo apt update sudo apt install fail2ban -y 설치 후 서비스를 활성화하고 시작한다.sudo systemctl enable fail2ban sudo systemctl start fail2ban sudo systemctl status fail2ban 설정 파일 구조Fail2ban의 설정 파일은 /etc/fail2ban 디렉토리에 위치한다:fail2ban.conf: 전역 설정 파일jail.conf: Jail 설정의 기본 템플릿jail.local..

연구실 2026.02.05

MLPerf Inference 설치

공식 문서가 영어로 써져있으면 설명을 읽지 않는 병이 있다. 그래서 어김없이 설치 과정에서 문제가 발생했었다...^^ 문제가 된 부분은 다음과 같다. python 가상환경을 사용하기 위해서는 python3-venv가 설치되어 있어야 하는데, OS를 지난번에 밀고 새로 설치하면서 설치가 되어있지 않은 상태에서 env를 만들어서 오류가 발생했다. 정상적인 설치 과정은 아래와 같다. 1. 시스템 패키지 설치(git, python3-venv, python3-pip 필요)sudo apt install python3-venv python3-pip git 2. MLCommons Inference 저장소 클론git clone https://github.com/mlcommons/inference.git 3. 가상환경 생..

연구실 2025.10.29

AMD μProf 설치 및 간단 사용법 (ubuntu)

AMD μProf는 AMD 프로세서를 위한 성능 및 전력 분석 도구로, Ubuntu에서 memory나 CPI 같은 항목들을 profiling 할 수 있다. 설치 및 기본 설정1. 다운로드 및 설치AMD 공식 사이트에 들어가서 스크롤을 쭉 내린다. 가장 아래에 설치파일 버전 중 적당한 파일을 선택해서 다운받고 설치해야하는 pc로 옮긴다. 필자는 deb파일을 사용하였다.https://www.amd.com/en/developer/uprof.html sudo dpkg --install amduprof_5.1-*_amd64.deb # deb 파일 설치 만약 tar 버전을 사용한다면 아래와 같이 드라이버를 수동으로 설치해줘야 한다.tar -xf AMDuProf_Linux_x64_5.1.*.tar.bz2cd AMD..

연구실 2025.10.14

GAPBS 벤치마크 사용법

빌드 및 기본 실행 git clone https://github.com/sbeamer/gapbs.git cd gapbs make공식 gapbs는 위의 레포이지만, 개인적으로는 아래의 수정한 레포를 사용한다. 시간과 관련하여 세 가지를 수정하였는데, 1. 시간 측정 함수를 steady clock으로 바꿔서 안정성을 가져가고, 2. 평균 시간 산출 방식을 산술 평균에서 기하 평균으로 변경하였으며,3. 첫번째 실행을 average time 계산에서 제외하였다(warm-up) https://github.com/hogumalatte/gapbs.git GitHub - hogumalatte/gapbs: GAP Benchmark Suite_with geometric mean & steady clockGAP Bench..

연구실 2025.10.13

ubuntu cpu 성능 설정 및 모니터링

CPU 거버너 설정현재 설정 확인하려면 sudo cpupower frequency-info 실행. 이 명령어로 현재 거버너, 주파수 범위, 드라이버 정보를 한 번에 확인할 수 있다. 또한 아래 거버너 종류는 기본적인 내용일 뿐 사용환경에 따라 없거나 추가되는 종류가 있을 수 있는데, 내 시스템에서 사용할 수 있는 거버너도 확인 가능하다.거버너 종류와 변경performance: CPU를 최대 클럭으로 고정. 벤치마크나 고성능 작업할 때 씀sudo cpupower frequency-set -g performance powersave: CPU를 최소 클럭으로 고정. 배터리 절약 필요할 때sudo cpupower frequency-set -g powersave ondemand: 부하에 따라 동적 조절. 일반 사..

연구실 2025.10.06

pytorch에서 tensor 타입 변경에 따른 training time과 memory의 trade-off

제목에 영어가 참 많다.. 이러기 싫은데, 억지스럽지 않게 한글로 표현하기가 너무 어렵다.우선 해당 상황은 pytorch를 이용하여 복소수 신경망(CVNN, CVCNN)을 구현하는 중 발생했다.complex를 사용하는 경우가 아니라면 아래와 같은 형 변환을 할 일도, 이유가 많지 않기 때문에 이 trade off는 좀 특수한 케이스일 것이라고 생각된다. 다만 이 문제로 많은 고생을 하였기에 혹시나 싶은 마음에 아래 글을 남겨둔다.복소수 신경망 모델을 구현하고 학습하는 과정에서 GPU 메모리 피크 사용량이 과도하게 증가하는 문제가 발생하였다. 이에 대한 원인을 분석하고 코드 차원에서 메모리 효율을 개선하기 위한 작업을 수행하였다. 결과적으로 메모리 사용량은 줄어들었지만, 학습 시간이 증가하는 현상이 발생하..

AI 2025.04.30

SSH 세션이 끊겨도 프로세스가 끊기지 않게 하려면..

1. 실행 전에 준비했다면 nohup세션이 끊겨도 job이 계속 실행됨. 출력은 파일로 리다이렉션하는 것이 일반적이다.nohup your_command > output.log 2>&1 & tmux (또는 screen)가상 터미널 세션을 생성해서 그 안에서 job을 실행하면, SSH 세션이 끊겨도 job이 살아 있고, 나중에 다시 접속해서 제어 가능.tmux # 세션 시작python train.py # job 실행[Ctrl + B] → D # 세션 분리(detach)# 재접속 후tmux attach # 세션 재접속(attach)위는 tmux의 예시, 아래는 screen의 예시이다.screen # 세션 시작py..

연구실 2025.04.30

Quantization: 딥러닝 경량화를 위한 정밀 이론과 적용 사례

딥러닝 모델이 점점 대형화됨에 따라, 모델을 경량화하는 기술은 선택이 아니라 필수가 되었다.그중에서도 **Quantization(양자화)**는 가장 널리 쓰이는 경량화 기법이다.이번 글에서는, Quantization의정확한 수학적 정의대표적인 방법별 특징Quantization 방법별 성능 비교를 다룬다.1. Quantization 수식 (현실적으로 많이 쓰이는 버전)실제 많이 사용되는 양자화 수식은 다음과 같다.Uniform Affine Quantization (Offset 포함)여기서,x : 부동소수점 입력값 (float32)s : scaling factor (양자화 단위)z : zero-point (offset, 정수화할 때 기준점 조정)qmin,qmax: 정수 표현 범위 (예: 8-bit int이면..

AI 2025.04.28

perf 사용법

1. 기본 명령어 정리1) 성능 측정명령어 실행 성능을 간략히 확인할 수 있다.perf stat 예시:perf stat python3 script.py 2) 프로파일링 데이터 기록하기성능 데이터를 기록하고 결과로 perf.data 파일을 생성한다.perf record 예시:perf record python3 script.py 3) 프로파일링 데이터 분석기록된 데이터를 분석하여 상세한 결과를 확인한다.perf report 2. perf.data 파일 분석하기 perf record 명령어로 생성된 perf.data 파일을 분석하여 성능 병목 지점을 상세히 확인할 수 있다.기본 분석:perf report함수별 상세 분석:perf report --stdio소스 코드와 연결된 분석:perf annotate 3. ..

연구실 2025.04.02

Installing and Setting up perf on NVIDIA Jetson Orin Nano

Background대충 또 젯슨이 문제라는 이야기..perf를 사용하기 위해 필요한 dependency가 있는데, 이 부분이 apt 패키지 안에 없어서 일반적인 ubuntu pc에서 사용하는 것처럼 perf를 설치할 수 없다.When trying to use perf on Jetson Orin Nano with a custom Tegra kernel (5.10.216-tegra), the standard Ubuntu repositories lack the appropriate linux-tools package. Therefore, building perf from the source specifically matching the kernel is required. 아래 글은 nvidia develope..

edge device 2025.04.02