글 목록 35

논문 | 2023년 4월 셋째 주 읽은 논문들 간단 요약

Using Language to Extend to Unseen Domains data augmentation 관련 논문 모든 domain에 대해서 데이터를 수집하는건 사실상 불가능하니까, [yellow]verbalizing[/yellow] task와 관련된 정보는 유지하되 training domain에서 각 unseen test domain으로 이미지 임베딩 (latent)을 변환하는 과정을 학습 (pixel이 아니라!) -> 이미지 자체를 직접 augmentation 하는게 아니라 latent space 상에서의 augmentation augmentation을 학습한 후, 단순한 linear classifier를 학습 데이터 augmentation 하고 fine-tuning하는 느낌 unseen tes..

📑 논문 2023.04.17

Python3 | 파이썬에서 우선순위큐(heap)를 사용하자 (heapq 사용법)

우선순위큐, 흔히 힙이라고 하는 자료구조도 코딩테스트에서 나름 자주 등장하는 아이들이다. 직접 힙을 만들어서 사용할 수도 있지만 더 많은 시간이 소요되니 파이썬에서 제공해주는 패키지를 활용하자. 파이썬에서 우선순위큐를 이용하기 위해서는 PriorityQueue와 heapq를 사용할 수 있는데 이 포스팅에서는 heapq의 간단한 문법만 기록할 것이다. import heapq q = [] heapq.heappush(q, 1) heapq.heappush(q, 3) heapq.heappush(q, 2) heapq.heappop(q) heapq.heappop(q) heapq.heappop(q) 사용법은 아주 간단하다. 일단 heapq를 import해주고, 리스트를 하나 선언해준다. 그리고 [code]heapq.h..

Python3 | 파이썬에서 큐(queue)를 사용하자 (deque 사용법)

큐와 스택은 자료구조의 기본이라고 볼 수 있는데 파이썬에서는 이를 어떻게 구현하면 좋을까! 사실 파이썬은 워낙 리스트와 인덱싱이 편리하게 되어 있어서 리스트만으로도 구현할 수는 있다. lst.pop(0)# 가장 왼쪽의 요소를 꺼내준다. (queue에서의 dequeue) lst.pop()# 가장 오른쪽의 요소를 꺼내준다. (stack에서의 pop) 하지만 위처럼 구현했을 때 가장 큰 문제점은 너무 느리다는 것이다. 그래서 효율성 검사 같이 시간제한이 있는 문제에서는 일반적으로 list와 pop 조합 대신에 deque를 사용한다. from collections import deque 사실 deque 사용법은 엄청 간단하다. list와 큰 차이가 없다! from collections import deque q..

논문 | Aligning Text-to-Image Models using Human Feedback

최근 chatGPT, GPT4가 공개되면서 human feedback이 굉장히 각광받고 있다. 오늘은 human feedback 논문 중 하나를 리뷰해보려고 한다. (글을 쓰고 있는 시점 기준으로 under review 상태라고 한다.) 일단, 이 논문은 text-to-image 모델들이 텍스트와 이미지가 잘 align 되어 있지 않다는 점을 꼬집으며 [yellow]Human Feedback[/yellow]을 이용해서 모델을 fine-tuning 하는 메소드를 제시한다. 위에서도 언급했듯이 human feedback을 이용해서 모델을 fine-tuning 한다. 크게 3가지 과정으로 구성되어 있다. 1. human feedback 수집 2. human labeled image-text dataset을 이..

📑 논문 2023.04.01

Linux | gzip: stdin: not in gzip format 해결하기

평소처럼 tar.gz 파일을 압축해제 하기 위해 [code]tar -zxvf dg5.tar.gz[/code] 명령어를 입력했는데 아래 사진과 같은 에러가 발생했다. [code]gzip: stdin: not in gzip format[/code] => 즉, 파일 형식이 맞지 않아서 발생하는 에러이다. gzip: stdin: not in gzip format tar: Child returned status 1 tar: Error is not recoverable: exiting now dg5.tar.gz 파일의 타입을 알기 위해서 아래 명령어를 실행해준다. file dg5.tar.gz 위의 사진에서 볼 수 있듯이 해당 파일은 POSIX tar archive (GNU) 형식이다. 파일이 아카이빙은 되어있지만,..

🍑 잡지식 2023.03.31

Linux | Screen 자주 쓰는 명령어 정리

screen 리스트 확인하기 screen -list screen 시작하기 screen -S [SCREEN_NAME] 이전에 킨 screen 이어서 시작하기 screen -r [SCREEN_NAME] 위의 명령어는 detach된 스크린에만 적용된다! 스크린의 detach 여부는 screen -list를 통해서 확인가능하다. 만약 screen이 attach 상태라면 아래 명령어를 통해서 detach 해주자! screen detach screen -d [SCREEN_NAME] 위의 명령어들은 스크린을 실행하기 위해 shell 에서 입력할 수 있는 명령어들이다. 실행 중인 스크린 내부에서 사용할 수 있는 명령어는 아래와 같다. 실행 중인 스크린 내부에서 사용하는 명령어 [code]screen -S [SCREEN..

🍑 잡지식 2023.03.01

Linux | Remote 서버에서 TensorBoard 열기

tensorboard는 원래 [code] tensorboard --logdir=[LOG_DIRECTORY_PATH] --port=[PORT_NUMBER][/code] 명령어를 통해서 간단하게 로컬호스트에서 그래프를 확인할 수 있다. 하지만, 연구실에서는 개인 local 환경보다는 서버 접속해서 작업하는 일이 훨씬 많은데, 아래 명령어를 통해 간단하게 서버에 있는 tensorboard들을 내 로컬에서 쉽게 확인할 수 있다. ssh -NfL localhost:[LOCAL_PORT_NUMBER]:localhost:[SERVER_PORT_NUMBER] [USER ID]@[IP] 일단, 위의 명령어를 통해서 내 localhost의 port와 server의 localhost의 port를 연결해준다. tensorbo..

🍑 잡지식 2023.02.25

Linux | 명령어 연속적으로 실행하기

3줄 요약 [code]command1 ; command[/code]: 앞의 명령어의 성공 여부와 상관 없이 다음 명령어 수행 [code]command1 && command2[/code] : 앞의 명령어가 성공했을 때만, 다음 명령어 수행 [code]commdan1 & command2[/code] : 앞의 명령어는 백그라운드로 실행하고 동시에 다음 명령어 수행 ; 앞의 명령어가 실패해도 뒤의 명령어를 수행한다. & 앞의 명령어는 백그라운드로 수행함과 동시에 뒤의 명령어를 수행한다. 예를 들어 mkdir tmp & cd tmp 명령어를 입력했을 때 앞의 tmp 폴더는 생성되지만, tmp 폴더가 생성됨과 동시에 tmp 폴더로 이동하려 하기 때문에 뒤의 명령어에서 에러가 발생하게 된다. && 앞의 명령어가 성공..

🍑 잡지식 2023.02.07

논문 | Improving Predicate Representation in Scene Graph Generation by Self-Supervised Learning (WACV 2023)

어쩌다 보니 WACV 2023 연속으로 2편 정리를 하게 됐당.. 그것도 SGG 논문.. 컨셉 일반적으로 SGG에서 사용하는 데이터셋 (Visual Genome, Open Image 등) 은 매우 imbalnce하다. 따라서 데이터셋 내에서 자주 등장하는 class (head에 속하는 class) 를 위주로 학습하다보니, 데이터셋 내에서 등장하는 빈도가 적은 predicate class (tail에 속하는 class)는 잘 예측하지 못 한다. 하지만, 보통 head에 속하는 것들 (ex, on) 은 정보가 많이 없고 tail에 속하는 것들 (ex, standing on) 이 상대적으로 더 많은 정보를 가지고 있다. 이를 해결하기 위해서 많은 기법들이 등장했지만 대부분 tail에 속하는 class에 집중하..

📑 논문 2023.01.30

논문 | Composite Relationship Fields with Transformers for Scene Graph Generation (WACV 2023)

컨셉  SGG task를 위한 네트워크에는 크게 2가지 방식이 있다. object detector를 기반으로 feature를 추출하는 top-down 방식과 object들과 그 사이의 relation을 동시에 탐지하는 bottom-up 방식이 존재한다. (내 생각엔, top-down 방식이 two-stage, bottom-up 방식이 one-stage인 것 같다.)  SGG task는 보통 VQA, Image Captioning과 같은 다른 task를 위한 수단으로 많이 활용된다. 하지만 기존의 top-down 방식은 OD을 먼저 진행해야 하고, OD로 detection된 객체들 사이의 relation을 예측해야하기 때문에 (오브젝트가 N개 존재한다면, N(N-1) 개의 경우를 고려해야함) inferen..

📑 논문 2023.01.16