전체 글 16

[ Semantic Segmentation ] Language-driven Semantic Segmentation

(논문 그대로 해석한 것이 아닌 제 나름의 방식대로 해석해서 작성했음을 알리며 참고 바랍니다.)  Boyi Li et al. Language-driven Semantic Segmentation, ICLR(2022)  Summary- 서로 다른 modality 를 가진 text 와 image embedding 이 corresponding semantic class 를 가지도록 학습- 기존의 fixed-label segmentation method 와 비교해 경쟁력있는 zero-shot 성능을 보임 1. Introduction( * 이전 포스트에서 N-shot learning method 를 리뷰하였습니다. )Semantic segmentation task 에는 많은 양의 annotated data 가 필요..

[ Visual Language Navigation ] Visual Language Maps for Robot Navigation

※ 해당 글을 작성하게 된 이유,Visual Language Navigation task 는 지속적으로 주목받고 있는 분야이기에 관련 논문 하나를 정리해보고자 작성합니다. (논문 그대로 해석한 것이 아닌 제 나름의 방식대로 해석해서 작성했음을 알리며 참고 바랍니다.)  Chenguang Huang, Oier Mees, Andy Zeng, Wolfram Burgard, Visual Language Maps for Robot Navigation, ICRA(2023)  SummaryVisual language feature 와 3D reconstruction 정보를 융합한 spatial map 제안 = VLMaps- Multi-object & Long-horizon goal navigation / Zero-s..

[ Git ] Git Remote repository 설정 방법

※ 해당 글을 작성하게 된 이유, 현재는 git 설정에 대해 크게 헷갈리지 않지만 이전에는 이조차도 해맸었습니다. 해당 글을 git을 이제 막 시작하는 분들께 공유하고자 합니다. 사전 준비사항 1. Git 설치 2. GitHub Repository 생성 Process Step1. Git Remote repository 설정 Step2. 코드 업로드 Step1. Git Remote repository 설정 Step1-1. git clone git clone { Remote repository URL } Step1-2. git init 새로운 git repository 를 초기화하는 명령어 Remote repository 와 연동할 디렉토리 내부에서 명령어 실행 Step1-1 을 진행하면서 생성된 디렉토리 ..

[ AI ] One-shot / Few-shot / Zero-shot Learning

※ 해당 글을 작성하게 된 이유, 여기저기서 learning method 에 대한 언급이 많이 보여 간단하게라도 정리하고자 글로 남깁니다. "Few-Shot Learning (1/3): Basic Concepts." YouTube, uploaded by Shusen Wang, 21 Aug. 2020, https://www.youtube.com/watch?v=hE7eGew4eeg 0. 필요성 AI 모델은 방대한 양의 train data 가 필요 Classification model 의 경우, 모든 클래스 K 개에 대해서 충분한 데이터셋이 구축되어 있어야 함 또한, 클래스 K 개 내에 들어있지 않는 새로운 클래스의 데이터가 들어온다면 정확한 분류는 어려움 또는 새로운 클래스에 대해서 추가 학습을 진행해야 함..

[ Machine Translation ] Attention Is All You Need

※ 해당 글을 작성하게 된 이유, Transformer 는 NLP 에서 시작되어 CV 등 여러 분야의 task 에 널리 쓰이는 모델입니다. (논문 그대로 해석한 것이 아닌 제 나름의 방식대로 해석해서 작성했음을 알리며 참고 바랍니다.) Ashish Vaswani et al. Attention Is All You Need, NIPS(2017) Summary - 처음으로 attention mechanism 만을 사용함을 제시한 네트워크로, 기존 CNN 이나 RNN 구조에서 벗어나 multi-head attention 을 포함한 encoder-decoder 구조 이용 - 네트워크 학습에 있어, 우수한 parallelization 을 통해 소요 시간 감축 - Machine translation task 에서 좋..