본문 바로가기

분류 전체보기

(15)
[Paper Review 4] GRAF: Generative Radiance Fields for 3D-Aware Image Synthesis Conference on Neural Information Processing Systems (NeurIPS), 2020 https://arxiv.org/abs/2007.02442 1. Introduction 고해상도의 이미지들을 활용한 View Synthesis 작업을 수행할 때, Convolutional GAN이 굉장히 효과적이다. 하지만, 이러한 성공에 불구하고, SOTA 모델들은 3D shape와 viewpoint와 같은 generative factor들을 disentangle을 제대로 하지 못하고 있다. 인간은 새로운 viewpoint에서 물체를 상상하고 세상의 3D 구조를 파악하는 데 능한 것과는 반대되는 모습이다. 따라서, 최근의 연구들은 3D-aware image synthesis를 접근하..
[Paper Review 3] 3D human pose estimation in video with temporal convolutions and semi-supervised training Conference on Computer Vision and Pattern Recognition (CVPR) 2019 https://arxiv.org/abs/1811.11742 1. Introduction 이 논문에서는 비디오에서 3D human pose estimation을 다룬다. 추정 문제를 해결하기 위해, 2D keypoint detection과 3D pose estimation, 두 방법으로 분할해서 해결하게 된다. 하지만, 이 방법은 여러 3D pose들이 같은 2D 키포인트에 매핑이 될 수 있는 등, 모호성이 내재되어있기도 하다. 기존의 연구들은 Recurrent Neural Network (RNN)을 사용해서 모호성을 해결해왔다. 반면에, CNN 모델을 사용하면, 여러 프레임의 병렬 처리가..
[Paper Review 2] NeRF: Representing Scenes as Neural Radiance Fields for View Synthesis (This article is written for study purposes. Please be aware that there may be incorrect information.) European Conference on Computer Vision (ECCV), 2020 (Best Paper Honorable Mention) https://arxiv.org/pdf/2003.08934.pdf This paper focuses on the problem of View Synthesis. View Synthesis gets multiple images of scenes along with their corresponding camera poses. 1. Introduction NeRF represents..
[Paper Review 1] PointNet: Deep Learning on Point Sets for 3D Classification and Segmentation (This article is written for study purposes. Please be aware that there may be incorrect information.) Conference on Computer Vision and Pattern Recognition (CVPR) 2017 https://arxiv.org/abs/1612.00593 1. Introduction Typical convolutional architectures require highly regular input data formats (e.g. Image Grids, 3D voxels) However, Point Clouds or Meshes are not in regular format. Therefore, mo..
[Paper Review 3] Very Deep Convolutional Networks For Large-Scale Image Recognition 리뷰할 논문은 Very Deep Convolutional Networks For Large-Scale Image Recognition입니다. (arxiv.org/abs/1409.1556) 공부를 위하여 작성한 글인 만큼, 틀린 부분이 있을 수 있다는 점을 감안하여 읽어주시길 바랍니다. 1. Introduction 이 논문은 ConvNet architecture의 중요한 요소 중 하나인 depth에 대하여 전달하였다. ConvNet architecture의 parameter들을 수정하고, convolutional layer들을 추가함으로써 network depth을 증가시킨다. (참고로 이것이 가능했던 이유는, 모든 layer에서 small convolution layer ( 3 * 3 )을 사용했기 때문..
[Paper Review 2] Network In Network 해당 논문은 Min Lin et al. 의 Network In Network (arxiv.org/abs/1312.4400) 입니다. 1. Introduction NIN (Network In Network)의 기본적인 structure는 다수의 mlpconv layer를 쌓아올린 형태이다. mlpconv layer 안에 micro networks (MLP)가 있기 때문에, structure를 Network In Network라고 부르는 것이다. Classification을 위하여 fully connected layers를 adopting 하는 방식을 사용하지 않고, last mlpconv layer의 feature maps의 spatial average를 바로 output하여 resulting vector..
[Paper Review 1] ImageNet Classification with Deep Convolutional Neural Networks 리뷰할 논문은 ImageNet Classification with Deep Convolutional Neural Networks (papers.nips.cc/paper/2012/file/c399862d3b9d6b76c8436e924a68c45b-Paper.pdf) 입니다. 공부를 위하여 작성한 리뷰인 만큼, 틀린 부분이 있을 수 있다는 점을 감안하고 읽어주시길 바랍니다. 1. Introduction Datasets of labeled images는 비교적 작은 사이즈로 구성되어 있다. 하지만, objects in realistic settings은 variability를 상당수 가지고 있기 때문에, large training sets들을 활용하여 학습을 해야 한다. 수백만개의 이미지로부터 수천개의 사물에..