CNN
-
https://cs230.stanford.edu/projects_fall_2019/reports/26233496.pdf Abstact 음식이미지는 SNS를 지배하고 여행과 음식점 선택을 유도하지만, 여전히 엄청난 양의 이미지 때문에 정리가 되지 않고 있다. 음식이미지 분류를 올바르게 활용하면 음식 추천, 다이어트를 위한 음식 선택 같은 것 처럼 전반적으로 음식에 대한 경험을 향상시킬 수 있다. 이 논문에서는 CNN으로 음식이미지 분류를 할 때의 문제를 탐구한다. scratch 학습, pretrained model을 통한 transfer learning을 사용하여 61.4% 정확도, 85.2%의 top-5 정확도를 달성했다. Introduction 흔히 우리는 “눈으로 먹는다”라고 말한다. 인스타그램같은 ..
[논문 읽기] Food Image Classification with Convolutional Neural Networkshttps://cs230.stanford.edu/projects_fall_2019/reports/26233496.pdf Abstact 음식이미지는 SNS를 지배하고 여행과 음식점 선택을 유도하지만, 여전히 엄청난 양의 이미지 때문에 정리가 되지 않고 있다. 음식이미지 분류를 올바르게 활용하면 음식 추천, 다이어트를 위한 음식 선택 같은 것 처럼 전반적으로 음식에 대한 경험을 향상시킬 수 있다. 이 논문에서는 CNN으로 음식이미지 분류를 할 때의 문제를 탐구한다. scratch 학습, pretrained model을 통한 transfer learning을 사용하여 61.4% 정확도, 85.2%의 top-5 정확도를 달성했다. Introduction 흔히 우리는 “눈으로 먹는다”라고 말한다. 인스타그램같은 ..
2023.08.30 -
https://arxiv.org/abs/1812.01187 Bag of Tricks for Image Classification with Convolutional Neural Networks Much of the recent progress made in image classification research can be credited to training procedure refinements, such as changes in data augmentations and optimization methods. In the literature, however, most refinements are either briefly mentioned a arxiv.org 요약 최근에 image classificat..
[논문 읽기] Bag of Tricks for Image Classification with Convolutional Neural Networkshttps://arxiv.org/abs/1812.01187 Bag of Tricks for Image Classification with Convolutional Neural Networks Much of the recent progress made in image classification research can be credited to training procedure refinements, such as changes in data augmentations and optimization methods. In the literature, however, most refinements are either briefly mentioned a arxiv.org 요약 최근에 image classificat..
2023.08.30 -
https://arxiv.org/abs/2201.03545 A ConvNet for the 2020s The "Roaring 20s" of visual recognition began with the introduction of Vision Transformers (ViTs), which quickly superseded ConvNets as the state-of-the-art image classification model. A vanilla ViT, on the other hand, faces difficulties when applied to ge arxiv.org CNN은 Sliding window를 활용하여 local, global 정보를 둘 다 가지고 가는 전략의 네트워크임. 이는 Induc..
[논문 읽기] A ConvNeXt for the 2020s - 2020년대를 위한 convolutional neural networkhttps://arxiv.org/abs/2201.03545 A ConvNet for the 2020s The "Roaring 20s" of visual recognition began with the introduction of Vision Transformers (ViTs), which quickly superseded ConvNets as the state-of-the-art image classification model. A vanilla ViT, on the other hand, faces difficulties when applied to ge arxiv.org CNN은 Sliding window를 활용하여 local, global 정보를 둘 다 가지고 가는 전략의 네트워크임. 이는 Induc..
2023.05.25 -
평소에 Convolution Neural Network (CNN)을 자주 들여다봅니다. 그러다보니 궁금증은 한없이 많고, 저처럼 CNN을 연구, 공부하면서 궁금해하실 분도 많을 것 같아 몇 자 끄적여봅니다. 어디까지나 광활한 정보의 바다에서 정답인지 아닐지 모를 정보를 바탕으로 정립을 해본 것이니, 내용이 틀리다면 언제든 말씀해주셔도 좋습니다. Convolution (합성곱) 아래 이미지에서, 초록색의 이미지에 노란색의 3X3 필터를 왼쪽위부터 오른쪽아래까지 한칸씩 합성곱을 한다. 그러면 핑크색의 feature가 나옵니다. 여기까지는 이론입니다. 실제 합성곱 필터를 적용하여 feature를 시각화해보면, 이런 양상을 띄게 됩니다. CNN은 입력에 가까울수록 edge, 색깔 등 큰 특징을 보고 출력에 가까..
Convolution layer에 대한 고찰평소에 Convolution Neural Network (CNN)을 자주 들여다봅니다. 그러다보니 궁금증은 한없이 많고, 저처럼 CNN을 연구, 공부하면서 궁금해하실 분도 많을 것 같아 몇 자 끄적여봅니다. 어디까지나 광활한 정보의 바다에서 정답인지 아닐지 모를 정보를 바탕으로 정립을 해본 것이니, 내용이 틀리다면 언제든 말씀해주셔도 좋습니다. Convolution (합성곱) 아래 이미지에서, 초록색의 이미지에 노란색의 3X3 필터를 왼쪽위부터 오른쪽아래까지 한칸씩 합성곱을 한다. 그러면 핑크색의 feature가 나옵니다. 여기까지는 이론입니다. 실제 합성곱 필터를 적용하여 feature를 시각화해보면, 이런 양상을 띄게 됩니다. CNN은 입력에 가까울수록 edge, 색깔 등 큰 특징을 보고 출력에 가까..
2021.08.18