본문 바로가기
반응형

전체 글82

[딥러닝 뉴비의 좌충우돌 일기] Tensorflow Object Detection API로 동물의 행동 분류하기 - 본론 2 : 프로젝트에 API 적용하기 연관된 포스트 : 서론과 본론 1을 보고 오십시오. 1. Parse video into image - 영상을 보고 적절한 구간을 파싱한다.(.mp4로) : 무료프로그램인 반디컷을 추천 파싱 된 영상 맨 뒤에 반디컷 워터마크가 생기므로 annotation 하기 전에 이런 jpg파일은 지우고 학습해야 함 - 이후 .mp4 파일을 일정 프레임마다 .jpg 파일로 저장한다. (cv2.VideoCapture(), cv2.imwrite() 등의 함수를 이용하여 .py 파일을 직접 작성) 더보기 # parse_rgb.py example (https://jech-jose.tistory.com) # File name should not be in Korean # usage : python parse_rgb.py impo.. 2020. 6. 3.
[딥러닝 뉴비의 좌충우돌 일기] Tensorflow Object Detection API로 동물의 행동 분류하기 - 본론 1 : 컴퓨터 환경 세팅과 API 사용방법, 프로젝트 Overview 연관된 포스트 : 서론을 보고 오십시오. 컴퓨터 환경 세팅 TOD API 를 쓰기 위해서 먼저 컴퓨터 환경 세팅을 해야한다. API를 쓸 때 코드를 내가 안 짜는 것이지 API 내부적으로는 딥러닝 모델을 돌리는 것이기 때문에 기본적인 딥러닝 컴퓨터 환경 세팅을 진행해주면 된다. - Python, CuDNN, CUDA, Tensorflow 설치하기 : GPU 모델에 호환되는 cudnn, cuda 버전을 구글링해서 확인하고 깔기 환경 세팅과 관련해서는 내가 포스팅을 아직 덜 했으니 다음의 블로그(1, 2)들 참고해서 깔길 추천한다. - 그 당시 학교 서버 컴퓨터에 내가 깔았던 버전들 공유(OS는 Windows 10) python : 3.7.3 cuda : release 10.1, V10.1.168 cudnn.. 2020. 6. 3.
[딥러닝 뉴비의 좌충우돌 일기] Tensorflow Object Detection API로 동물의 행동 분류하기 - 서론 : What and Why? 서론 작년에 영상에서 동물의 행동을 detection하는 task를 수행하기 위해서 Tensorflow Object Detection API(이하 TOD API)를 사용했었다. 영상데이터에서 직접 Annotation한 Custom Dataset을 이용하여, 기존의 잘 학습된 모델에 추가로 조금 학습시키고 성능을 분석하는 정도라 컨셉자체는 매우 간단하다. 하지만 그 당시의 나는 쫄보 뉴비였기 때문에(지금도 뉴비지만) 되게 쉽게 툴을 쓰는 방법을 알려주는 자료가 필요했는데 그 당시에 TOD API를 쓰는 방법을 떠먹여주듯이 잘 알려주는 자료가 거의 없어서 조금 고생을 했다. 사실 지금은 Audio 쪽에서 공부를 하고 있기 때문에 앞으로는 Vision 쪽 Task를 할 일이 없을 것 같긴 하지만 외장하드에만 .. 2020. 6. 3.
DFT 공부하다가 궁금했던 점 정리 Q. FFT size와 Window size의 차이는 무엇인가? FFT size는 실제로 DFT를 할 때 수식에서 N에 해당하는 값이다. DFT를 수행할 sample의 size와 같을 필요는 없고, DFT를 할 때 시간 복잡도를 줄이기 위해 2의 지수승으로 가급적 택한다. 실제 sample의 size보다 더 크다면 나머지 값을 0으로 패딩한다.(zero padding) Window size는 sample에서 어떤 부분에 DFT를 돌릴지와 관련이 있어서 sample 전체를 돌리고 싶다면 sample size로 지정하면 된다. Q. zero padding을 하면 좋은 점은 무엇인가? zero padding을 하면 기본적으로 DFT에서 N이 늘어나는 효과(sample의 개수가 증가)를 볼 수 있다. 그렇게 되.. 2020. 4. 13.
반응형