얼렁뚱땅 파이토치 딥러닝 프로젝트 모음집
-
[파이토치 딥러닝 프로젝트] Text Classification Part 5. 국민 청원 분류하기얼렁뚱땅 파이토치 딥러닝 프로젝트 모음집 2022. 8. 24. 20:40
본 프로젝트의 목표는 간단히 말해서 청원 참여 인원이 1000명이 넘을 거 같은 것을 분류하는 것이다. 프로젝트의 전체 흐름은 1. 데이터 수집(웹크롤링) 2. 데이터 전처리(공백문자 및 특수문자 제거) 3. 토크나이징 및 변수 생성 4. 단어 임베딩 5. 실험 설계(데이터 분할) 6. Text CNN 으로 진행된다. 하지만, 1 데이터 수집은 청원 홈페이지의 개편으로 다시 코드를 처음부터 짜야해서 ..ㅎ_ㅎ ; 따로 데이터 수집을 하지않고, 대신 공식 Github에 있는 데이터를 사용하도록 하겠다. 여기서 다운 받으면 됩니당 https://github.com/deep-learning-with-projects/deep-learning-with-projects GitHub - deep-learning-wi..
-
[파이토치 딥러닝 프로젝트] Transfer Learning Part 4. 작물 잎 사진으로 질병 분류하기얼렁뚱땅 파이토치 딥러닝 프로젝트 모음집 2022. 8. 19. 16:31
고성능의 모델 구성을 위해서는 질 좋은 데이터로 양이 많은 것이 매우 좋다. 하지만, 실제로 그렇게 데이터 셋을 구축하는 것은 한계가 있을 것이다. 그럴 때 Transfer Learning을 수행하면 보다 적은 데이터로 유의미한 결과를 도출 할 수 있다. 그래서 이번 게시글에서는 Transfer Learning을 살짝 정리하고자 한다. Transfer Learning ? - 아주아주 만약에 강아지, 고양이, 호랑이의 데이터가 아주 데이터 품질도 좋고, 각 Label마다 엄~~청 많은 데이터도 가지고 있다라고 가정을 해보고 아래 그림을 설명하려고 한다. - 나는 그런데 사슴/늑대/고라니를 분류하는 모델을 만들고 싶은데, 데이터가 너무 적다 그래서 그냥 학습을 진행해봤는데 좋은 성능이 나오지 않았다. 그럼 ..
-
[파이토치 딥러닝 프로젝트 모음집] Image Classification Part 4. 작물 잎 사진으로 질병 분류하기얼렁뚱땅 파이토치 딥러닝 프로젝트 모음집 2022. 8. 18. 21:10
파이토치 딥러닝 프로젝트 모음집의 책의 경우 1~3은 이론에 대한 설명이 있다. 컴팩트하게 이론이 잘 정리되어 있으니 이것을 공부하면 좋을 거 같다. 하지만, 티스토리에서는 이론에 대한 것 보다는 코드를 올려볼까한다. 코드를 작성하는 거가 딱 눈으로 보면 너무 이해도 잘 되고 쉽지만 막상 코딩을 짜려고 하면 사소한 파라미터 하나를 까먹기도 하고, 분명 torch에 있는 건데.. 어떻게 부르더라? 와 같이 다 안다고 생각하지만 모르는 부분이 꽤 있다고 생각한다. 그래서 이 책을 하면서, 다양한 데이터 형태와 다양한 Task에 대해서 어떻게 접근해야 할 지를 보고자 한다 그리고 여기에 없는 정형 데이터를 이용한 Regression 등과 같은 것도 천천히 여기다가 정리를 해보고자 한다. 이것은 책의 공식 Gi..