Category

review

[Review] Diffusion Models 2 - 작성 중

Diffusion Model이 sample quality 측면에 있어서 높은 fidelity를 자랑한다면, density estimation은 어떨까? log-likelihood를 최소화하도록 Diffusion Model에 약간의 변형을 줘 본, 아래 2개의 논문을 리뷰해보자.

[Review] Diffusion Transformer (DiT)

Diffusion Model의 기본 Architecture는 DDPM 때 부터 U-Net을 주로 써왔다. 그러나, “굳이 U-Net?”이라는 의문이 들 수 있기에. Transformer를 사용한 Diffusion Transformer, DiT 논문을 살펴보자. 정확한 논문 이름은 ...

[Review] Diffusion Models 4 - 작성 중

Diffusion Model의 Reverse sampling을 더 빠르게 하는 새로운 방식으로 Distillation Approach가 제안되었다. 아래 2가지 논문을 살펴보자.

[Review] Diffusion Models 3 - 작성 중

Song et al., 2020의 Score-Based Generative Modeling through Stochastic Differential Equations 논문에서 우리는 Diffusion forward process가 forward SDE로 나타나고, reverse p...

[Review] PEFT-LoRA

Parameter Efficient Fine-Tuning(PEFT)라 불리는 모델 튜닝 방식에 대해서, 그 중에서도 Alpaca에서도 사용되는 등 가장 널리 알려진 Low-Rank Adaptation of LLM(LoRA)에 대해 정리해보자.

[Review] SDE

앞서 Review한 Diffusion Model과, score-based model을 모두 통합하는 generalized framework를 제시한, Score-Based Generative Modeling through Stochastic Differential Equations...

[Review] ODE/SDE-Net

Neural Network를 좀 더 다른 시각으로 바라볼 수 있게 한, ODE-Net과 그 variant인 SDE-Net에 대해 알아보자.

[Review] NCSN

앞서 Review한 diffusion model이 그냥 툭하고 튀어나온게 아니다. 사실 Diffusion Model은 score-based model을 diffusion probabilistic model에 통합한 모델로써 의미가 있는데, 이를 이해하기 위해 Score-based ...

[Review] GPT - 작성 중

OpenAI의 걸작. 가장 핫하다면 핫하다고 볼 수 있는. Generative Pre-Training Model, GPT를 version 순서대로 리뷰해보자.

[Review] BERT

Transformer 모델을 살펴보았으니, 이젠 본격적으로 BERT와 GPT을 살펴볼 차례이다. 이번에는 BERT:Pre-training of Deep Bidirectional Transformers for Language Understanding[1] 논문을 읽고 리뷰해보자. 다...

[Review] Diffusion Models

Diffusion Model의 기본이라 불리우는 4~5개의 논문에 대한 강의를 보고 정리해보자. Denoising diffusion probabilistic models (DDPM), NeurIPS 2020 [2] Denoising diffusion implicit mo...

[Review] Transformer

ChatGPT에게 자신의 부모(?)인 Transformer 모델에 대해 설명을 요청한 결과, 내용을 굉장히 잘 정리해서 알려주고 있다! “Transformer 모델은 자연어 처리 분야에서 최근에 개발된 딥러닝 모델 중 하나로, 특히 기계 번역, 자연어 이해, 질의응답 등 다양...

맨 위로 이동 ↑

cs231n

[CS231n] Lecture 8&9

Lecture 8 - Deep Learning Software CPU vs GPU 일반적으로 CPU의 Core 수는 4 또는 8인데, GPU의 Core 수는 이것보다 훨씬 많다. 강의 자료에는 NVIDIA GTX 1070 기준으로 CUDA Core 개수가 1920, NVIDIA V...

[CS231n] Lecture 6&7

이제 본격적으로 딥러닝 모델 학습에 대한 자세한 내용들을 다루고 있다.

[CS231n] Lecture 5

원래는 Unsupervised Learning 강의 전까지는 강의 2개를 한 번에 정리하려고 했으나, Lecture 6와 7이 Training NN으로 같은 Topic이라 Lecture 5는 따로 하는게 좋아보여서 이렇게 따로.

[CS231n] Lecture 1&2

Stanford University에서 Youtube에 게시한, CS231n Convolutional Neural Networks for Visual Recognition 수업 자료 개인 정리 Version.

맨 위로 이동 ↑

dcase_task2

맨 위로 이동 ↑

Coding

[Coding] Multi-GPU Training

torch.distributed package에서 제공하는 Multi-GPU training에 대해 코드를 보면서 알아보자. Accelerate/Ignite/Lightning 등의 library는 이런 distributed run을 좀 더 쉽게 해주는데, 이 중 HuggingFac...

맨 위로 이동 ↑