성장하는 개발자

시작하며 이번 포스트에서는 2018년에 구글에서 공개한 사전 훈련된 모델인 BERT(Bidirectional Encoder Representations from Transformers)에 대해 자세히 알아보도록 하겠다. Bert는 Transformer의 인코더 구조를 이용해 만든 ...

[NLP] 트랜스포머 인코더 ‘FFNN’, ‘잔차 연결’, ‘층 정규화’

August 2, 2023

시작하며 이번 포스팅에선 트랜스포머의 인코더의 포지션-와이드 피드 포워드 신경망(Position-wise FFNN), 잔차 연결(Residual connection)과 층 정규화(Layer Normalization)에 대해서 공부한다. 아래 포스팅의 내용을 알고 있다는 가정 하에 ...

[NLP] 트랜스포머 디코더 구조

August 2, 2023

시작하며 지금까지 트랜스포머의 기초 개념과 인코의 구조에 대해 자세히 알아보았다. 이번 포스트에서는 트랜스포머의 나머지 구조인 디코더에 대해서 자세히 알아보도록 하자. 기본적으로 트랜스포머의 개념과 인코더의 구조에 대해서 알고 있다는 전제하에 작성되는 글이니, 이것들에 대한 기초 ...

[NLP] 트랜스포머 인코더 ‘셀프 어텐션’ & ‘멀티 헤드 어텐션’

August 1, 2023

시작하며 이번 포스팅에선 트랜스포머의 인코더 구조와 셀프 어텐션과 멀티 헤드 어텐션에 대해 자세히 알아보도록 한다. 트랜스포머의 전체적인 틀과 어텐션에 대해 알고 있다는 가정하에 작성되는 글이기 때문에, 이에 익숙하지 않다면 아래의 링크에서 먼저 공부를 하고 오는 것을 추천한다. ...

[NLP] 트랜스포머(Transformer) 기초 개념

August 1, 2023

시작하며 이번 포스트에서는 트랜스포머가 등장하게 된 계기와 장점, 그리고 전체적인 큰 틀에 대해서 공부하도록 하겠다. 이 포스트는 기본적으로 어텐션의 개념을 알고 있다는 전제하에 포스팅 되었기 때문에, 어텐션의 기초 개념이 부족하다면 아래의 링크를 통해 어텐션을 공부하고 보는 것을...

[NLP] 어텐션 메커니즘 (Attention Mechanism)

August 1, 2023

어텐션 메커니즘 (Attention Mechanism) 앞서 배운 seq2seq 모델은 인코더에서 입력 시퀀스를 컨텍스트 벡터라는 하나의 고정된 크기의 벡터 표현으로 압축하고, 디코더는 이 컨텍스트 벡터를 통해서 출력 시퀀스를 만들어냈다.

[NLP] 시퀀스-투-시퀀스(Sequence-to-Sequence)로 번역기 구현하기

July 31, 2023

문자 레벨 기계 번역기(Character-Level Neural Machine Translation) 구현하기

[NLP] 시퀀스-투-시퀀스(Sequence-to-Sequence, seq2seq)

July 31, 2023

시퀀스-투-시퀀스(Sequence-to-Sequence) seq2seq는 번역기에서 대표적으로 사용되는 모델이다.

[NLP] 서브워드 토크나이저(Subword Tokenizer) - BPE

July 31, 2023

서브워드 토크나이저 기계에게 아무리 많은 단어를 학습시켜도, 세상의 모든 단어를 알려줄 수는 없다. 만약, 기계가 모르는 단어가 등장하면 그 단어를 집합에 없는 단어란 의미에서 OOV(Out-Of-Vocabulary)라고 표현한다. 기계가 문제를 풀 때, 모르는 단어가 등장하면 문...

맨 위로 이동 ↑

React

[React] React useEffect hook 에 대해 알아보자

December 13, 2023

이번 포스팅에선 React에서 자주 쓰이는 hook인 useEffect에 대해 알아보도록 하자.

[React] React useContext, useReducer에대해 알아보자

December 11, 2023

이번 포스팅에선 React의 주요 hook인 useContext와 useReducer에 대해 알아보도록 하자.

[React] React useState와 useRef의 차이점

December 8, 2023

useState와 useRef의 차이점

[React] React에서 객체 상태를 관리할 때 팁

December 6, 2023

React에서 useState로 객체를 관리, 변경할 때 문법적 팁

[React] React에서 state를 업데이트할 때 주의할 점

December 6, 2023

React에서는 state를 업데이트 할 때 비동기적으로 동작한다.

[React] React에서 map 함수 쓸 때 주의점

December 4, 2023

React를 공부하던 중 실수를 통해 발견한 것

맨 위로 이동 ↑

HTTP

HTTP 쿠키(Cookie)에 대해 알아보자

March 2, 2024

쿠키란 무엇인가?

주요 HTTP method에 대해 알아보자

February 23, 2024

주요 HTTP method에 대해 알아보자

올바른 URI와 HTTP API 설계

February 23, 2024

HTTP API를 만들어보자

맨 위로 이동 ↑

Spring

Spring JPA(EntityManager)를 이용한 REST CRUD 코드 작성(2)

March 8, 2024

Spring JPA(EntityManager)를 이용한 REST CRUD 코드 작성(2)

Spring JPA(EntityManager)를 이용한 REST CRUD 코드 작성(1)

March 5, 2024

Spring JPA(EntityManager)를 이용한 REST CRUD 코드 작성

Spring global exception handler 만들기

February 26, 2024

Spring REST API 예외처리 코드 작성법

맨 위로 이동 ↑

Deep-Learning

[DL] Pytorch로 XOR Problem 해결하기

August 8, 2023

XOR Problem 퍼셉트론은 초기 인공 신경망 모델 중 하나로, 입력값을 받아 가중치와 활성화 함수를 통해 출력을 계산하는 구조를 갖느다. 하지만 퍼셉트론은 선형적으로 분리 가능한 문제만 해결할 수 있으며, XOR 문제와 같은 비선형 문제를 해결할 수 없는 한계가 있다.

맨 위로 이동 ↑