데이터 이야기

Chat Vector | A Simple Approach to Equip LLMs with Instruction Following and Model Alignment in New Languages 리뷰

이 논문의 원문은 다음과 같다. https://arxiv.org/pdf/2310.04799 논문의 핵심 아이디어는 다음과 같다. 기존 모델에서 파생된 CP모델에 추가적인 벡터를 추가하면 특별한 학습 없이도 기존의 대규모 언어 모델에 대화 기능을 부여하고 명령 수행 능력과 인간의 가치에 맞추어 조정할 수 있다는 것입니다. 용어 정리 CP...

글을 쓰는 습관

공부한 내용을 꾸준히 기록하고 경험을 공유하겠다는 실천 의지가 담긴 글. 프로젝트를 진행하며 늦기 전에 나의 성장 과정을 기록해 보아야겠다는 생각에 매일 꾸준히, 조금씩이라도 기록해보려 한다. 늦었다고 생각할 때가 가장 빠르다. 물론, 지금은 늦었다고 생각할 수 있어도 나중에 이 시점을 돌이켜보면 “아… 그때는 정말 아무것도 아닌 나였구나...

© 유정. 일부 권리를 보유하고 있습니다.