vLLM 2

vllm 설치하기

vllm 공식문서에서는 vllm은 성능을 위해 cuda kernal들을 컴파일하여 사용한다고 한다. 따라서 기존 설치된 것들과 충돌을 피하기 위해 새로운 가상환경에서 vllm 세팅을 권장한다. 또한 특정 버전의 CUDA or Torch를 사용하기 위해선 vllm source를 받고 알맞게 빌드해줘야한다. Pre-Built 사용시엔 크게 할 일이 없다 (추가 빌드 필요없음)이 포스트에서는 Pre-built (CUDA 12.1) 사용.1. 가상환경 생성공식문서에선 conda를 사용하지만 pipenv, venv 등 사용해도 괜찮다.기존 설치된 것들에 영향받지 않는 새로운 가상환경만 만들면 된다.(나는 사용해오던 pyenv + pipenv 조합으로 진행)2. vllm 설치pip 커맨드로 가능하다. 가상환경 내에..

local llm 배포하기 - vllm & hugging face

목차0. wsl 설치 (window 한정)1. git lfs 설치2. llm 모델 선정 후 다운로드3. vllm 설치4. run0. wsl 설치vllm이 윈도우를 지원하지 않는 관계로 wsl 설치하여 ubuntu환경 세팅 필요powershell 관리자 권한 실행wsl --install 재부팅 후 다시 powershell을 켜고 wsl --install설치 완료후 powershell ~ wsl 입력하면 ubuntu 환경으로 들어가진다. wsl 최초 접속시 계정 비밀번호를 설정하는데 나중에 git lfs 설치할때 필요하니 메모 참조1: https://learn.microsoft.com/ko-kr/windows/wsl/install1. git lfs 설치git clone 명령어로 model을 받으면 용량이 큰..