본문 바로가기 메뉴 바로가기

killog

프로필사진
  • 글쓰기
  • 관리
  • 태그
  • 방명록
  • RSS

killog

검색하기 폼
  • 분류 전체보기 (471) N
    • 스프링, 자바 (113)
    • 알고리즘 (218)
    • 끄적끄적 - 글 (27)
    • 독후감 (25)
    • 프로젝트 - gift-shop (6)
    • 구버전 팁 (24)
    • 용어정리 (17)
    • 웹 (1)
    • tips (4)
    • 쉘 (6)
    • 스파크 (4)
    • argo (2)
    • 쿠버네티스 (3)
    • vllm (4) N
  • 방명록

kill.og.kil.log.
vLLM 0.5 -> 0.6 버전 디자인 변화만으로 Throughput 2.7배 높이기

안녕하세요 vllm 0.5 , 0.6 버전으로의 디자인 변화만으로 throughput 20% 높이기 를 주제를 들고왔습니다. 이전에 포스팅한글인데, v1 아키텍처가 나오면서 부랴부랴 포스팅합니다. 업그레이드가 빠르네요, vllm 0.6버전 업데이트이후 throughput이 향상되었는데요, 왜 향상 되었을지에 대해서 vllm 디자인과 함께 설명해보고자합니다.3줄 요약하자면, 다음과 같습니다.vLLM 0.6 버전 업데이트 있다. GPU 최적화 어느정도 진행해서 CPU 오버헤드가 커보여 개선했다. 효과 있다.https://blog.vllm.ai/2024/09/05/perf-update.html Dataset: ShareGPT 500 prompts randomly sampled from ShareGPT ..

vllm 2025. 5. 21. 17:30
이전 1 다음
이전 다음
반응형
공지사항
최근에 올라온 글
최근에 달린 댓글
Total
Today
Yesterday
링크
  • 자기소개
  • 깃허브
TAG
  • 세션불일치
  • 언제나 함께해요
  • 스프링 프레임워크 핵심 기술
  • 자바
  • AWS
  • 크론탭
  • 딥러닝책
  • hot
  • 쿠버네티스
  • 파이참
  • 자바인강
  • linter
  • 디비
  • CKA
  • https://cupjoo.tistory.com/96
  • 마크다운
  • 유용한웹사이트
  • 패스트 캠퍼스
  • pycharm
  • 딥러닝
  • EC2
  • 환경세팅
  • 자바 인강이 듣고 싶다면 => https://bit.ly/3ilMbIO
  • 혁펜하임
  • 주피터노트북 설치
  • 자바 인강
  • 쉘스크립트
  • 패스트캠퍼스
  • 참고 링크
  • 자스계의백과사전
more
«   2025/05   »
일 월 화 수 목 금 토
1 2 3
4 5 6 7 8 9 10
11 12 13 14 15 16 17
18 19 20 21 22 23 24
25 26 27 28 29 30 31
글 보관함

성실한 노동과 공부, 주변 개발자들에 대한 믿음, 그리고 약간의 위트면 인생 다산거죠

티스토리툴바