⚡스퀴즈비츠는...
로봇, 광고, 콘텐츠 등 다양한 도메인의 고객사 실무에서 AI를 효율적으로 활용할 수 있도록 지원합니다. 모델 경량화 뿐만 아니라 추론·서빙 프레임워크 레벨의 최적화 기술까지 제공하며, 여러 유형의 하드웨어 환경에서 최대 성능을 끌어내는 엔지니어링을 핵심 역량으로 삼고 있습니다.
🎯Framework SW Engineer로 함께하시면
실제 서비스 현장에서 발생하는 기술적 요구사항과 제약을 바탕으로 서빙 레벨의 다양한 최적화 기술을 직접 설계·구현 및 운영해 보실 수 있습니다. 또한 Disaggregated Inference, KV-cache offloading 등 최신 분산 추론 기술을 적용하고 검증하면서 해당 분야에 대한 깊은 이해도와 경험을 쌓으실 수 있습니다.
[채용 구분]
- 정규직 신입
- 정규직 경력
- 산업기능요원 (신규 편입 가능)
- 전문연구요원 (신규 편입 가능)
- 인턴 (4개월 이상)
[주요 업무] 합류하시면 주로 이런 일을 담당합니다
- NPU, GPU, CPU 등 다양한 가속기에서 동작하는 추론·서빙 프레임워크의 설계 및 구현
- LLM, 이미지 생성 모델 등 대규모 모델의 메모리 관리 및 연산 커널 최적화
- 하드웨어별 SDK 및 드라이버 특성을 반영한 상위 레벨 최적화 기술 개발
- Disaggregated Inference, KV-cache offloading, 모델 분할 등 분산 추론 파이프라인 설계·검증
- PyTorch, Transformers, Diffusers, Optimum, vLLM, TensorRT-LLM, SGLang, llm-d, ai-dynamo, lmcache, neural compressor, llm-compressor 등 다양한 오픈소스 프레임워크 적용 및 개선
💻 사용 언어 / 개발 환경
Python, PyTorch, C/C++, CUDA, Rust, etc.
[자격 사항] 이런 분을 찾고 있습니다
- 시스템/프레임워크 레벨의 소프트웨어 개발 경험 (C, C++, Python, Rust 등)을 보유하신 분
- 하드웨어 가속기(GPU/NPU 등) 특성 이해 및 성능 분석(프로파일링/트레이싱) 경험을 보유하신 분
- 팀원과의 원활한 커뮤니케이션이 가능하신 분
- 회사와 함께 성장하고자 하는 의지가 있으신 분
- 해외 여행에 결격 사유가 없는 분
[우대 사항] 이런 경험은 더 좋습니다
- ML 런타임/라이브러리(PyTorch 런타임, TensorRT 등)의 내부 동작 이해 또는 오픈소스 기여 경험을 보유하신 분
- 대규모 모델 추론 파이프라인 설계/운영 경험을 보유하신 분
- Multi-tenancy 환경에서의 SLO 기반 성능 관리 및 비용 최적화 경험을 보유하신 분
- 시스템 소프트웨어 개발 및 최적화 관련 분야 석/박사 학위를 보유하신 분
- 주요 업무 관련 경력 또는 개발 경험을 2년 이상 보유하신 분
- NCCL, NIXL, UCX 등 통신 라이브러리/프레임워크 활용 및 개발 경험을 보유하신 분
전형 절차
서류 접수 → 1차 직무 인터뷰 → 2차 Culture Fit 인터뷰 → 처우 협의 → 온보딩
- 서류는 자유 양식입니다. 지원 포지션 및 자격 요건에 얼마나 핏한지 마음껏 표현해주세요.
- 전형 결과는 접수일로부터 일주일 내외로 소요되며, 합격 여부와 상관 없이 접수해주신 이메일로 안내드립니다.
- 1차 직무 인터뷰는 온라인 진행, 2차 컬쳐핏 인터뷰는 대면 진행을 원칙으로 합니다. 상황에 따라, 1·2차 인터뷰를 모두 대면 또는 온라인으로 진행할 수 있습니다.
- 경력직의 경우 평판조회 절차가 추가될 수 있습니다.
참고 사항
- 본 공고는 모집 완료 시 마감됩니다.
- 정규직 채용의 경우 3개월의 수습기간을 운영합니다. 단, 수습기간 동안 대우에 차별을 두지 않습니다.
- 제출하신 서류가 사실과 다른 경우 합격(입사)이 취소될 수 있습니다.
- 채용 및 업무 수행과 관련하여 요구되는 법령 상 자격이 갖추어지지 않은 경우 채용이 제한될 수 있습니다.
- 채용 관련 문의사항은 메일로 문의 주시기 바랍니다. ([email protected])