llama
-
LoRA 기반 LLaMA 파인튜닝 실습 가이드기술과 산업/AI 2025. 5. 22. 13:06
이 글은 LoRA를 활용해 LLaMA 기반 언어 모델을 효율적으로 파인튜닝하는 실습 가이드입니다. Hugging Face peft 라이브러리를 중심으로 코드를 제공하며, 실전에서 바로 활용 가능한 구조로 구성했습니다. 실습 목표LLaMA 기반 모델에 LoRA를 적용텍스트 생성 태스크로 파인튜닝 진행peft 라이브러리를 이용한 구조적 학습 1단계. 환경 준비pip install transformers accelerate datasets peft bitsandbytes⚠️ bitsandbytes는 GPU 환경에서만 작동합니다. CPU-only 환경에서는 학습이 불가합니다. 2단계. 모델 및 토크나이저 로드from transformers import AutoTokenizer, AutoModelForCausal..
-
LLaMA 로컬 설치 가이드 – llama.cpp 기반 실습기술과 산업/AI 2025. 5. 12. 21:07
GPT API 없이 내 컴퓨터에서 직접 LLaMA 모델을 돌릴 수 있다면 어떨까요?최신 오픈소스 LLaMA를 로컬에서 초간단으로 실행할 수 있는 방법을 소개합니다.대표적인 도구가 바로 llama.cpp입니다.llama.cpp를 이용해 LLaMA 모델을 Mac, Windows, Linux에서 로컬 실행하는 방법을 코드 예제와 함께 소개합니다. 저사양 노트북에서도 AI 챗봇을 만들 수 있습니다. llama.cpp란?C++로 작성된 초경량 LLaMA 실행 엔진Mac, Linux, Windows 등 거의 모든 OS에서 실행 가능INT4, INT8 양자화를 지원해 저사양 노트북에서도 실행 가능실제 많은 개발자들이 16GB RAM 노트북에서 LLaMA 7B 모델을 돌리는 데 사용 중입니다.설치 준비1. Git 클론..
-
Hugging Face에서 LLaMA 실행하는 3가지 방법기술과 산업/AI 2025. 4. 15. 11:40
Hugging Face에서 LLaMA 실행하는 3가지 방법 – 코드 예제 포함LLaMA 모델을 Hugging Face에서 쉽게 실행하는 방법 3가지를 소개합니다.GPT 대신 로컬 또는 서버에서 오픈소스 LLM을 직접 실행하고 싶은 분들을 위한 실습형 가이드입니다.✳️ 글을 시작하며Meta AI의 LLaMA 3 시리즈는 Hugging Face Hub를 통해 바로 사용할 수 있도록 공개되어 있습니다.하지만 처음 접하는 사람에게는 실행 방식이 조금 어렵게 느껴질 수 있습니다.이 글에서는 다음 3가지 방법을 중심으로 가장 많이 사용되는 LLaMA 실행 방식을 정리합니다.✅ 사전 준비 사항Hugging Face 계정 생성 및 토큰 발급transformers, accelerate 패키지 설치모델 접근 권한 요청 (..
-
오픈소스 LLM 추천 TOP 5 – 성능, 비용, 목적별 비교기술과 산업/AI 2025. 4. 14. 08:30
GPT만큼 강력한 오픈소스 언어 모델, 어떤 걸 선택해야 할까?최신 LLM(Open Source Large Language Model) 중 성능, 가격, 활용성 기준으로 추천할 만한 TOP 5 모델을 소개합니다.개발자, 기획자, 기업용 챗봇 구축자 모두를 위한 정리입니다. 🔍 왜 오픈소스 LLM이 중요한가? GPT-4처럼 강력한 성능의 언어모델이 있지만, 비용과 API 의존성, 커스터마이징 제약이라는 한계가 있습니다.이에 대한 해답으로 떠오른 것이 바로 오픈소스 LLM입니다. 오픈모델은 다음과 같은 장점이 있습니다. • 무료 또는 저비용 사용 가능 • 로컬 또는 자체 서버에서 실행 가능 • 파인튜닝/경량화로 도메인 특화 가능 ✅ 오픈소스 LLM 추천 TOP 5 1. LLaMA 3.1 (Meta AI) ..
-
GPT-4와 LLaMA 3.1 성능 비교 분석 – 오픈소스 LLM의 반격이 시작됐다기술과 산업/언어 및 프레임워크 2025. 4. 13. 08:30
목차GPT-4 vs LLaMA 3.1 비교 개요파라미터, 토큰 길이, 모델 크기 비교벤치마크 성능 비교실제 활용 시 고려 요소 (비용/보안/로컬 실행 등)결론: 어떤 모델을 선택할까? GPT-4 vs LLaMA 3.1 비교 개요GPT-4는 OpenAI가 만든 프라이빗 상용 LLM이고, LLaMA 3.1은 Meta가 공개한 오픈소스 대형 언어 모델입니다.이제는 단순한 모델 성능이 아니라, 비용, 확장성, 커스터마이징 가능성까지 포함해 실전에서의 선택이 중요해졌습니다. 모델 스펙 비교항목GPT-4-turboLLaMA 3.1 (405B)파라미터 수비공개 (1.5T 추정)405B최대 컨텍스트 길이128K 이상128K멀티모달 지원지원 (Pro only)예정라이선스비공개 상용Meta 허가 기반 오픈사용 방식API ..
-
GPT만큼 강력한 오픈소스 AI? 지금 주목해야 할 LLaMA 모델 완전 정리기술과 산업/AI 2025. 4. 12. 23:55
메타가 만든 GPT 대항마, LLaMA 모델이란?Meta(구 Facebook)는 2023년부터 LLaMA(Large Language Model Meta AI) 시리즈를 통해 오픈소스 LLM 시장을 본격적으로 리드하기 시작했습니다.GPT 시리즈처럼 거대한 파라미터를 가진 Transformer 기반 모델로, 더 가볍고 빠르며 유연한 특징이 있습니다. 특히 LLaMA는 다음과 같은 측면에서 주목받고 있습니다.상업적 사용이 가능한 오픈소스 모델 (Apache 2.0, LLaMA 2부터 적용)GPT-4에 준하는 성능 (LLaMA 3.1은 405B 파라미터 모델 포함)128K 토큰 컨텍스트 길이로 장문 문서도 대응 가능Hugging Face, AWS, Azure 등에서 손쉽게 사용 가능LLaMA 모델 라인업 한눈에..
-
macOS에서 Ollama 사용하기기술과 산업/AI 2024. 9. 27. 18:25
아래 링크에 너무 잘 나와 있다. https://www.llama.com/docs/llama-everywhere/running-meta-llama-on-mac/ Running Meta Llama on Mac | Llama EverywhereFor this demo, we are using a Macbook Pro running Sonoma 14.4.1 with 64GB memory. Since we will be using Ollamap, this setup can also be used on other operating systems that are supported such as Linux or Windows using similar steps as the ones shown here.www.llam..