Como criar um agente com LLM local de graça e sem depender de APIs
Neste post vamos rodar o modelo Qwen2.5 completamente offline em um Mac de uso pessoal, expô-lo como uma API OpenAI-compatible localmente e construir um agente com LangChain usando tools e saída estruturada sem gastar um centavo
<p>Nos últimos anos, o mundo dos modelos de linguagem de grande porte (LLMs) deixou de ser um território exclusivo das gigantes americanas. Uma leva de modelos open-weight de origem chinesa como o <a href="https://huggingface.co/Qwen">Qwen</a> (Alibaba), o <a href="https://huggingface.co/deepseek-ai">DeepSeek</a> e o <a href="https://huggingface.co/01-ai">Yi</a> chegaram com qualidade surpreendente e, mais importante, com pesos disponíveis publicamente. Li sobre alguns deles em <a…
